精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

PyTorch造大模型“加速包”,不到1000行代碼提速10倍!英偉達科學家:minGPT以來最好的教程式repo之一

人工智能 新聞
我們不把它看作是庫或者框架,更希望大家能把它當成個例子,根據自己的需求“復制粘貼”。

PyTorch團隊讓大模型推理速度加快了10倍

且只用了不到1000行的純原生PyTorch代碼

項目名為GPT-fast,加速效果觀感是這樣嬸兒的:

圖片

通暢,屬實通暢!

重點是,團隊直接放出了代碼以及詳細“教程”。還是簡筆畫版的那種,特別好理解。

開發團隊成員@Horace He表示:

我們不把它看作是庫或者框架,更希望大家能把它當成個例子,根據自己的需求“復制粘貼”。

圖片

網友直接炸開鍋,英偉達AI科學家Jim Fan評價道:

這是自Andrej Karpathy發布的minGPT以來最棒的教程式repo之一!

開源世界需要更多minGPT、GPT-Fast這樣的項目!

圖片

那么GPT-fast究竟是如何給大模型提速的?

開盒大模型“加速包”

總的來說,用到這幾種方法:

  • Torch.compile:一個專門為PyTorch模型設計的編譯器,可以提升模型運行效率。
  • GPU量化:通過減少計算的精度來加速模型的運算速度。
  • 推測性解碼:使用一個較小的模型來預測較大模型的輸出,以此加快大語言模型的運算。
  • 張量并行性:通過在多個硬件設備上分布模型的運算來加速處理速度。

下面我們來一一展開。

開發團隊一開始使用簡單的PyTorch來實現,但效果不佳(25.5 tok/s):

圖片

他們查看跟蹤后發現,一個原因是推理性能由于CPU過多占用而受限。

圖片

那么如何解決呢?

可以想象這樣一個場景,GPU是一個龐大的工廠(擁有大量可用的算力),而CPU則是一個小推車,來回為工廠“供貨”。

在很多情況下,CPU無法足夠快地“喂”GPU。

因此,開發團隊建議給GPU更多的工作量,或者說一次性給它更大“塊”的任務來處理。

圖片

在推理過程中要做到這一點,可以引入torch.compile

torch.compile能夠捕獲模型中更大的區域,并將其編譯成單一的編譯區域。特別是當以“reduce-overhead”模式運行時,它非常有效地減少了CPU的開銷。

效果立竿見影,性能直接提升了4倍,從25 tok/s提高到107 tok/s:

圖片

接下來,開發團隊想進一步提升速度,但遇到了內存帶寬瓶頸。

開發團隊計算了模型的帶寬利用率,結果已經達到了72%:

圖片

也就是說進一步提高速度的空間可能有限。

重新審視上面的方程式,團隊發現雖然實際上不能改變模型參數量,也不能改變GPU的內存帶寬(至少在不花更多錢的情況下),但可以改變存儲每個參數所用的字節數

圖片

這意味著,雖然無法改變模型的大小或者升級硬件來提高性能,但可以通過減少存儲模型參數所需的數據量來提高效率。

通常可以通過量化技術來實現,即減少表示每個參數所需的位數。

圖片

由此,開發團隊引入了下一個技術——int8量化

采用int8權重量化減少了內存負載,進一步提升了性能(157.4 tok/s):

圖片

使用量化后還有一個問題:要生成100個token,必須加載(或調用)模型權重100次。頻繁加載模型權重也會導致效率低下。

圖片

乍一看,好像沒有什么解決的法子,因為在自回歸生成模式中存在著嚴格的序列依賴關系。

但開發團隊指出,通過利用推測性解碼可以打破這種嚴格的序列依賴關系。

圖片

再來打個比方,想象有一個資深工程師Verity,他在技術決策上總是正確,但編寫代碼的速度相對較慢。

同時,還有一個初級工程師Drake,和Verity相反,不擅長技術決策,但編寫代碼的速度更快、成本也更低。

圖片

那么如何利用不同人的優勢來提高整體效率?

方法很簡單,先讓Drake編寫代碼,并在此過程中做出技術決策。接下來,將代碼交給Verity進行審查,不對的地方就讓Drake重做。

圖片

在Transformer模型推理中,大型的驗證模型即為Verity角色,Drake則是一個更小的、能更快生成文本的草稿模型。

開發團隊使用草稿模型生成8個token,然后使用驗證模型并行處理,丟棄不匹配的部分。

由此一來,打破了串行依賴,再次提高速度。

值得一提的是,推測性解碼不會改變輸出的質量。只要使用草稿模型生成token+驗證這些token所需的時間少于單獨生成這些token所需的時間,這種方法就是有效的。

而且使用原生PyTorch實現這種技術實際上非常簡單,整個實現過程只需要大約50行原生PyTorch代碼。

圖片

由于AMD也支持Triton和torch.compile后端,因此之前在Nvidia GPU上應用的所有優化也可以在AMD GPU上重新應用。

開發團隊觀察到int8量化的加速從22 tok/s達到102 tok/s:

圖片

之后開發團隊又用了int4量化,進一步提升速度,但模型準確性有所下降。

因此使用了分組量化和GPTQ降低權重大小。

圖片

最后在保證準確性的前提下,速度提升至202.1 tok/s:

圖片

將以上技術結合使用,達到更高速度244.7 tok/s:

圖片

到目前為止,研發團隊一直都是在單個GPU上提速。但其實很多情況下是可以使用多個GPU的。

而使用多個GPU可以增加內存帶寬,從而提高模型的整體性能。

圖片

在選擇并行處理策略時,需要在多個設備上分割一個token的處理過程,所以需要使用張量并行性。

而PyTorch也提供了用于張量并行性的底層工具,可以與torch.compile結合使用。

開發團隊還透露也正在開發用于表達張量并行性的更高級別的API。

然而,即使沒有更高級別的API,添加張量并行性也很容易,150行代碼即可實現,且不需要對模型進行任何改變。

圖片

之前提到的所有優化都可以與張量并行性相結合。將這些優化結合起來,能夠以55 tokens/s的速度為Llama-70B提供int8量化。

圖片

最后總結成果,忽略量化,僅用766行代碼(model.py 244行代碼,generate.py 371行代碼,tp.py 151行代碼),就實現了快速推理、推測性解碼和張量并行性。

對于Llama-7B,使用compile+int4量化+推測性解碼速度達到241 tok/s。對于Llama-70B,通過加入張量并行性,達到80 tok/s。

這些性能都接近或超越了當前SOTA。

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-12-11 15:40:32

PyTorch代碼大模型

2022-08-24 10:57:38

深度學習人工智能

2025-11-05 01:10:00

2023-07-26 14:00:47

模型研究

2017-08-04 15:53:10

大數據真偽數據科學家

2012-12-06 15:36:55

CIO

2016-05-11 10:36:16

數據科學家數據科學大數據

2017-01-23 16:00:25

數據科學家大數據數學家

2024-10-24 23:35:54

2023-11-15 13:19:14

2016-09-22 14:28:33

數據科學家算法

2019-11-29 18:03:27

數學R語言算法

2023-10-11 13:09:09

OpenAI模型GPT-4

2013-09-24 09:40:41

Java圖形加速

2025-06-23 09:04:00

2019-01-08 16:25:42

數據科學機器學習神經網絡

2024-09-14 09:31:00

2018-11-19 06:00:32

數據科學家數據科學

2018-03-27 11:02:55

2024-02-20 12:30:53

AI訓練
點贊
收藏

51CTO技術棧公眾號

一区二区三区91| 奇米四色…亚洲| 精品日韩在线一区| 欧美 日本 亚洲| 国产在线视频你懂得| 久久电影国产免费久久电影 | 国产999精品久久久| 欧美激情亚洲色图| 91大神精品| 在线这里只有精品| 国产成人生活片| 黄色片在线免费观看| 国产一区二区三区免费| 26uuu日韩精品一区二区| 日韩欧美在线视频播放| 1769国产精品视频| 欧美日韩精品一区二区三区四区| 免费在线黄网站| av在线二区| jlzzjlzz亚洲日本少妇| 成人免费高清完整版在线观看| 国产午夜精品无码一区二区| 久久伦理在线| 亚洲欧美三级伦理| 亚洲欧洲日韩综合| 日本成人福利| 黄网站色欧美视频| 99热这里只有精品免费| 成人免费黄色网页| 久久新电视剧免费观看| 国产精品入口免费| 国产视频在线一区| 蜜乳av一区二区三区| 欧美一级免费视频| 精品午夜福利在线观看| 99精品电影| 一道本无吗dⅴd在线播放一区| 国产日韩视频一区| 精品欧美视频| 911精品国产一区二区在线| 日韩精品视频一区二区在线观看| 99在线播放| 亚洲少妇30p| 亚洲综合av一区| 国产精品久久久久一区二区国产 | 欧美精品一区在线| 欧美视频在线观看一区二区三区| 国产乱码精品一区二区三区av | 成人午夜精品福利免费| 精品系列免费在线观看| 国产精品一区二区三区在线播放 | 免费观看特级毛片| 久久精品国产www456c0m| 亚洲香蕉成视频在线观看| 女尊高h男高潮呻吟| 久久中文资源| 亚洲精品国产suv| 亚洲成人av免费在线观看| 91精品国产自产在线丝袜啪| 欧美成人aa大片| 伊人久久一区二区三区| 精品女人视频| 日韩电影在线观看中文字幕| 超碰97人人干| 九九热线有精品视频99| 国产一区二区三区久久精品| gv天堂gv无码男同在线观看| 欧美好骚综合网| 久久久精品日本| 免费一级全黄少妇性色生活片| 欧美色图麻豆| 91精品国产91久久久| 日韩熟女精品一区二区三区| 国产精品久久久久久模特| 欧美综合一区第一页| 亚洲大尺度在线观看| 美女在线一区二区| 亚洲淫片在线视频| 亚洲免费不卡视频| 91伊人久久大香线蕉| 欧美日韩一区二区视频在线观看 | 999久久久久| 成人高清伦理免费影院在线观看| 国产欧美一区二区三区不卡高清| 五月婷婷六月色| 亚洲国产成人私人影院tom| 一区二区三区在线视频111| 黄页视频在线播放| 亚洲成人免费观看| 精品久久久久久久无码| 国产日韩欧美中文在线| 日韩av最新在线| 欧美日韩中文字幕视频| 亚洲小说区图片区| 国产精品亚洲片夜色在线| www.色日本| 国产欧美日韩麻豆91| 日韩精品免费一区| 日韩免费va| 精品久久免费看| 欧美黄色一级生活片| 午夜久久美女| 国产精品久久久久久一区二区 | 久久亚洲资源中文字| 日韩欧美中文字幕公布| 在线免费观看麻豆| 综合av在线| 国产精品视频免费在线观看| 欧美熟妇乱码在线一区 | 欧美毛片在线观看| 久久综合九色| 国产成人精品日本亚洲11| youjizz在线播放| 精品国产福利在线| 人妻巨大乳一二三区| 欧美精品一区二区久久| 狠狠做六月爱婷婷综合aⅴ | 2019中文字幕在线观看| 一级特黄aaa| 久久久蜜桃精品| 日韩成人手机在线| 日韩色性视频| 亚洲视频综合网| 国产精品9191| 国精产品一区一区三区mba桃花 | 在线欧美福利| 亚洲一区亚洲二区亚洲三区| 日本中文字幕伦在线观看| 欧美性生交xxxxxdddd| 稀缺呦国内精品呦| 你懂的网址国产 欧美| 国产免费久久av| 国产www.大片在线| 欧美性猛交xxxx免费看漫画| 黄色性视频网站| 欧美先锋影音| 成人xxxxx色| 在线播放免费av| 日韩三级视频在线观看| 永久免费看黄网站| 国产伦精品一区二区三区视频青涩 | 二区在线视频| 在线观看www91| 天天躁夜夜躁狠狠是什么心态| 亚洲中字黄色| 欧美久久久久久久| 唐人社导航福利精品| 日韩精品中文字幕久久臀| 日韩欧美大片在线观看| www.亚洲人| 久草资源站在线观看| 九九热爱视频精品视频| 国产精品白嫩美女在线观看| 青青青草原在线| 91久久免费观看| 性少妇xx生活| 国内精品久久久久影院色| 99精品一级欧美片免费播放| 国产一区二区三区免费观看在线| 超碰97人人做人人爱少妇| 99久久精品日本一区二区免费 | 亚洲欧美日韩图片| 亚洲中文一区二区| 国产精品污污网站在线观看| 中文字幕亚洲欧洲| 亚洲精品一二三区区别| 懂色一区二区三区av片| 高清视频在线观看三级| 亚洲精品视频免费在线观看| 手机在线看片1024| 国产精品国产三级国产普通话蜜臀 | 日韩成人av电影| 中文字幕精品国产| 国产精品毛片久久久久久久av| 亚洲精品菠萝久久久久久久| 99久久久无码国产精品性波多| 国产欧美日本| 亚洲欧美久久234| 日韩三级av高清片| 欧美性资源免费| 999在线视频| 日韩精品一区二区三区视频播放| 日本少妇激情视频| 国产亚洲精品bt天堂精选| 91亚洲免费视频| 亚洲二区精品| 亚洲精品一区二区毛豆| 亚洲精品一二三**| 国产精品第100页| 在线视频中文字幕第一页| 日韩av在线免费播放| 一区二区视频在线免费观看| 一区二区在线观看视频在线观看| 精品国产av色一区二区深夜久久| 日韩成人一级大片| 人妻激情另类乱人伦人妻| 一区二区美女| 999视频在线观看| 欧美色999| 久久久久久久影院| 日本高清在线观看wwwww色| 亚洲成人网在线观看| 中文在线免费看视频| 亚洲成人在线免费| 国产精品丝袜一区二区| 久久久久国产精品厨房| 性生交大片免费看l| 日韩电影免费在线看| 野外做受又硬又粗又大视频√| 色喇叭免费久久综合网| 久久久久久一区| 亚洲一区二区三区日本久久九| 国产精品wwwwww| 高潮在线视频| 91黄色在线视频| 亚洲国产精品久久一线不卡| 摸摸摸bbb毛毛毛片| 欧美激情久久久久久久| 视频精品二区| 秋霞一区二区三区| 欧美不卡视频一区| 国产又粗又猛又爽又| 一区二区免费视频| 久久精品色妇熟妇丰满人妻| 不卡电影免费在线播放一区| 天堂av手机在线| 免费在线成人网| www.四虎成人| 三级网站免费看| 亚洲福利免费| 免费看污污视频| 欧美日韩有码| 欧美裸体网站| 欧美激情99| 成人av播放| 黄色一级视频免费观看| 中文字幕免费不卡在线| 国产免费看av| 久久久久国产精品厨房| 一起草在线视频| 成人午夜精品在线| 久草免费资源站| 国产成人精品影院| 色婷婷狠狠18禁久久| 国产精品影音先锋| 亚洲一区二区三区三州| 国产真实乱子伦精品视频| 玖玖爱视频在线| 精品一区二区三区免费| 色婷婷一区二区三区在线观看| 麻豆精品新av中文字幕| 天天干天天玩天天操| 久久99精品国产麻豆婷婷| 亚洲一二三不卡| 成人综合婷婷国产精品久久蜜臀| 欧美一级片在线免费观看| 高清不卡一二三区| 妖精视频一区二区| 99国产精品国产精品久久| 男生裸体视频网站| xnxx国产精品| 538精品视频| 亚洲视频免费看| 国产一级性生活| 欧美视频13p| 中文字幕日韩国产| 91精品国产综合久久久久久久久久 | 亚洲地区一二三色| 九九热精品视频在线| 91久久精品网| 国产精品一区二区黑人巨大 | 久久久久久国产精品日本| 国产美女娇喘av呻吟久久| 91九色在线免费视频| 精品国产亚洲日本| 成人动漫在线视频| 亚洲自拍电影| 一区二区三视频| 在线观看亚洲| 男人舔女人下面高潮视频| 久久精品99久久久| 国产成人精品综合久久久久99 | 欧美日韩中文在线观看| 中文字幕91爱爱| 日韩欧美国产成人一区二区| 无套内谢的新婚少妇国语播放| 亚洲欧美中文日韩v在线观看| av大片在线观看| 色综合五月天导航| 久久毛片亚洲| 成人性生交大片免费观看嘿嘿视频| av成人男女| 视频三区二区一区| 国产尤物精品| 亚洲 欧美 日韩系列| 国产成a人亚洲| 男人的天堂官网| 亚洲一区二区三区四区不卡 | 88在线观看91蜜桃国自产| 欧美 日韩 国产 在线| 91黄色免费网站| 涩视频在线观看| 久久蜜臀精品av| 欧美在线视频第一页| 欧美日韩国产麻豆| 国产精品综合在线| 亚洲视频专区在线| 福利影院在线看| 7777精品久久久大香线蕉小说| 一级黄色a毛片| 日韩精品视频三区| 麻豆传媒在线免费看| 日产精品99久久久久久| 中文字幕日韩高清在线| 午夜欧美一区二区三区免费观看| 激情综合久久| 黄色小视频免费网站| 久久久精品免费网站| 日韩欧美三级在线观看| 91精品国产综合久久香蕉的特点 | 国产一区二区三区视频在线| 蜜桃成人在线| 99日韩精品| 亚洲欧美日韩色| 亚洲一区二区三区四区五区黄| 一卡二卡在线观看| 国产一区二区三区在线| 欧美调教sm| 久久99精品久久久久久久青青日本 | 国产欧美精品一区二区色综合朱莉| 九九九国产视频| 日韩免费高清av| а√天堂官网中文在线| 国产日韩欧美日韩| 久久美女视频| 午夜剧场在线免费观看| 国产精品污网站| 在线播放国产一区| 色阁综合伊人av| 欧美a一级片| 一区二区精品在线| 久久99精品国产.久久久久久| 天天色天天综合| 欧美高清性hdvideosex| 精品国产99久久久久久| 91久久国产精品91久久性色| 91精品国产调教在线观看| 亚洲一区二区三区观看| 亚洲人成精品久久久久久| 国产视频一区二区三| 九九热精品在线| jazzjazz国产精品久久| 精品少妇在线视频| 99re热这里只有精品视频| www.av麻豆| 亚洲天堂精品在线| 91在线成人| 精品91一区二区三区| 国产成人在线观看免费网站| 国产亚洲欧美精品久久久www| 欧美精品一区二区不卡| 日本在线高清| 色一情一乱一伦一区二区三欧美 | 无码国产精品一区二区免费式直播 | 一本一本a久久| 国产激情一区二区三区| 国产精品99精品无码视| 亚洲欧美中文另类| 亚洲成人高清| 欧美精品卡一卡二| 久久日一线二线三线suv| 精品乱码一区内射人妻无码| 久久精品视频在线观看| 粉嫩一区二区三区四区公司1| 国产av无码专区亚洲精品| 国产精品久久一级| 性猛交xxxx乱大交孕妇印度| 欧美亚洲第一页| 色乱码一区二区三区网站| 国产av一区二区三区传媒| 一本在线高清不卡dvd| av资源种子在线观看| 国产高清精品一区二区三区| 三级一区在线视频先锋| 日本黄色小说视频| 亚洲跨种族黑人xxx| 91精品网站在线观看| 免费网站永久免费观看| 久久久久久毛片| 精品毛片一区二区三区| 热久久99这里有精品| 中文无码久久精品| 亚洲AV无码国产成人久久| 91精品国产综合久久久久| 都市激情亚洲综合| 特级西西444| 欧美激情一区二区在线| 国精产品一品二品国精品69xx | 欧美激情免费观看| 精品一区二区三|