精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型生成提速2倍!單GPU幾小時搞定微調,北大數院校友共同一作丨開源

人工智能 新聞
這項新研究名叫Medusa(美杜莎),來自普林斯頓、UIUC、CMU和康涅狄格大學,FlashAttention作者Tri Dao也在其中。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

只需給大模型“加點小零件”,推理速度立刻提升2倍!

圖片

不需要額外訓練一個模型,也不需要對計算硬件做優化,單張A100最快幾小時就能微調完成。

這項新研究名叫Medusa(美杜莎),來自普林斯頓、UIUC、CMU和康涅狄格大學,FlashAttention作者Tri Dao也在其中。

圖片

目前,它已經成功部署到伯克利70億參數的“駱馬”Vicuna中,后續還會支持其他大模型,已經登上GitHub熱榜:

圖片

但其實,在這種方法推出之前,業界并非沒有大模型推理加速方法,主流的就是DeepMind推出的投機采樣(speculative decoding)

相比這種方法,Medusa有什么不一樣的地方?

投機采樣的2個“bug”

要想加速大模型推理,需要先知道究竟是什么“限制”了它的速度。

相比計算量的增加,大模型推理速度更容易受到內存帶寬的影響(memory bound)

這是因為,大模型由于參數量巨大、遠超緩存容量,因此推理時需要先把權重從外部內存(顯存)讀取一次到緩存中,這個過程受內存帶寬限制,速度通常很慢。

圖片

因此,模型做批量推理(batch inference)時,一次處理100個tokens和一個tokens時間上區別不大。

基于這個特點,DeepMind去年11月想出了一個名叫投機采樣的神奇操作——

訓練一個更小的模型(draft模型),給大模型提前生成一批“候選詞”,相比于讓大模型自己“思考”生成,直接做“選擇”就好。

圖片

由于小模型生成速度比大模型快好幾倍,一旦大模型覺得小模型已有的詞“可用”,就直接拿來,不用自己再緩慢生成一遍。

這個過程,有點像是輸入法的聯想詞候選,在我們(大模型)想好下一個詞用什么之前,輸入法(小模型)先給列出一些備選項:

要是看到覺得不錯,就從中選一個用;要是覺得生成的都不行,就pass掉自己重新打。

圖片

這種投機采樣方法確實取得了顯著成效,甚至能輕輕松松在M2 Ultra上以高精度跑340億參數LLaMA大模型。

圖片

BUT,這種方法存在兩個問題。

一方面,給大模型找個生成“候選詞”的draft小模型,沒那么容易。

這個小模型可不是隨便抓個生成模型就能用,除了接口統一、概率分布接近等要求,生成質量也不能比大模型差太多。

對于Meta發布的LLaMA這種模型可能還好,既有幾百億參數的大模型版本,又有幾十億參數的小模型版本,可以把參數量更小的版本拿來當draft模型使用。

但對于其他開源大模型,這種方法就不太適用了,自己去搭建訓練一個小模型,不僅時間成本更高,生成效果可能還不達預期。

另一方面,雙模型的組合,使得后續要想做系統調優變得更復雜

這是因為,相比于大模型自身是一個系統,新增加的draft模型相當于又引入了一個系統。

這樣會導致模型部署起來更復雜,包括額外的網絡傳輸、不同的硬件條件都需要考慮到,在做計算優化時難度也會進一步提升。

為了解決這些問題,Medusa出現了。

不用小模型,加幾個“頭”就行

Medusa(美杜莎,一種長有多個頭的妖怪)是一種新的大模型推理加速方法。

相比投機采樣,它選擇直接給Transformer大模型多加幾個解碼頭(decoding heads),每個頭都是一個單層前饋網絡。

圖片

這幾個多出來的解碼頭,可以讓大模型直接一次多生成幾個詞,而不是“擠牙膏式”一個一個生成。

生成準確率也還可以,在預測“下一個詞的下一個詞”時,Medusa準確率達到了60%,還在不斷優化中。

隨后,結合樹狀注意力機制(tree-based attention mechanism)并行驗證這些詞,從而實現推理加速。

圖片

基于Medusa,Vicuna的70億、130億和330億參數大模型推理速度,均有了1.9倍以上的效率提升:

圖片

針對70億參數的模型,研究者們還在不同任務上測試了一下加速效果,顯示最高在代碼生成上有2.15倍的速度提升。

圖片

最關鍵的是,用上Medusa后,并不需要將整個大模型重新訓練一遍。

相比之下,它可以和大模型一起訓練,只需要凍結大模型的參數就行,甚至單個GPU就能搞定。

由于不增加額外的模型,對于分布式推理也很友好。

作者介紹

這項研究有兩位共同一作。

共同一作蔡天樂,普林斯頓大學博士生,研究方向包括優化、表示學習、架構設計等,本科畢業于北京大學數學科學學院,獲得應用數學和計算機科學雙學位。

圖片

共同一作Yuhong (Jesse) Li,伊利諾伊大學香檳分校(UIUC)博士生,研究方向是高效機器學習,本科畢業于北京郵電大學。

圖片

此外,這項研究也有FlashAttention作者、斯坦福博士Tri Dao的參與。

FlashAttention是一種能加快注意力并減少內存占用的方法,相比PyTorch標準注意力實現,最高能提速9倍。

圖片

GitHub地址:https://github.com/FasterDecoding/Medusa

研究地址:https://sites.google.com/view/medusa-llm

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-07-17 09:21:12

Meta模型

2023-10-16 12:31:17

人工智能數據

2025-02-26 13:23:08

2021-11-19 10:13:01

模型人工智能計算

2023-04-13 13:24:38

OpenAI模型圖片

2023-06-30 13:01:26

2023-06-16 09:49:11

人工智能研究

2023-05-29 12:35:09

模型ChatGPT

2023-10-21 12:53:04

AI數據

2023-06-16 09:45:36

AI視頻

2023-11-16 15:58:00

訓練數據

2024-06-20 07:23:29

2023-10-04 19:52:33

模型論文

2024-04-23 13:37:00

數據訓練

2024-10-28 07:20:00

AI模型

2024-02-07 12:37:23

模型數據

2023-12-06 12:42:25

2023-05-30 14:17:00

模型推理

2021-09-13 09:49:37

開發方程函數

2025-09-12 09:03:00

點贊
收藏

51CTO技術棧公眾號

亚洲国产精品自拍| 久国产精品韩国三级视频| 亚洲激情自拍图| 国产在线青青草| 国产h在线观看| 国产乱淫av一区二区三区 | 亚洲精品欧美极品| 国产成人亚洲欧洲在线| 精品一级毛片| 日韩欧美国产精品一区| jizzjizzxxxx| av大大超碰在线| 久久久久青草大香线综合精品| 国产免费久久av| 日本在线小视频| 色呦哟—国产精品| 日韩电影大片中文字幕| 亚洲一级片av| 日韩欧美看国产| 一区二区三区**美女毛片| 欧洲亚洲一区| 国模无码一区二区三区| 六月丁香婷婷色狠狠久久| 久久久久久久久久亚洲| 日韩一区二区三区四区视频| 国产精品xxx在线观看| 欧美日韩免费视频| 国产最新免费视频| 2021国产在线| 一区在线中文字幕| 亚洲精品中文字幕在线 | 成人午夜免费视频| 国产日韩专区在线| 免费看污视频的网站| 亚洲精品黄色| 欧美老女人性生活| 国产精品视频一区二区在线观看| 西瓜成人精品人成网站| 精品国产一区二区三区不卡| 亚洲成人手机在线观看| 国产第一精品| 91黄色激情网站| 免费无码av片在线观看| 草美女在线观看| 伊人色综合久久天天| 色香蕉在线观看| 欧美日韩欧美| 最新国产成人在线观看| 自拍另类欧美| 麻豆视频网站在线观看| 国产精品天干天干在观线 | 一个色综合网| 久久精品中文字幕一区| www.99re6| 天天影视欧美综合在线观看| 色噜噜狠狠狠综合曰曰曰| 免费看污片的网站| 精品av一区二区| 伊人久久免费视频| 亚洲色图欧美色| 欧美电影一区| 久久精彩免费视频| 日韩精品一区二区亚洲av性色| 久久影视一区| 成年人精品视频| 欧美又粗又大又长| 国户精品久久久久久久久久久不卡| 欧美成人h版在线观看| 老妇女50岁三级| 激情五月***国产精品| 91av国产在线| 日本免费精品视频| 麻豆久久久久久| 亚洲影院色在线观看免费| 国产ts变态重口人妖hd| 成人免费视频视频在线观看免费| 国产伦精品一区二区三区免| 性xxxxbbbb| 91免费观看视频| 午夜老司机精品| 尤物在线网址| 欧美视频在线观看 亚洲欧| 毛片av在线播放| 黄色在线网站噜噜噜| 日韩欧美在线免费| 免费精品99久久国产综合精品应用| 国产麻豆精品| 亚洲精品按摩视频| 久久日免费视频| 欧美区国产区| 日本中文字幕不卡免费| 亚洲一级黄色大片| 成人一区在线看| 视频一区视频二区视频三区视频四区国产 | 日操夜操天天操| 日韩高清国产一区在线| 亚洲va欧美va国产综合久久| 色欲av伊人久久大香线蕉影院| 久久久精品天堂| 六月婷婷激情网| 成人黄色免费短视频| 日韩一区二区免费视频| 蜜桃精品一区二区| 综合激情一区| 日本一区二区三区四区视频| 99久久99久久久精品棕色圆| www久久精品| 少妇高潮大叫好爽喷水| 最新欧美电影| 精品国产一区二区亚洲人成毛片| 在线国产视频一区| 激情六月综合| 成人免费激情视频| 美国成人毛片| 亚洲一二三四在线| 亚洲一级片av| 欧美艳星介绍134位艳星| 久久久久久亚洲精品不卡| 91精品国产综合久| 91亚洲国产成人精品一区二区三| 日本特级黄色大片| 韩国精品主播一区二区在线观看| 欧美成人a∨高清免费观看| 久草福利资源在线| 丝袜亚洲另类丝袜在线| 国产精品传媒毛片三区| 成视频免费观看在线看| 在线观看成人免费视频| 少妇户外露出[11p]| 国产精品久久| 91亚洲精品在线| 一级毛片视频在线| 91久久精品一区二区三| 国产精品无码一区二区三区免费 | 亚洲自拍偷拍另类| 久久日韩粉嫩一区二区三区| 国产av熟女一区二区三区| 日日夜夜亚洲| 色噜噜狠狠狠综合曰曰曰| 这里只有精品免费视频| 久久夜色精品国产欧美乱极品| 亚洲精品无码国产| 视频在线亚洲| 欧美肥婆姓交大片| 国产高潮流白浆喷水视频| 成人欧美一区二区三区| 日韩成人精品视频在线观看| 成人久久电影| 国产精品欧美日韩久久| 成年人视频免费在线观看| 91电影在线观看| 少妇av片在线观看| 日韩av中文字幕一区二区| 欧美日韩在线播放一区二区| 国产综合色区在线观看| 亚洲无线码在线一区观看| 毛片在线免费播放| 中文字幕成人av| 亚洲小视频网站| 欧美一区综合| 国产精品国产三级欧美二区 | 午夜成人在线视频| 免费看毛片的网站| 一区二区91| 日产精品久久久一区二区| 久久久加勒比| 久久久精品在线| 成人午夜精品福利免费| 欧美日韩激情小视频| ass精品国模裸体欣赏pics| 麻豆九一精品爱看视频在线观看免费| 麻豆传媒一区| 成人亚洲视频| 欧美精品在线免费播放| 全国男人的天堂网| 日韩欧美亚洲范冰冰与中字| 女人裸体性做爰全过| 国产乱码精品1区2区3区| 日韩国产成人无码av毛片| 婷婷综合电影| 国产日韩精品一区二区| 新版中文在线官网| 精品性高朝久久久久久久| 中文字幕久久网| 一区二区久久久| 丰满少妇高潮一区二区| 久久精品国产99国产| 成人午夜精品久久久久久久蜜臀| 国产精品亚洲二区| 成人免费观看a| 色在线中文字幕| 日韩中文字幕网址| 日本精品一区二区在线观看| 欧美性猛交一区二区三区精品| 久久高清内射无套| www久久精品| 1314成人网| 爽好久久久欧美精品| 超碰在线免费观看97| 神马久久影院| 亚洲一区亚洲二区| 免费电影日韩网站| 欧美黑人巨大xxx极品| 国产精品秘入口| 精品国产伦理网| 91激情在线观看| 日韩欧美在线一区| 国产女人18水真多毛片18精品| 26uuu色噜噜精品一区二区| 亚洲国产欧美91| 日韩国产一区二| 极品美女扒开粉嫩小泬| 五月天综合网站| 日本不卡二区高清三区| 第一区第二区在线| 成人有码在线播放| 91在线成人| 欧美壮男野外gaytube| 欧美人与牲禽动交com | 亚洲小说区图片| 少妇高潮久久77777| 日韩大胆视频| 亚洲成成品网站| 97在线公开视频| 欧美系列日韩一区| 久久久久久久久久影院| 亚洲一区二区三区小说| 很污很黄的网站| 久久久久久久久免费| 99久久免费看精品国产一区| 国产成人免费高清| 中文字幕 欧美日韩| 秋霞成人午夜伦在线观看| 欧美 日韩 国产 高清| 亚洲国产片色| 日韩精品免费一区| 一区二区免费不卡在线| 神马影院我不卡| 精品国产乱码久久久久久蜜坠欲下 | 中文字幕日韩经典| 91成人免费电影| 亚洲精品中文字幕乱码三区91| 亚洲成av人综合在线观看| 久久免费少妇高潮99精品| 一区二区在线观看视频| 欧洲美女女同性互添| 自拍偷拍欧美激情| 中文字幕求饶的少妇| 国产精品理论在线观看| 麻豆视频免费在线播放| 国产精品国产三级国产有无不卡| av男人的天堂av| 欧美国产1区2区| 免费黄在线观看| 国产精品麻豆99久久久久久| 老司机福利在线观看| 国产精品人成在线观看免费| 99久久久无码国产精品不卡| 亚洲欧洲无码一区二区三区| 伊人久久久久久久久久久久久久| 中文字幕一区二区三区色视频| 任我爽在线视频| 亚洲最大成人网4388xx| 狠狠躁夜夜躁人人爽天天高潮| 天天综合日日夜夜精品| 老熟妇仑乱一区二区av| 欧美在线你懂得| 国产又黄又大又爽| 精品国产不卡一区二区三区| 天堂v在线观看| 亚洲视频在线免费观看| 秋霞午夜在线观看| 久久视频免费观看| heyzo高清国产精品| 欧洲亚洲女同hd| 色综合久久久| 成人av男人的天堂| 亚洲高清极品| 亚洲视频在线二区| 欧美午夜国产| 精品免费国产一区二区| 蓝色福利精品导航| 无码人妻丰满熟妇啪啪网站| 91在线精品一区二区| 人成免费在线视频| 一区二区成人在线| 看黄色一级大片| 日韩美女天天操| 神马电影在线观看| 日韩在线免费视频| 波多野结衣在线观看| 国产精品人成电影| 国产图片一区| 日本不卡一区二区三区视频| 中文字幕一区二区三区久久网站| 热99这里只有精品| 看片的网站亚洲| 奇米777第四色| 亚洲欧洲美洲综合色网| 日日夜夜综合网| 91麻豆精品91久久久久同性| 日本中文字幕电影在线观看| 久久九九有精品国产23| www.精品| 国偷自产av一区二区三区小尤奈| 日韩黄色大片| 久久婷婷五月综合色国产香蕉| 激情伊人五月天久久综合| 偷拍女澡堂一区二区三区| 亚洲精品免费播放| 亚洲怡红院av| 亚洲偷欧美偷国内偷| av岛国在线| 91在线精品观看| 久久精品国产www456c0m| 看av免费毛片手机播放| 成人性视频网站| 日韩精品一区二区亚洲av性色| 欧美性极品xxxx做受| 亚洲国产www| 久久综合色88| 欧美视频第一| 日本一区二区三区视频在线播放 | 国产一区二区三区四区大秀| 精品一二三四五区| 国产精品亚洲一区二区三区妖精| 国产传媒在线看| 在线一区二区三区四区| 婷婷丁香一区二区三区| 久久久久久尹人网香蕉| 麻豆国产精品| 女女同性女同一区二区三区按摩| 日韩精品福利网| 国产又粗又猛又爽视频| 精品国产乱码久久久久久天美| 动漫av一区二区三区| 欧美男插女视频| 亚洲一区二区三区日本久久九| 国产又爽又黄ai换脸| 久久国产精品一区二区| 欧美人与禽zoz0善交| 欧美日韩一二区| avtt亚洲| 成人福利网站在线观看11| 91麻豆国产自产在线观看亚洲| 亚洲精品怡红院| 中文字幕欧美激情| 中文字幕一区2区3区| 中文字幕在线看视频国产欧美| 日本一道高清亚洲日美韩| 日韩精品一线二线三线| 奇米在线7777在线精品| 91社区视频在线观看| 欧美猛男超大videosgay| 秋霞午夜理伦电影在线观看| 91视频九色网站| 国产精品av一区二区| 中文字幕人妻一区| 午夜精品福利久久久| 久久久pmvav| 国产精品久久久久久亚洲调教| 欧美亚洲国产精品久久| 91国内在线播放| 亚洲影院在线观看| 日本黄视频在线观看| 国产91在线视频| 清纯唯美日韩| 在线一区二区不卡| 亚洲一级片在线观看| 日本aaa在线观看| 国产精品永久免费观看| 欧美黄色aaaa| 2一3sex性hd| 在线看日本不卡| 国产黄a三级三级三级av在线看| 成人在线免费观看一区| 久久av一区| 日本精品在线免费观看| 精品国产自在久精品国产| 成人av观看| 7777在线视频| 91视视频在线观看入口直接观看www | 91嫩草在线视频| 日韩一区二区久久| 精品一区二区三区蜜桃在线| 日韩一区二区麻豆国产| 神马久久午夜| 超碰97免费观看| 久久久不卡影院| 性猛交富婆╳xxx乱大交天津| 69久久夜色精品国产7777| 日韩在线观看| 妖精视频一区二区| 欧美色网一区二区| 999av小视频在线| 在线观看欧美一区| 99久久99久久免费精品蜜臀| 亚洲一区二区色| 91精品国产777在线观看| 亚洲91精品|