精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型推理無損加速6.5倍!EAGLE-3碾壓一切、延續Scaling Law能力

人工智能 新聞
近日,EAGLE 團隊的新作《EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test》通過一系列優化解鎖了投機采樣的 Scaling Law 能力,可以將大語言模型的推理速度提高 6.5 倍,同時不改變大語言模型的輸出分布,確保無損。

自回歸解碼已然成為大語言模型的推理標準。大語言模型每次前向計算需要訪問它全部的參數,但只能得到一個 token,導致其生成昂貴且緩慢。

近日,EAGLE 團隊的新作《EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test》通過一系列優化解鎖了投機采樣的 Scaling Law 能力,可以將大語言模型的推理速度提高 6.5 倍,同時不改變大語言模型的輸出分布,確保無損。同時,隨著訓練數據的增加,加速比還能進一步提高。

圖片

  • 論文標題:EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test
  • arXiv 地址:https://arxiv.org/abs/2503.01840
  • 項目地址:https://github.com/SafeAILab/EAGLE
  • SGLang 版本:https://github.com/sgl-project/sglang/pull/4247

EAGLE-3 的加速效果(DeepSeek-R1-Distill-LLaMA 8B 在數學推理數據集 GSM8K 上測試,其他模型在多輪對話數據集 MT-bench 上測試):

圖片

不同方法的生成速度對比:

背景

投機采樣使用一個小的模型快速生成草稿,一次生成多個 token。目標大語言模型通過一次前向計算并行驗證草稿的正確性,輸出正確的草稿,并確保無損。EAGLE 系列是投機采樣的最快實現。

EAGLE-1 在更有規律的特征層面而不是 token 層面進行自回歸,同時輸入采樣結果(超前一個時間步的 token)消除了不確定性,明顯提升了草稿模型的準確率。EAGLE-2 利用草稿模型的置信度近似接受率,據此動態地調整草稿樹的結構,進一步提升了投機采樣的效率。 

最新的大模型通過使用越來越多的訓練數據以取得更好的性能。比如說,對于 LLaMA 系列 7B(8B)大小的模型,LLaMA 1、LLaMA 2 和 LLaMA 3 分別使用了 1T、2T、15T token 訓練數據,模型結構和推理成本基本不變的前提下各項指標取得了明顯提升。

EAGLE-3 的作者們希望通過增加草稿模型的訓練數據量以提高接受率和加速比(藍色曲線)。遺憾的是, EAGLE-1 從訓練數據增加中得到的提升非常有限(紅色曲線)。

EAGLE-1 和 EAGLE-3 的加速比隨著訓練數據的增加而變化的趨勢:

圖片

動機

EAGLE 在特征層進行自回歸,再使用目標模型的分類頭得到草稿 token。這種方式利用了目標模型的中間結果和信息,相比 token 層自回歸有更好的性能。因為草稿模型的最終任務是預測草稿 token,EAGLE 的損失函數包括兩部分,一部分是特征預測損失,另一部分是 token 預測損失。特征預測損失也可以被認為是一種約束,限制了模型的表達能力。

EAGLE-3 的作者們進行了實驗驗證,觀察第一個草稿 token 的接受率 0-α,在數據集較小時,特征預測損失在訓練數據較少時可以提高性能,但嚴重損害了草稿模型的 scaling up 能力。

圖片不過,不使用特征預測損失會導致生成后續草稿 token 時的輸入偏離訓練分布,導致第二個草稿 token 的接受率 1-α 嚴重下降。為了解決這一問題,EAGLE-3 使用 “訓練時測試” 模擬多步生成,從而兼顧了模型的 scaling up 能力和生成多個草稿 token 的能力。

圖片

EAGLE、Medusa 等投機采樣方法都重用目標模型的最后一層特征作為草稿模型的提示,但 EAGLE-3 的作者們發現這存在缺陷。大語言模型的最后一層特征經過線性變換就能得到下一個 token 的分布。對于滿秩的分類頭,最后一層特征和下一個 token 的分布一一對應。最后一層特征只有下一個 token 的信息,失去了目標模型的全局性質。

因此,EAGLE-3 不再使用目標模型的最后一層特征作為輔助信息,而是混合目標模型的低層、中層、高層信息來作為草稿模型的輸入。

方法

與其他投機采樣方法一致,EAGLE-3 交替執行草稿階段和驗證階段。

草稿階段以下圖為例。在預填充或者上一個驗證階段,EAGLE-3 記錄模型的低、中、高層特征序列,分別記為 l、m 和 h,拼接 k 維向量 l、m 和 h 得到 3k 維向量,然后通過一個全連接層將其降維到 k 維,就得到融合了不同層級信息的特征 g,其中 k 為目標模型的隱藏層維度。目標是生成以 “How can I” 為前綴的草稿 token 序列,只輸入 g_how 和 g_can,草稿模型無法感知隨機的采樣過程。

因此 EAGLE-3 引入采樣結果 I 的詞向量嵌入 e_I。將 g 與對應的超前一個時間步的嵌入 e 拼接,即 g_how 與 e_can 拼接,g_can 和 e_I 拼接。將拼接后的向量通過全連接層降到 k 維,并將其輸入進一個單層的 transformer 得到 a。然后,將 a 輸入分類頭,采樣得到第一個草稿 token “do”。

在 step 1,以 “How can” 為前綴時,EAGLE-3 重用了來自目標模型的 g_how 和 g_can。

在 step 2,前綴是 “How can I”。理想的方式是重用來自目標模型的 g_how、g_can 和 g_I。但這是不可能的,因為 token “I” 還沒有被目標模型檢查,無法獲取 g_I。EAGLE-3 用上一個 step 草稿模型的輸出 a_I 替代 g_I,拼接 a_I 與采樣結果 “do” 的詞向量嵌入作為草稿模型 step2 的輸入。

在 step 3,同樣無法獲得 g_do,所以使用 a_do 代替,拼接 a_do 與 e_it 作為草稿模型的輸入。之后的 step 同理。

圖片

實驗

EAGLE-3 在多輪對話、代碼、數學推理、指令遵循、總結五項任務上分別使用 MT-bench、Humaneval、GSM8K、Alpaca、CNN/DM 數據集進行了實驗,并與 7 種先進的投機采樣方法(SpS、PLD、Medusa、Lookahead、Hydra、EAGLE、EAGLE-2)進行了比較。

該實驗分別在 Vicuna (V), LLaMA-Instruct 3.1 (L31), LLaMA-Instruct 3.3 (L33), DeepSeek-R1-Distill-LLaMA (DSL) 上進行。

圖片

表格中的 Speedup 為加速比,τ 為平均接受長度,也就是目標模型每次前向計算能生成的 token 數。EAGLE-3 每次前向計算能生成大約 4-7 個 token,而自回歸解碼每次生成 1 個 token,因此 EAGLE-3 明顯加速了大語言模型的生成,加速比為 3.1x-6.5x。

在所有任務和模型上,EAGLE-3 的加速比和平均接受長度都是最高的,明顯優于其他方法。

應用

EAGLE-3 發布第一天就被集成到 SGLang 中。在生產級框架中,EAGLE-3 也有數倍加速效果。以下實驗由 SGLang 團隊提供并以 LLaMA 3.1 8B(batch size=1, 1x H100)為例。

圖片

投機采樣往往被認為在大 batch size 下會降低吞吐量。但是在 SGLang 這一生產級框架下,EAGLE-3 在 batch size 為 64 時仍可以提高 38% 的吞吐量,而 EAGLE 在 batch size 為 24 時就導致吞吐量下降。這里 1.00x 以 SGLang (w/o speculative) 的吞吐量作為基準。以下實驗由 SGLang 團隊提供并以 LLaMA 3.1 8B(1x H100)為例。 

圖片

作者介紹

李堉暉:北京大學智能學院碩士,滑鐵盧大學訪問學者,受張弘揚老師和張超老師指導,研究方向為大模型加速和對齊。

魏芳蕓:微軟亞研院研究員,研究方向為具身智能、圖像生成和 AI agents。

張超:北京大學智能學院研究員,研究方向為計算機視覺和大模型加速。

張弘揚:滑鐵盧大學計算機學院、向量研究院助理教授,研究方向為大模型推理加速、AI 安全和世界模型。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-14 13:30:00

AI模型

2025-11-18 09:11:48

2025-03-27 09:47:23

訓練模型AI

2024-09-11 12:31:59

2024-07-19 09:59:31

2025-01-08 13:15:02

2024-12-10 07:00:00

大模型密度定律人工智能

2024-09-09 08:31:15

2023-05-23 14:06:53

微軟研究

2024-10-11 14:00:00

模型數據

2023-01-05 09:33:37

視覺模型訓練

2025-07-07 08:56:00

2025-04-08 00:40:00

谷歌合成數據大模型

2023-11-22 11:40:00

Meta模型

2024-01-24 13:11:00

AI模型

2024-11-11 17:35:11

2023-12-06 13:36:00

模型數據

2024-09-02 14:30:00

數據訓練

2024-08-29 14:05:00

數據模型

2025-11-20 10:25:07

點贊
收藏

51CTO技術棧公眾號

无套白嫩进入乌克兰美女| 精品久久蜜桃| 男女性高潮免费网站| 一区中文字幕| 色偷偷久久一区二区三区| 日韩国产美国| 超碰在线人人干| 欧美一级专区| 久久国产精品网站| 草草影院第一页| 91精品福利观看| 五月天一区二区三区| 视频在线精品一区| 亚洲精品人妻无码| 秋霞成人午夜伦在线观看| 欧美日韩成人免费| 一级特黄曰皮片视频| 日韩免费精品| 欧美日韩一区中文字幕| 欧美日韩黄色一级片| 久操视频在线免费播放| 久久亚区不卡日本| 97人人模人人爽人人喊38tv| 丁香六月婷婷综合| 中文字幕一区二区精品区| 亚洲人在线视频| 久久久久亚洲AV成人网人人小说| 成人性片免费| 色婷婷亚洲精品| 成年人午夜免费视频| 高清全集视频免费在线| 久久精品亚洲一区二区三区浴池| 国产精品青青草| 国产一区二区在线视频观看| 日韩精品成人一区二区在线| 午夜精品一区二区三区在线视| 紧身裙女教师波多野结衣| 欧美亚洲激情| 国产亚洲成av人片在线观看桃| 国产精品成人99一区无码| 免费观看性欧美大片无片| 欧美日韩国产免费| 九热视频在线观看| 国产精品亚洲d| 欧美日韩国产一区在线| 国产自产在线视频| 欧美巨大xxxx做受沙滩| 亚洲天堂2014| 免费在线精品视频| 成人日韩欧美| 亚洲激情在线播放| 国产尤物av一区二区三区| 黄黄的网站在线观看| 自拍视频在线观看一区二区| 亚洲午夜精品一区二区| 91caoporn在线| 国产精品九色蝌蚪自拍| 一本一道久久久a久久久精品91 | 国产精品白丝av| 成人性教育视频在线观看| 中文字幕人成人乱码亚洲电影| 日韩av一区二区三区四区| 欧美在线视频在线播放完整版免费观看| 五月天婷婷丁香| 亚洲另类自拍| 5278欧美一区二区三区| 国内精品福利视频| 日韩在线卡一卡二| 国产日韩精品电影| 99久久久国产精品无码免费| 国产高清一区日本| 国产日本一区二区三区| 四虎精品一区二区三区| 2022国产精品视频| 少妇特黄a一区二区三区| 免费av在线网址| 一区二区三区欧美| 国模吧无码一区二区三区| 人人视频精品| 欧美人与禽zozo性伦| 被黑人猛躁10次高潮视频| 久久精品国产亚洲5555| 国产亚洲精品久久久久动| 国产黄色小视频网站| 很黄很黄激情成人| 国产91在线播放九色快色| 国产老妇伦国产熟女老妇视频| 国产成人免费xxxxxxxx| 久久精品国产精品国产精品污| 日韩电影在线观看完整版| 亚洲欧洲另类国产综合| 免费看欧美一级片| 暖暖成人免费视频| 欧美日韩国产欧美日美国产精品| 无码人妻丰满熟妇区毛片蜜桃精品 | 亚洲国产日日夜夜| 动漫av免费观看| 免费一级欧美在线大片| 精品一区二区电影| 九九精品视频免费| 久久久久99| caoporen国产精品| 成年人视频在线免费观看| 亚洲影院理伦片| 国产精品久久久久9999小说| 视频国产精品| 中文字幕欧美精品在线 | 色的视频在线免费看| 午夜一区二区三区在线观看| 亚洲va综合va国产va中文| 欧美挤奶吃奶水xxxxx| 久久在线免费视频| 九九热最新视频| 成人av高清在线| 在线观看成人免费| 亚洲成人va| 日韩黄色在线免费观看| 超碰手机在线观看| 日本伊人色综合网| 精品日本一区二区三区| 污视频免费在线观看| 欧美日韩亚洲丝袜制服| 免费看黄色aaaaaa 片| 欧美午夜不卡| 91精品综合久久久久久五月天| 九一在线视频| 黑人巨大精品欧美一区二区一视频| 日本成人在线免费| 99精品国产一区二区三区| 日本91av在线播放| 全国男人的天堂网| 亚洲小说欧美激情另类| 日本特黄在线观看| 婷婷综合视频| 91精品国产综合久久香蕉922| 香蕉视频成人在线| 亚洲国产精品一区二区www | 国产亚洲精品网站| 久久亚洲黄色| 国语自产精品视频在免费| www.成人精品| 亚洲影视在线播放| 粗大的内捧猛烈进出视频| 中文字幕一区二区三三| 91传媒免费看| 污污视频在线看| 精品国产污污免费网站入口| 久草中文在线视频| 国产成a人无v码亚洲福利| 日韩亚洲欧美一区二区| 三级欧美日韩| 欧美激情精品久久久| 亚洲精品国产精品乱码不卡| 亚洲午夜日本在线观看| 精品人妻一区二区三区日产| 亚洲茄子视频| 欧美不卡在线一区二区三区| xx欧美xxx| 国产一区二区成人| 中文在线a天堂| 最新不卡av在线| 日韩精品xxx| 亚洲高清电影| 欧美大香线蕉线伊人久久国产精品 | 欧美成人直播| 91久久久久久国产精品| 日韩三级电影视频| 亚洲国产精品久久久| 久久亚洲天堂网| 国产欧美日韩在线看| 亚洲第一中文av| 91成人免费| 国产精品国产一区二区 | 色综合天天综合狠狠| 丁香花五月婷婷| 国产一区二区看久久| 久草视频国产在线| 女人丝袜激情亚洲| 91日韩在线播放| 爱看av在线入口| 亚洲视频在线视频| 国产精品欧美综合亚洲| 亚洲亚洲人成综合网络| 日本黄色小视频在线观看| 国产精品888| 国产美女三级视频| 99re66热这里只有精品8| 不卡一卡2卡3卡4卡精品在| 亚洲黄色网址| 久久五月天综合| 午夜在线视频观看| 欧美私模裸体表演在线观看| 九九热只有精品| 久久久亚洲精品一区二区三区 | 久久久亚洲国产美女国产盗摄| 亚洲美女爱爱视频| 日韩午夜av在线| 中文视频一区视频二区视频三区| 国产精品色呦| 国产欧美在线视频| 涩涩视频在线| 免费91在线视频| 都市激情一区| 日韩av在线网址| 国产999久久久| 欧洲在线/亚洲| 日韩字幕在线观看| 亚洲精品自拍动漫在线| 熟女高潮一区二区三区| 成人性生交大片免费看中文| 亚洲va综合va国产va中文| 美女国产一区| 国产av麻豆mag剧集| 亚洲精品电影| 亚洲一区尤物| 国产精品嫩草影院在线看| 国产精品大全| 国产美女亚洲精品7777| 国产精品日日摸夜夜添夜夜av| 色戒汤唯在线| 欧美精品第一页在线播放| 免费**毛片在线| 一道本无吗dⅴd在线播放一区| 少妇av在线播放| 欧美成人福利视频| 国产毛片毛片毛片毛片毛片| 欧美视频完全免费看| 亚洲免费在线视频观看| 午夜国产精品影院在线观看| 九九热精品免费视频| 亚洲欧美激情小说另类| 久久99久久99精品免费看小说| 国产欧美一区二区精品秋霞影院| 久久久无码人妻精品一区| 91麻豆精品在线观看| 亚洲精品无码一区二区| 国产91丝袜在线观看| 国产999免费视频| 国产美女在线观看一区| 欧美xxxxxbbbbb| 国产一区二区网址| 欧美日韩久久婷婷| 国产精品18久久久| 精品国产乱码久久久久夜深人妻| 国产成人在线视频网站| 人妻精油按摩bd高清中文字幕| 国产主播一区二区| 天天操精品视频| 国产精品一区不卡| 美女被爆操网站| 成人的网站免费观看| 中文字幕在线永久| 99re热这里只有精品免费视频| 污污污www精品国产网站| 91社区在线播放| 91成年人网站| 亚洲国产精品99久久久久久久久| 五月婷婷六月香| 亚洲欧美一区二区不卡| 日韩成人毛片视频| 亚洲精品成人悠悠色影视| 中文字幕第28页| 大荫蒂欧美视频另类xxxx| 亚洲s码欧洲m码国产av| 欧美伊人久久久久久久久影院| 91色在线播放| 日韩欧美激情四射| 五十路在线视频| 最近中文字幕2019免费| 成人在线免费看黄| 97视频免费在线观看| 欧美第一视频| 91精品视频在线看| 欧美偷窥清纯综合图区| 日本精品一区二区三区高清 久久| 日本久久综合| 日韩激情视频一区二区| 久久精品人人| 黄色三级视频在线播放| 99在线精品视频| 国产黄色录像视频| 一区二区久久久| 免费黄色av片| 日韩一区二区麻豆国产| 青青草手机在线| 久久国产视频网站| 成人av观看| 91亚洲国产成人久久精品网站| 日本成人7777| 麻豆md0077饥渴少妇| 国产日韩亚洲| 天天操狠狠操夜夜操| av午夜一区麻豆| 色偷偷男人天堂| 午夜精品福利一区二区三区av| 在线免费观看高清视频| 亚洲成人三级在线| 色大18成网站www在线观看| 国内精品久久久久久| 欧洲美女精品免费观看视频| 好吊色欧美一区二区三区四区| 日韩在线视屏| 看av免费毛片手机播放| 国产成人av电影在线观看| 久久久精品成人| 亚洲成人av资源| 国产乱码精品一区二区三区精东| 精品香蕉一区二区三区| 欧美日韩在线视频免费观看| 国产精品嫩草视频| 婷婷五月色综合香五月| www.avtt| 国产精品综合网| 亚洲毛片亚洲毛片亚洲毛片| 日韩欧美亚洲范冰冰与中字| 亚洲免费成人在线| 久久精品男人天堂| 欧美色999| 麻豆久久久av免费| 亚洲视频观看| av在线网站免费观看| 国产精品久久久久久久久快鸭 | 欧美mv日韩mv亚洲| 国产在线观看a| 国产欧美韩国高清| 精品久久不卡| 大香煮伊手机一区| 91蝌蚪porny九色| 国产91精品一区| 精品在线观看国产| av男人的天堂在线观看| 不卡一区二区三区视频| 午夜精品电影| 无码人妻丰满熟妇区毛片蜜桃精品 | 久久久久久久久久久久久久av| 亚洲第一页在线| av中文在线资源| 国产精品免费一区二区三区观看| 欧美视频在线观看| 亚洲国产精品第一页| 洋洋成人永久网站入口| 亚洲成人一二三区| 欧美极品美女电影一区| 51亚洲精品| 国产精品www在线观看| 成人一区在线看| 日韩精品久久久久久久| 亚洲国产欧美久久| 成人美女黄网站| 日韩av一级大片| 美女看a上一区| 性欧美videos| 欧美成人艳星乳罩| 6699嫩草久久久精品影院| 精品999在线观看| 国产手机视频一区二区| 亚洲av综合一区二区| 在线观看成人免费视频| 免费a级人成a大片在线观看| 亚洲综合国产精品| 亚洲午夜伦理| 伊人网在线视频观看| 欧美怡红院视频| 4438x成人网全国最大| 国产在线精品一区| 久久亚洲色图| 国产美女福利视频| 欧美第一区第二区| 超碰国产一区| 正在播放一区二区三区| 成人一区二区在线观看| 99久久精品国产亚洲| 在线丨暗呦小u女国产精品| 国产精品色婷婷在线观看| 日韩激情视频一区二区| 久久久电影一区二区三区| 亚洲视频在线观看免费视频| 久久久久久久亚洲精品| 久久不见久久见中文字幕免费 | 成人精品视频在线播放| 久久色中文字幕| 国产精品熟女久久久久久| 韩国视频理论视频久久| blacked蜜桃精品一区| 性一交一黄一片| 在线国产亚洲欧美| 中文字幕中文字幕在线十八区 | 国产精品伦子伦免费视频| 欧美国产先锋| 亚洲最大成人综合网| 日韩久久精品一区| 国产精品videossex撒尿| bt天堂新版中文在线地址| 国产喂奶挤奶一区二区三区| 亚洲av综合色区无码一二三区| 日韩av男人的天堂| 亚洲大片av| 成人黄色短视频| 日韩av中文字幕在线播放| 亚洲色图综合|