精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

五倍推理加速,激發自回歸潛能,蘋果新工作讓LLM預測未來

人工智能 新聞
在大模型推理階段,能否讓大模型擺脫單個 token 順序預測的瓶頸,也和人類的邏輯一樣,從更大層面考慮輸出內容呢?

近年來,語言模型的顯著進展主要得益于大規模文本數據的可獲得性以及自回歸訓練方法的有效性。

在這種自回歸的訓練框架中,每一個 token 都作為其前文上下文的預測目標。

這一方法無需顯式標注,使得自回歸模型在訓練階段具有明顯優勢,因而成為主流范式。

然而,在推理階段,自回歸生成本質上是順序執行的,計算開銷大,因為每一步解碼都需要完整地運行一次模型。相比之下,人類在表達時常常會先在句子層面組織思路,再逐詞輸出。

那么在大模型推理階段,能否讓大模型擺脫單個 token 順序預測的瓶頸,也和人類的邏輯一樣,從更大層面考慮輸出內容呢?

假如能夠打破自回歸模型的順序執行本質,就產生了如網友所說的「具有時間跳躍能力的 LLM」。

image.png

受到啟發,蘋果的研究人員為此展開思考,借助類似策略,開發了一個框架,使預訓練的自回歸大型語言模型能夠執行多 token 預測,在保持生成質量的同時,為代碼和數學任務提供高達 5.35 倍的推理加速,以及為一般任務提供約 2.5 倍的推理加速。

AI 工程師 Jackson Atkins 認為這是一項具有開創性的工作,「最令人興奮的是這一切都可以通過對現有模型進行 LoRA 微調實現」。

image.png

想象一下,將 AI 運行成本削減數倍,或是在輕量設備上流暢運行強大的實時助手,這對推理優化而言是一次顛覆性的變革。

如果你手中有一個運行速度提升 5 倍的大語言模型,第一件事會做什么?

image.png

  • 論文標題:Your LLM Knows the Future: Uncovering Its Multi-Token Prediction Potential
  • 論文鏈接:https://www.alphaxiv.org/abs/2507.11851

首先探討一個基本問題:語言模型能否在單個推理步驟中生成多個 token?

令人鼓舞的是,答案是肯定的。

現有的推測解碼研究已經探索了這個方向以加快生成速度。推測解碼方法利用一個草稿模型生成多個 token,然后通過一個驗證器檢查它們與標準自回歸輸出的一致性。雖然這種方法提供了加速,但它仍然根本上依賴于自回歸生成。

在這項工作中,研究者們提出了一個更深層次的問題:我們能否訓練真正非自回歸的語言模型?

研究者們通過設計完全非自回歸的訓練算法來探討這一問題,例如基于擴散機制的語言模型。然而,此類方法通常需要構建全新的建模與訓練流程。

于是研究者們進一步提出一個問題:是否可以在盡可能少改動的前提下,適配現有的自回歸訓練與推理框架?目標是實現在保留自回歸模型核心優勢的同時,實現高效的多 token 生成。

為進一步論證這一點,研究者們首先觀察到,自回歸模型雖然并未明確針對未來 token 進行訓練,但實際上已經在一定程度上編碼了關于未來 token 的信息。

例如,給定提示詞 “what is two plus two?”,一個預訓練模型在標準自回歸解碼過程中通常會生成 “two plus two equals four”。為了檢驗模型是否具備對未來 token 的感知能力,研究者們在提示后添加占位 token(圖中以 ? 表示),并分析輸出的 logits,如圖 1 (左)所示。

令人驚訝的是,未來 token 的正確序列出現在前 200 個 logits 中,說明模型在某種程度上已隱含地掌握了即將生成的 token 信息。

image.png

圖 1:自回歸模型能夠隱式預判未來的 token。

基于上述觀察,研究者們進一步探究能否引導模型發揮其潛在能力,從而更好地組織對未來 token 的預測。

為此,研究者在提示詞末尾引入若干 mask token,并對模型進行訓練,使其能夠直接預測這些 token。如圖 1 (中)所示,經過微調后的模型能夠將正確的 token 提升至前 10 個 logits 中。

最后,為生成連貫的多 token 輸出,研究者們引入了一個輕量級的采樣模塊:一個兩層感知機(two-layer perceptron),該模塊在預測每個 token 時,結合先前已采樣出的 token 作為條件,具體結構如圖 1 (右)所示。

與之前的一些方法不同,本文訓練模型填充 mask token,以預測未來 token。該模型在推理這些 token 時,充分利用了自身的全部深度與表示能力,并結合整個序列的上下文信息,從而在效果上顯著優于現有的多 token 預測方法。

此外,得益于一種簡單而有效的技術 —— 門控 LoRA 適配(gated LoRA adaptation),本方法在生成質量上無任何下降。

在較為輕量的監督微調下,研究者們相較于傳統回溯式生成模型實現了加速效果。如圖 2 所示,在 Tulu3-8B 模型基礎上微調以預測 8 個額外 token,即可獲得顯著性能提升。

image.png

圖 2:在通過監督微調訓練門控 LoRA 和采樣頭后獲得的加速效果。

方法

為在盡量減少重新訓練的前提下實現多 token 生成,引入了一類特殊的 token,稱為 mask。設原始序列為 X = [x1, …, xn],基本思路是在該序列末尾附加 k 個唯一的 mask token,從而構造出擴展序列 Xm = [x1, …, xn, m1, …, mk]。其中,mask token [m1, …, mk] 的表示向量被初始化為隨機向量,并添加至模型的嵌入表中。

在本文中,將模型對標準下一個 token 的預測稱為 NTP(Next Token Prediction),而對 mask token 的預測稱為 MTP(Mask Token Prediction)。

本文所提出的 MTP 模型的整體架構如圖 3 所示,其中展示了在微調時使用 k=2 個 mask 的模型在推理階段的工作流程。在圖中 box-1(左上角),擴展后的序列 Xm 被輸入至解碼器,模型生成的潛在表示中,[z1, …, zn] 對應于 NTP token 的表示,而 [zn+1, …, zn+k] 則對應于 MTP token 的表示。

image.png

圖 3:MTP 模型的組成部分。框 1(左上)顯示了帶有門控 LoRA 參數的自回歸模型。框 2(左下)說明了采樣頭。框 3(右)展示了門控 LoRA 模塊的框圖。

圖中 框 2(左下)展示了采樣器頭(sampler head)的結構。第一個(NTP)token 通過標準的反嵌入層(unembedding layer)以自回歸方式生成,即由 z_n 預測出 y_n+1。而剩余的(MTP)token 則由采樣器模塊依次生成。在每一步中,采樣器根據 z_n+k+1 與前一個已生成的 token y_n+k 來預測 y_n+1+k,確保每個生成的 token 同時融合模型的潛在表示與先前已采樣的 token 信息。

為了在微調時保留預訓練模型的行為,研究者們在解碼器層中引入了門控 LoRA 模塊(gated LoRA)。微調過程中,僅更新 LoRA 參數與采樣器頭參數,原始解碼器權重保持凍結狀態。門控 LoRA 模塊通過對 NTP 與 MTP token 分別采取不同的計算路徑,確保微調過程不會影響 NTP token 的生成行為,如圖中 框 3(右側)所示。該差異通過引入二進制 mask 實現,二進制 mask 被作為額外輸入傳入解碼器層。

詳細的模型訓練過程請參閱原論文。

實驗

研究者們在 Tulu3-8B SFT 模型上開展了實驗。該模型屬于 LLaMA-3 系列,并基于 Tulu3 數據集進行了有監督微調。

生成質量評估

研究者們首先在微調過程中跟蹤了模型的準確率變化。由于所用模型為 SFT 模型,其對額外訓練非常敏感。圖 6 (a) 展示了模型在 ARC-Challenge 基準上的 zero-shot 準確率,該評估通過 Harness 庫完成。

如圖 6 (a) 中的虛線所示,gated LoRA 能夠保持準確率穩定,原因在于其保證了 NTP token 的輸出不會受到微調影響。

如圖 6 (b) 中所示,在標準 LoRA 與 gated LoRA 兩種訓練方式都實現了有效的收斂。

接下來,研究者們在圖 6 (c) 中分析了 NTP token 上的交叉熵損失,該指標與生成質量直接相關。如圖所示,使用標準 LoRA 訓練的模型,其 NTP 損失呈上升趨勢,表明生成質量逐漸下降。相比之下,采用 gated LoRA 的模型在整個訓練過程中保持了幾乎恒定的 NTP 損失,這是因為在 gated LoRA 機制下,梯度不會在 NTP token 上傳播,從而有效避免了對原始生成能力的干擾。

image.png

圖 6:使用標準 LoRA 和門控 LoRA 適配器訓練的模型收斂性分析。

加速能力分析

為了評估所提方法在生成速度上的提升,研究者們采用了自推測解碼算法(self-speculative decoding)。

實驗最多運行 100 個生成步驟,若模型在第 100 步之前生成了句子結束符(end-of-sentence token),則提前終止生成過程。設總生成步驟數為 T,總生成 token 數為 G,則計算接受率(acceptance rate)為 G/T。該指標反映了模型平均每一步生成多少個被接受的 token,進而衡量所提方法帶來的加速效果。

接受率的理論最小值為 1,因為每一步至少會生成一個 token(即標準的下一個 token 預測)。最大理論值為 k+1=9,其中 k=8 是訓練時使用的 mask token 數量。

表 1 報告了模型在五個不同任務領域下的接受率,包括:知識問答、數學、編程、對話和安全。

如表所示,所提出的多 token 生成算法在不同任務上實現了約 1.5 到 5.2 倍不等的加速,具體取決于任務類型及插入的 mask 數量。值得注意的是,在編程和數學任務中,加速效果更為顯著,可能是因為這些領域中未來 token 的可預測性較高。

image.png

表 1:Tulu-3 在不同領域中通過多標記預測獲得的加速。

消融實驗

表 1 中的結果對應于本方法的最優配置,包含以下三個關鍵組件:

(1)使用采樣器 MLP 頭(sampler MLP head);

(2)訓練過程中引入 LCM 損失(LCM loss);

(3)生成階段采用二次解碼算法(quadratic decoding algorithm)。

研究者們對各個組件的貢獻進行了消融實驗。

image.png

圖 7: MTP 模型的簡單配置和最先進配置所達到的平均加速效果。基礎版本使用線性解碼,不包含 LCM 損失或采樣頭,而高級版本則包含 LCM 損失、采樣頭和二次解碼。

研究者們訓練了多個不同 LoRA 秩的模型,以進一步探索其影響。圖 8 總結了相關結果:左側與中間子圖分別展示了在未使用與使用采樣器頭的條件下的接受率;右側子圖則展示了采樣器頭與 LoRA 參數所帶來的顯存開銷。

image.png

圖 8:LoRA 秩的影響:無采樣頭加速(左),帶采樣頭加速(中),以及 LoRA 和采樣頭的內存開銷(右)。

總結

研究者們評估了自回歸模型在語言模型有監督微調階段對多 token 預測任務的適應能力。未來值得探索的一個方向,是在預訓練階段或下游任務自適應階段引入該方法,以進一步檢驗其適用性與效果。另一個具有前景的研究方向是將基于擴散的生成方法應用于多 token 預測任務。研究者們認為,多 token 預測位于完全自回歸生成與完全擴散生成之間,能夠在兩者之間取得優勢的平衡,兼具效率與質量的潛力。

更多信息,請參閱原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-23 14:06:53

微軟研究

2025-10-21 08:54:00

微軟LLM模型

2023-09-01 15:22:49

人工智能數據

2010-03-31 09:39:17

Ubuntu Linu

2024-09-09 08:31:15

2018-04-27 14:01:30

信息

2011-09-08 11:07:25

Ubuntu藍牙

2024-12-05 13:50:00

AI大模型

2023-09-12 14:45:18

2025-05-28 08:51:00

大模型華為LLM

2020-07-28 16:37:01

華為丁耘網絡

2022-04-01 10:57:20

Qlik數據素養智能化

2009-06-23 08:50:13

喬布斯回歸

2020-07-31 16:13:21

新基建華為智能IP網絡

2010-01-19 09:44:55

戴爾高效企業

2014-01-15 10:06:43

云計算

2023-06-21 13:20:14

系統模型

2025-05-27 15:28:11

模型訓練AI

2023-11-30 18:25:57

數據訓練
點贊
收藏

51CTO技術棧公眾號

91精品久久久久久| 亚洲成人亚洲激情| 天堂v在线视频| 91激情在线观看| 欧美一区高清| 精品日本一线二线三线不卡| 成年女人18级毛片毛片免费| 青青草视频免费在线观看| 日韩成人免费在线| 欧美超级乱淫片喷水| 国产精品久久久久久亚洲色| 日韩精品影片| 一区二区三区中文在线观看| 久久精品女人的天堂av| 在线视频1卡二卡三卡| 欧美久色视频| 亚洲视频电影图片偷拍一区| 在线观看日本www| 大桥未久在线播放| 国产精品麻豆一区二区| 国产视频99| 一本一道人人妻人人妻αv| 国语对白精品一区二区| 国产一区二区三区在线| 国产综合内射日韩久| 制服诱惑亚洲| 午夜天堂影视香蕉久久| 亚洲一区二区精品在线观看| 日韩在线一区二区三区四区| 久久se精品一区二区| 91精品国产99久久久久久| 亚洲欧美另类日本| 最新亚洲精品| 精品三级在线观看| 午夜激情视频网| 小明成人免费视频一区| 污片在线观看一区二区| 国产日韩第一页| www.亚洲资源| 久久综合一区二区| 国产成人免费观看| 一级黄色a视频| 老司机午夜精品视频在线观看| 欧美日韩高清在线观看| 很污很黄的网站| 亚洲日本三级| 日韩毛片在线观看| 第一页在线视频| 国产色99精品9i| 欧美三级日本三级少妇99| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 色屁屁www国产馆在线观看| 中文字幕人成不卡一区| 亚洲精品自在在线观看| 国产二区在线播放| 国产日韩欧美电影| 欧洲一区二区在线| 黄色av免费在线看| 国产亚洲综合av| 久久久亚洲综合网站| 黄片毛片在线看| 国产成人av一区二区三区在线| 91精品视频在线看| 国产精品久久影视| 久久99热国产| 成人国产精品一区| 国产精品老熟女视频一区二区| 蜜臀久久99精品久久久久宅男| 日产精品久久久一区二区福利 | 国产肉丝袜一区二区| 狼狼综合久久久久综合网| 日韩私人影院| 国产丝袜欧美中文另类| 性欧美.com| 美女免费久久| 亚洲综合精品久久| 人妻av中文系列| 三妻四妾的电影电视剧在线观看 | 国产黄色激情视频| 51精品在线| 丁香五六月婷婷久久激情| 久久久久久久久久久福利| 欧美成人h版| 欧美三区在线视频| 国内精品国产三级国产aⅴ久| 亚洲国产精品免费视频| 精品国产123| 亚洲成人日韩在线| 成人三级视频| 欧美老女人性视频| 国产99久久久| 老色鬼精品视频在线观看播放| 91精品久久久久久久久不口人| av加勒比在线| 91在线观看一区二区| 四虎影视永久免费在线观看一区二区三区| 亚洲乱亚洲乱妇| 亚洲综合激情小说| 老头吃奶性行交视频| 久久日本片精品aaaaa国产| 日韩美一区二区三区| 亚洲av成人片色在线观看高潮| 国产一区二区三区电影在线观看| 最近免费中文字幕视频2019| www色aa色aawww| 亚洲国产婷婷| 91精品国产自产在线| 日本高清视频www| 欧美激情在线一区二区| 欧美狂野激情性xxxx在线观| 欧美xxx性| 欧美sm美女调教| 亚洲а∨天堂久久精品2021| 亚洲在线久久| 国产精品99一区| 后入内射欧美99二区视频| 国产精品女同一区二区三区| 无码专区aaaaaa免费视频| 日韩黄色三级在线观看| 精品中文字幕久久久久久| 日韩福利小视频| 久久精品综合| 国产 高清 精品 在线 a| 国产视频第一页在线观看| 一个色综合av| 成年网站免费在线观看| 免费观看久久av| 欧美精品久久久久久久| 一道本无吗一区| 国产拍揄自揄精品视频麻豆| 极品美女扒开粉嫩小泬| 亚洲图色一区二区三区| 色七七影院综合| 在线视频一区二区三区四区| 高清成人免费视频| 五月天在线免费视频| 精品国产黄a∨片高清在线| 日韩麻豆第一页| 精品久久免费视频| 国产精品一区二区视频| 亚洲制服中文| 国产私拍福利精品视频二区| 日韩国产精品视频| 国产精品suv一区二区69| 国产综合成人久久大片91| 亚洲一二三区精品| 久久国内精品| 神马久久久久久| 久草热在线观看| 国产婷婷一区二区| 黄色片久久久久| 亚洲天堂日韩在线| 欧美一级在线播放| 男男激情在线| 一本大道久久精品懂色aⅴ| 中文字幕在线播放视频| 亚洲啪啪91| 久99久在线| 中文字幕高清在线播放| 国产丝袜视频一区| 国产伦精品一区二区三区视频我| 91视频观看视频| 精品中文字幕av| 亚洲人成精品久久久| 国产成人黄色av| av资源在线观看免费高清| 欧美在线一二三四区| 日本一道本视频| 精品中文字幕一区二区小辣椒| 亚洲色图自拍| 亚洲综合资源| 欧美高清视频在线观看| 粉嫩av一区二区夜夜嗨| 同产精品九九九| 30一40一50老女人毛片| 久久午夜影视| 综合国产精品久久久| 精品亚洲二区| 国内久久久精品| 你懂的在线视频| 欧美日韩三级在线| 免费毛片在线播放免费| av成人动漫在线观看| 日本精品www| 97色伦图片97综合影院| 99r国产精品视频| 一本大道色婷婷在线| 在线日韩精品视频| 国产高清视频免费观看| 精品久久久久久久久久国产 | 国产精品久久免费看| 日本女人黄色片| 午夜综合激情| 中文字幕日韩精品一区二区| 成人精品毛片| 国产精品第二页| 欧美性爽视频| 国产亚洲精品久久久久久| 国产91视频在线| 色狠狠综合天天综合综合| 欧洲美女女同性互添| 99这里都是精品| 奇米一区二区三区av| 欧美偷拍视频| 国产日产一区 | 日韩www.| 国产精品亚洲一区| 国产精品黄色片| 欧美精品videos| 成年网站在线| 亚洲国产欧美一区二区三区同亚洲| 波多野结衣电影在线播放| 亚洲精品一二三区| 亚洲av熟女国产一区二区性色| 高清av一区二区| 国产精品自拍视频在线| 国产一区91| 日韩a级黄色片| 日韩精品水蜜桃| 九九九九九精品| 久久精品一级| 国产精品视频999| 亚洲一级少妇| 久久免费国产视频| 制服丝袜中文字幕在线| 中文字幕日韩欧美在线视频| 人妻少妇精品无码专区| 欧美一区二区免费观在线| 樱花视频在线免费观看| 欧美日韩精品在线播放| 99视频只有精品| 中文字幕一区二区三区四区不卡| 97伦伦午夜电影理伦片| 国产精品456| 国产乱女淫av麻豆国产| 青青草精品视频| 91av俱乐部| 首页欧美精品中文字幕| 欧美 国产 综合| 亚洲三级网站| 亚洲色成人www永久在线观看| 911久久香蕉国产线看观看| 亚洲欧洲一区二区| 人人狠狠综合久久亚洲婷| 日本不卡一区| 精品福利久久久| 日本一区高清在线视频| 久操国产精品| 日本午夜一区二区三区| 国产精品视频一区二区三区四蜜臂| 久久国产精品一区二区三区四区| 国产三级精品三级在线观看国产| 91国产丝袜在线放| 日韩区欧美区| 国产精品三区www17con| 99这里只有精品视频| 福利视频一区二区三区| 国产色噜噜噜91在线精品 | 日本xxxx人| 亚洲黄色www| 久久精品国产亚洲a∨麻豆| 亚洲人成免费电影| 第九色区av在线| 中文字幕视频一区二区在线有码| 岛国在线视频免费看| 色噜噜狠狠狠综合曰曰曰| 黄视频网站在线看| 色综合五月天导航| 麻豆视频在线看| 青青a在线精品免费观看| 精品国模一区二区三区| 国产日韩欧美在线观看| 精品视频91| 国产九色精品| 久久99视频| 亚洲伊人婷婷| 激情综合网址| 国产精品无码专区av在线播放 | 成人在线短视频| 成人动漫中文字幕| 熟女俱乐部一区二区| 国产精品午夜电影| 麻豆精品一区二区三区视频| 亚洲一区二区三区四区五区黄| 日韩av黄色片| 欧美亚洲国产一区二区三区va | 亚洲人成77777| 欧美久久成人| 日韩一级片播放| 国产美女精品一区二区三区| 国产精品手机在线观看| 国产日韩v精品一区二区| 午夜精品一区二区三区视频| 五月婷婷激情综合网| 中文字幕一区二区免费| 日韩视频免费观看高清完整版| 香港三日本三级少妇66| 久久国内精品一国内精品| 国产99在线| 成人深夜直播免费观看| 亚洲aaa级| 天天做天天爱天天高潮| 国产免费成人| 杨幂一区二区国产精品| 久久人人爽爽爽人久久久| 曰本女人与公拘交酡| 色婷婷av一区| 高h放荡受浪受bl| 日韩中文字幕在线视频| 蜜桃麻豆影像在线观看| 成人欧美一区二区三区黑人孕妇| 同性恋视频一区| 大陆极品少妇内射aaaaaa| 日韩成人午夜电影| 亚洲欧美日本一区| 亚洲狼人国产精品| 中文 欧美 日韩| 亚洲精品一区二三区不卡| 日韩影视在线| 国产在线观看一区二区三区 | 国产传媒日韩欧美成人| 我不卡一区二区| 精品久久久久久久久久| 亚洲精品97久久中文字幕无码| 色妞在线综合亚洲欧美| 偷拍视频一区二区三区| 国产日韩精品推荐| 综合激情婷婷| www.污污视频| 国产精品亲子伦对白| 加勒比在线一区| 日韩国产精品一区| 成人免费图片免费观看| 亚洲综合精品一区二区| 久久国产电影| 波多野结衣xxxx| 欧美激情在线看| 蜜臀99久久精品久久久久小说| 亚洲国产成人久久综合| 日本大片在线播放| 91麻豆蜜桃| 女人香蕉久久**毛片精品| 久久久久久久久久一区二区| 国产精品无码永久免费888| 自拍偷拍18p| 亚洲视频在线免费看| 日韩影片中文字幕| 日本不卡一二三区| 日本欧美一区二区在线观看| 精品国产成人亚洲午夜福利| 色综合久久中文字幕综合网| 男人的天堂在线| 国产精品7m视频| 欧美精品系列| 一女二男3p波多野结衣| 国产精品成人网| 国产老妇伦国产熟女老妇视频| 日韩在线免费高清视频| 涩涩涩久久久成人精品| 伊人久久大香线蕉午夜av| 国产一区二区三区在线观看精品| 亚洲精品卡一卡二| 日韩视频不卡中文| 成人黄色动漫| 丝袜足脚交91精品| 国产伦精品一区二区三区在线观看| 波多野结衣不卡视频| 精品国产网站在线观看| 是的av在线| 亚洲国产欧美不卡在线观看| 国产专区欧美精品| 久久视频免费在线观看| 亚洲女人天堂av| 成人黄色免费观看| 91成人综合网| www精品美女久久久tv| 亚洲天堂一二三| 欧美激情视频在线观看| 欧美一区二区三区红桃小说| 国内外免费激情视频| 亚洲视频一二三区| 天堂在线观看免费视频| 国产精品视频精品视频| 欧美激情在线| 中文字幕免费高清| 日韩一区二区中文字幕| 久久久久久久| 日本精品免费视频| 99riav一区二区三区| 一区二区日韩在线观看| 亚洲91精品在线| 久久高清精品| 天天插天天射天天干| 欧美丰满高潮xxxx喷水动漫| 96av在线| 成年人黄色在线观看| 2021久久国产精品不只是精品| 国产精品自偷自拍| 国产精品99久久99久久久二8| 亚洲午夜极品|