精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AAAI 2025 | 大模型推理加速新范式:加速比高達3.51倍、成本降至1/3

人工智能 新聞
論文中提出的 Falcon 方法是一種增強半自回歸投機解碼框架,旨在增強 draft model 的并行性和輸出質量,以有效提升大模型的推理速度。

近日,中國電信翼支付針對大模型推理加速的最新研究成果《Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregressive Drafting and Custom-Designed Decoding Tree》已被 AAAI 2025 接收。

論文中提出的 Falcon 方法是一種增強半自回歸投機解碼框架,旨在增強 draft model 的并行性和輸出質量,以有效提升大模型的推理速度。Falcon 可以實現約 2.91-3.51 倍的加速比,在多種數據集上獲得了很好的結果,并已應用到翼支付多個實際業務中。

圖片

論文地址:https://arxiv.org/pdf/2412.12639

1. 研究背景

大型語言模型 (LLMs) 在各種基準測試中展現了卓越的表現,然而由于自回歸 (AR) 解碼方式,LLMs 在推理過程中也面臨著顯著的計算開銷和延遲瓶頸。

為此,研究學者提出 Speculative Decoding (投機采樣) 方法。Speculative Decoding 會選擇一個比原始模型 (Target Model) 輕量的 LLM 作為 Draft Model,在 Draft 階段使用 Draft Model 連續生成若干個候選 Token。在 Verify 階段,將得到的候選 Token 序列放入到原始 LLM 做驗證 & Next Token 生成,實現并行解碼。通過將計算資源導向于驗證預先生成的 token,Speculative Decoding 大大減少了訪問 LLM 參數所需的內存操作,從而提升了整體推理效率。

現有的投機采樣主要采用兩種 Draft 策略:自回歸 (AR) 和半自回歸 (SAR) draft。AR draft 順序生成 token,每個 token 依賴于前面的 token。這種順序依賴性限制了 draft 模型的并行性,導致顯著的時間開銷。相比之下,SAR draft 同時生成多個 token,增強了 draft 過程的并行化。然而,SAR draft 的一個重要局限是它無法完全捕捉相同 block 內 draft tokens 之間的相互依賴關系,可能導致生成的 token 接受率較低。

因此,在投機采樣中,平衡低 draft 延遲與高推測準確性以加速 LLMs 的推理速度,是一個重大挑戰。

為此,翼支付提出了 Falcon,一個增強的半自回歸(SAR)投機解碼框架,旨在增強 draft model 的并行性和輸出質量,從而提升 LLMs 的推理效率。Falcon 集成了 Coupled Sequential Glancing Distillation(CSGD)方法,提高了 SAR draft model 的 token 接受率。

此外,Falcon 還設計了一種專門的 decoding tree 來支持 SAR 采樣,使得 draft model 可以在一次前向傳播中生成多個 token,并且也能夠支持多次前向傳播。這種設計有效提升 LLMs 對 token 的接受率,進一步加快了推理速度。

2. 研究方法

Falcon 的架構如圖 1 所示,可以看到,該半自回歸解碼框架主要由三個組件構成:Embedding Layer、LM-Head 和半自回歸解碼 Head

圖片

圖 1 Falcon 框架圖

具體來講,Falcon 將一個時間步長之前的連續特征序列和當前 token 序列連接起來,以同時預測接下來的 k 個標記。例如,當 k = 2 時,Falcon 使用初始特征序列 (f1, f2) 和提前一個時間步長的標記序列 (t2, t3) 來預測特征序列 (f3, f4)。隨后,將預測得到的特征 (f3, f4) 與下一個標記序列 (t4, t5) 連接,形成新的輸入序列。這個新輸入序列用于預測后續的特征序列 (f5, f6) 和標記序列 (t6, t7),從而促進 draft 過程的繼續。Draft model 多次 forward 之后生成的 token 被組織成樹結構,輸入到大模型中進行 verify,通過 verify 的 token 被大模型接收,并基于此基礎開始下一個循環。

2.1 Coupled Sequential Glancing Distillation

當前推測解碼方法的準確性相對較低,主要原因是 token 之間的上下文信息不足。CSGD 通過用真實 token 和 hidden states 替換一些初始預測來改善這一點,將正確信息重新注入解碼過程中,從而提高后續預測的準確性和連貫性。模型結構及訓練流程如下圖:

圖片

圖 2 CGSD 方法示意圖

在訓練過程中,一個時間步長之前的連續特征序列和當前 token 序列連接起來,并輸入到 draft model 中,形成一個融合序列,其維度為 (bs, seq_len, 2 * hidden_dim)。

draft model 由一個混合 Transformer 網絡組成,該網絡包括兩層 LSTM、Relaxed Causal-Masked 多頭注意力機制,以及 MLP 網絡。其中 LSTM 網絡將融合序列的維度減少到 (bs, seq_len, hidden_dim),并保留關于過去 token 的信息,從而提高模型的準確性。Relaxed Causal-Masked 多頭注意力機制能夠在保持因果關系的同時,專注于輸入序列的相關部分。MLP 層進一步處理這些信息,以做出最終預測。

當序列首次通過 draft model 后,會生成初始的 token 預測圖片。然后,我們計算 draft model 的預測與真實 token Y 之間的漢明距離,以此來衡量預測的準確性。接下來,我們將一定數量連續預測的 token 序列圖片和特征序列圖片替換為來自 LLMs 的正確 token 序列圖片和特征序列圖片

CSGD 與傳統的 glancing 方法不同,后者僅隨機替換 token。相反,CSGD 選擇性地同時替換預測之前的連續 token 和特征序列,如圖 2 中虛線框標注的 choice 1、choice 2、choice3 所示。這種方法增強了對 token 間的關系的理解,并確保 draft model 能夠有效利用提前時間步長的 token 序列,這在 SAR 解碼中尤為重要。隨后,修正后的 token 和特征序列被重新輸入到 draft model 中以計算訓練損失。

在訓練過程中,我們采用了知識蒸餾,損失函數包括 draft model 的輸出特征與真實特征之間的回歸損失以及蒸餾損失,具體的損失函數如下:

圖片


2.2 Custom-Designed Decoding Tree

當前基于樹的推測解碼方法通過在每個起草步驟生成多個 draft token 來提升推測效率。然而,這些方法仍然需要 draft model 按順序生成 token,這限制了推測效率的進一步提高。為了解決這一局限性,CDT (Custom-Designed Decoding Tree) 支持 draft model 在一次前向傳遞中生成多個 token (k 個),并且在每個 draft 步驟中支持多次前向傳遞。因此,與現有方法相比,CDT 生成的草稿標記數量是其 k 倍。

Draft model 多次 forward 之后,生成的 token 被組織成樹結構,輸入到大模型中進行 verify。LLM 使用基于樹的并行解碼機制來驗證候選 token 序列的正確性,被接受的 token 及其相應的特征序列會在后續繼續進行前向傳遞。在傳統的自回歸(AR)解碼中,使用因果掩碼,其結構為下三角矩陣。它確保了前面的 token 不能訪問后面的信息。

相比之下,Falcon 采用了一種 causal 因果掩碼 (如圖 3 所示),允許模型訪問同一 k*k 的 block 內的 token 以及相應的之前的連續 token。這一增強顯著提高了 drafter 生成 token 的效率,使 LLM 能夠同時驗證更多的 token,從而加快了 LLM 的整體推理速度。

圖片

圖 3 Custom-Designed Decoding Tree 方法示意圖

3. 實驗結果

我們在多個數據集和多個模型上進行了廣泛的實驗,驗證了本文方法的有效性。和現有的方法相比,Falcon 展現了優越的性能,具體如下圖:

圖片

圖 4 Falcon 實驗結果圖

4. 業務潛力

Falcon 大模型可以實現約 2.91-3.51 倍的加速比,相當于同等條件下推理成本下降至約原先的 1/3,從而大幅降低了大模型推理計算相關成本。

當前,Falcon 技術已轉化至翼支付大模型產品 InsightAI 平臺,并已服務諸如翼支付數字人客服、借錢-翼小橙、人力-翼點通、財務-翼小財等多個業務應用。

5. 總結

投機采樣是大模型推理加速的一個核心方法。當前,主要的挑戰是如何提升 draft model 的準確率、采樣效率,并提升大模型的驗證效率。文章提出了 Falcon 方法,一種基于增強半自回歸投機解碼框架。Falcon 通過 CSGD 這種訓練方法以及半自回歸的模型設計,顯著提升了 draft model 的預測準確率以及采樣效率。此外,為了讓大模型能驗證更多的 token,本文精心設計了一個 decoding tree,有效提升了 draft model 的效率,從而提升了驗證效率。Falcon 在多種數據集上可以實現約 2.91-3.51x 的加速比并應用到翼支付的眾多業務中,獲得了很好的效果。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-01-05 09:33:37

視覺模型訓練

2025-09-26 10:58:03

AI視覺語言模型

2025-07-14 09:14:00

2024-02-20 13:13:00

模型訓練

2024-09-09 08:31:15

2024-07-19 09:59:31

2023-11-30 18:25:57

數據訓練

2025-04-11 09:15:00

語言模型AI數據

2025-06-26 09:06:59

2023-11-19 23:36:50

2025-06-30 08:42:00

模型訓練AI

2025-05-16 08:44:01

2025-06-09 09:32:35

2024-07-08 13:04:01

2024-01-24 13:11:00

AI模型

2024-04-03 12:32:00

數據訓練

2022-06-01 16:47:53

AI模型開源

2025-02-28 09:40:00

2025-02-06 10:16:00

2024-03-25 13:04:00

AI模型
點贊
收藏

51CTO技術棧公眾號

亚洲成人生活片| 91女神在线观看| 国产又爽又黄网站亚洲视频123| 亚洲黄色高清| 亚洲日韩中文字幕| 婷婷中文字幕在线观看| 999精品网| 日本一区二区三区高清不卡 | 国产精品高颜值在线观看| 久久久国产精华| 91免费看蜜桃| 免费视频网站在线观看入口| 你懂的国产视频| 成人av福利| 91片在线免费观看| 成人www视频在线观看| 国产乱码久久久久久| 青青草国产成人a∨下载安卓| 日韩精品一区二区三区四区视频| aa免费在线观看| 在线播放蜜桃麻豆| 国产人成亚洲第一网站在线播放| 成人av网站观看| 亚洲视频久久久| 午夜宅男久久久| 欧美日韩国产成人| 欧美xxxooo| 国产成人ay| 精品国产一区a| 日本黄色福利视频| 刘亦菲一区二区三区免费看| 一区二区视频免费在线观看| 午夜欧美性电影| 欧美一区二不卡视频| 精品一区二区免费| 国产精品久久色| 国产女同在线观看| 韩国一区二区三区在线观看| 按摩亚洲人久久| 日本二区在线观看| 亚洲欧美校园春色| 精品亚洲国产视频| 一级特级黄色片| 九九热播视频在线精品6| 91精品欧美一区二区三区综合在 | dj大片免费在线观看| 国产午夜精品久久久久久免费视| 精品欧美日韩在线| 色窝窝无码一区二区三区| 国产高清亚洲一区| 亚洲在线视频观看| av免费在线不卡| 精彩视频一区二区三区| 国产精品美女呻吟| 欧美性受xxx黑人xyx性爽| 乱人伦精品视频在线观看| 91tv亚洲精品香蕉国产一区7ujn| 国产精品白浆一区二小说| 欧美日韩国产综合网| 欧美黄色片在线观看| 国产女片a归国片aa| 亚洲天天影视网| 欧美成人免费在线视频| 成人免费视频网站入口::| 中文字幕亚洲精品乱码| 伦伦影院午夜日韩欧美限制| 国产精品免费人成网站酒店| 亚洲先锋影音| 色综合久久天天综线观看| 久久久久成人网站| 日韩一级欧洲| 国产成人精品日本亚洲专区61| 国产剧情在线视频| 免费成人在线观看| 91久久久久久久久久久| 性生活三级视频| av成人动漫在线观看| 日本一区视频在线观看| 午夜伦理在线| 亚洲综合久久av| 黄色免费观看视频网站| 最新日韩一区| 欧美一区二区网站| 日本50路肥熟bbw| 日韩在线你懂的| 影音先锋日韩有码| 亚洲色图综合区| 国产一区二区三区久久久久久久久| 日产日韩在线亚洲欧美| 姑娘第5集在线观看免费好剧| 久热成人在线视频| 国产三区精品| www日韩tube| 一区二区三区不卡视频在线观看| 欧美极品欧美精品欧美| 九九久久国产| 精品久久国产字幕高潮| 亚洲性猛交xxxx乱大交| 一级欧洲+日本+国产| 91高清视频在线免费观看| 亚洲精品国产精品国自产网站按摩| 精品中文字幕一区二区| 久久九九视频| 免费黄色在线看| 精品久久久久久中文字幕| 午夜免费看毛片| 精品女人视频| 一区二区亚洲欧洲国产日韩| 男女免费视频网站| 麻豆精品新av中文字幕| 国产私拍一区| 蜜桃视频在线观看www社区 | 色老头一区二区三区在线观看| 欧美成人一区二区三区高清| 天堂久久久久va久久久久| 国产91aaa| 麻豆网站在线免费观看| 欧美视频13p| 免费黄色av网址| 97在线精品| 国产成人精品一区二区在线| 免费看国产片在线观看| 亚洲三级小视频| 不卡影院一区二区| 黄色免费大全亚洲| 欧美伦理91i| 亚洲一区二区影视| 久久精品欧美日韩| 国产一区二区在线视频播放| 日韩精品一区二区三区中文 | 色呦呦在线视频| 精品视频在线免费| 亚洲区自拍偷拍| 国产视频一区欧美| 国产精品jizz视频| 亚洲七七久久综合桃花剧情介绍| 欧美人与z0zoxxxx视频| 国产美女永久免费无遮挡| 久久精品中文| 农村寡妇一区二区三区| 极品视频在线| 亚洲大胆美女视频| 日本熟妇乱子伦xxxx| 成人一区二区三区视频| 日韩国产小视频| 日韩精品三级| 色综合久久久久久中文网| 99久久亚洲精品日本无码| 中文字幕在线不卡一区| 天堂一区在线观看| 日韩欧美网址| 国产在线拍偷自揄拍精品| 在线观看国产原创自拍视频| 欧美视频一区二区| 99久久99久久精品免费看小说. | 欧美中文字幕一区二区| 国产xxx69麻豆国语对白| 久久久久久青草| 一本到不卡精品视频在线观看 | 国产精品久久久久久福利一牛影视| 国产成人综合一区| 精品国产网站| 国产在线视频2019最新视频| 黄色网页在线看| 欧美白人最猛性xxxxx69交| 久久久国产精品黄毛片| 成人深夜在线观看| 日本www在线播放| 国产欧美日韩影院| 国产精品久久视频| 免费网站免费进入在线| 精品国产1区二区| 好吊妞视频一区二区三区| 久久网站热最新地址| 激情婷婷综合网| 水蜜桃久久夜色精品一区| 91久久久在线| 岛国毛片av在线| 亚洲丝袜一区在线| 国产精品毛片久久久久久久av| 一区二区在线看| 国产在线观看无码免费视频| 日本aⅴ免费视频一区二区三区| 亚洲资源视频| 在线精品自拍| 国产98色在线| 在线视频观看国产| 亚洲人成欧美中文字幕| 一级黄色片视频| 亚洲图片欧美一区| 欧美特级黄色录像| 国产在线不卡一卡二卡三卡四卡| 国产 日韩 亚洲 欧美| 狠狠做六月爱婷婷综合aⅴ| 亚洲a在线观看| 人狥杂交一区欧美二区| 日韩一中文字幕| 天天舔天天干天天操| 在线视频中文字幕一区二区| 国产探花在线播放| 久久午夜色播影院免费高清| 激情图片中文字幕| 免费日韩精品中文字幕视频在线| 樱空桃在线播放| 天天躁日日躁狠狠躁欧美| 成人国产精品日本在线| 性欧美又大又长又硬| 综合国产在线视频| 色哟哟在线观看| 91精品国产色综合久久不卡蜜臀| 男人天堂2024| 亚洲国产精品尤物yw在线观看| 日本理论中文字幕| 99亚偷拍自图区亚洲| 午夜一级免费视频| 日韩中文字幕一区二区三区| 日韩欧美精品免费| 婷婷综合网站| 日本成人看片网址| 秋霞在线一区| 爱情岛论坛亚洲入口| www.成人| 国产精品极品美女在线观看免费 | 少妇极品熟妇人妻无码| 麻豆freexxxx性91精品| 激情六月丁香婷婷| 亚洲电影av| 成年丰满熟妇午夜免费视频 | 免费在线不卡视频| 亚洲一区在线免费观看| 免费国产羞羞网站美图| 国产精品天天看| 精品无码人妻一区二区免费蜜桃| 91天堂素人约啪| 污污污www精品国产网站| 国产精品一二三四区| 看看黄色一级片| 毛片一区二区三区| 国产三级三级三级看三级| 模特精品在线| www国产黄色| 亚洲影音先锋| 国产男女免费视频| 亚洲精品免费观看| 男人日女人视频网站| 国产字幕视频一区二区| 欧美极品少妇无套实战| 欧美日韩 国产精品| 国产一级片91| 国产精品vip| 99在线免费视频观看| 亚洲精品色图| 欧美 日韩 国产在线观看| 99精品热视频只有精品10| 自拍日韩亚洲一区在线| 国产日韩欧美一区在线| 免费毛片小视频| 久久www成人_看片免费不卡| 日本成人在线免费视频| 日韩不卡一区二区| 欧美女同在线观看| 国产精品一区二区视频| 老熟女高潮一区二区三区| 成人亚洲精品久久久久软件| 久久久老熟女一区二区三区91| 99麻豆久久久国产精品免费优播| 你懂得在线视频| 国产婷婷色一区二区三区| 色欲狠狠躁天天躁无码中文字幕| 国产精品国产三级国产普通话三级| 99国产精品无码| 亚洲精品视频在线观看免费| 国产一级视频在线| 欧美日韩免费在线| 亚洲性猛交富婆| 91精品国产综合久久小美女| 性色av蜜臀av| 精品一区二区三区四区| 毛片免费在线播放| 久久精品国产亚洲一区二区| 日本在线视频www鲁啊鲁| 欧美诱惑福利视频| 白嫩亚洲一区二区三区| 国产高清一区视频| 精品国产中文字幕第一页| 一区二区在线高清视频| 影音先锋日韩资源| 亚洲福利精品视频| 国产69精品一区二区亚洲孕妇| 色婷婷精品久久二区二区密| 欧美激情综合网| 印度午夜性春猛xxx交| 亚洲va韩国va欧美va| 亚洲免费视频二区| 精品少妇一区二区三区在线视频| 九色在线视频| 九九热在线精品视频| 三级成人黄色影院| 亚洲精品欧美日韩专区| 日日狠狠久久偷偷综合色| 免费看av软件| 久久精品人人做人人爽电影蜜月| 亚洲免费黄色录像| 久久精品视频在线免费观看 | 免费在线超碰| 麻豆一区二区在线观看| 制服诱惑亚洲| 国产美女精品在线观看| 四季av一区二区凹凸精品| 男人揉女人奶房视频60分| 国产一区美女在线| 国产人妻大战黑人20p| 亚洲成av人片在线| 99久久国产热无码精品免费| 国产亚洲欧美日韩精品| а√在线天堂官网| 91丨九色丨国产| 欧美mv日韩| 激情五月婷婷久久| 91久色porny| 日韩少妇高潮抽搐| 欧美一区二区啪啪| 午夜免费视频在线国产| 日本在线观看天堂男亚洲| 蜜桃一区av| 欧美一级爱爱视频| 国产综合久久久久久鬼色| 一级黄色录像毛片| 色中色一区二区| 性xxxx视频| 91精品国产精品| 第四色中文综合网| 青青视频免费在线| 国产精品一二一区| 人妻少妇精品一区二区三区| 欧美福利视频一区| 香港伦理在线| 国产精品日韩av| 日韩aaaa| 国产91色在线观看| 中文字幕免费不卡| 波多野结衣视频网址| 亚洲欧美日韩天堂| 老司机2019福利精品视频导航| 久久综合九九| 久久激情婷婷| 一级特黄曰皮片视频| 欧美在线免费观看亚洲| eeuss影院www在线播放| 国产精品一区久久| 国产精品99视频| 国产传媒免费观看| 亚洲精品国产高清久久伦理二区| 99精品在线看| 九色成人免费视频| av动漫精品一区二区| 黄网站欧美内射| 国产亚洲一区二区在线观看| 欧美brazzers| 日日噜噜噜夜夜爽亚洲精品| 91成人在线网站| 黄色一级片国产| 波多野结衣一区二区三区 | 中文字幕成人动漫| 欧美三级在线看| 精品176二区| 国产一区二区黄色| 免费国产自线拍一欧美视频| 久久久久亚洲AV成人无在| 欧美日韩你懂得| 色婷婷视频在线观看| 精品久久久久久一区| 日韩制服丝袜av| 久久爱一区二区| 亚洲成色www8888| 亚洲a∨精品一区二区三区导航| 亚洲国产欧美一区二区三区不卡| 国内精品免费**视频| 亚洲激情视频一区| 国产一区二区三区在线免费观看 | 亚洲三级影院| xxxx日本免费| 在线观看91精品国产麻豆| www欧美xxxx| 亚洲免费不卡| 成人午夜私人影院| 日本55丰满熟妇厨房伦| 国产精品福利在线观看播放| 91久久国产精品| 精品9999| 成年人在线免费看片| 日韩三级视频在线观看| 成人av观看| 青草全福视在线| 久久久久久日产精品| 国产福利资源在线| 国产成人激情小视频| 欧美午夜国产| 在线观看免费黄色网址| 亚洲国产精品视频在线观看|