精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理提速4倍!莫納什、浙大提出動態拼接,大小模型智能協作

人工智能 新聞
針對「大模型推理速度慢,生成token高延遲」的難題,莫納什、北航、浙大等提出R-Stitch框架,通過大小模型動態協作,衡量任務風險后靈活選擇:簡單任務用小模型,關鍵部分用大模型。實驗顯示推理速度提升最高4倍,同時保證高準確率。

近兩年,思維鏈(Chain-of-Thought, CoT)推理讓大語言模型在復雜推理任務上展現出前所未有的能力——從數學解題到邏輯分析,表現令人驚嘆。

然而,這種強大的推理能力也帶來了一個長期存在的挑戰:推理過程過于緩慢。

每生成一個 token,模型都要完整算一遍前向傳播。長一點的推理鏈,幾千上萬個 token,不僅延遲高,成本也成倍增加。

在加速大語言模型的諸多方向中,Speculative Decoding(投機解碼) 一直是備受關注的方案。

它的思路簡單:讓小模型(SLM)先預測一段輸出,大模型(LLM)校驗一致性。若一致,大模型就能夠一次接受小模型的輸出,減少大模型解碼的次數,從而加速。

莫納什、北航、浙江大學等機構的研究者提出了一種動態拼接的大模型推理框架R-Stitch,讓大小模型智能協作,在vLLM推理框架下提速最高可達4倍。

項目主頁:https://caesarhhh.github.io/R-Stitch

論文鏈接:https://arxiv.org/abs/2507.17307

研究團隊在AMC數據集上,對投機解碼測試了多組模型組合,包括DeepSeek-R1-Distill-Qwen-1.5B/7B、L1-1.5B-Short、以及 Qwen2.5-Math-1.5B/7B-Oat-Zero等。

結果顯示出一致的趨勢:token 一致性越高,加速越明顯;一致性越低,速度提升就越有限。

并且,并非所有樣本都能加速。團隊觀察到相當一部分輸入的速度提升低于 1×,即比原始推理還慢——說明當模型間差異較大時,投機解碼的一致性校驗可能反而帶來開銷。

圖1 Token一致性與推理加速分析。 (a) 不同大模型–小模型組合在AMC數據集上的token一致率與加速比關系;(b) 各樣本的加速比分布,可見部分樣本出現低于1×的情況;(c) 在兩者都答對的問題上,L1-1.5B-Short的推理更短、更簡潔。

更有意思的是,在DeepSeek-R1-Distill-Qwen -7B與L1-1.5B-Short的實驗中,研究人員發現:

當兩者都答對時,L1-Short的推理長度遠小于該7B模型。

這意味著:小模型可能以更短的推理路徑到達相同結論,而投機解碼對token一致性的強調,則忽略了這些更高效的路徑。

經驗熵分析

不確定性揭示推理風險

圖2 熵與錯誤位置的關系。 (a) 錯誤解答的整體熵明顯高于正確解答;(b) 熵分布高度集中在0附近,大多數token具有極低或接近零的熵;(c) 首個導致錯誤的 token 附近區域平均熵更高,說明模型往往在不確定區域產生錯誤。

在讓大小模型協同推理之前,需要弄清楚一個關鍵問題:

小模型在什么時候能被信任?又是什么跡象預示它可能要「翻車」?

為此,團隊在AMC數據集 上,對推理過程中的token熵分布進行了深入分析,使用DeepSeek-R1-Distill-Qwen-7B作為大模型,L1-1.5B-Short作為小模型,逐步揭示出三個穩定的規律。

首先,大多數token的熵極低。統計結果顯示,只有約10%的token熵超過 0.1,而絕大部分幾乎為零。這意味著模型在大部分生成過程中都非常「自信」,真正的不確定區域其實只占很小一部分。

其次,錯誤推理的平均熵顯著更高。在同樣的題目上,錯誤答案的 token 熵明顯更高,說明模型在這些題目的推理中更不確定。

并且,團隊觀察到一個關鍵細節:在小模型出錯的樣本中,錯誤往往起源于局部的高熵區域。

在第一個導致錯誤的 token 附近 token的平均熵顯著高于全局水平,因此上述現象可以說明高熵的地方更容易導致錯誤。

大小模型協同動態解碼

圖3 R-Stitch方法流程圖

熵引導的動態切換

基于上述實驗觀察,團隊提出了一種能根據熵動態切換大小模型的解碼框架R-Stitch,讓推理既快又穩。

核心思路是:

讓小模型 (SLM) 盡可能多地負責推理,以提升速度;

讓大模型 (LLM) 只在「高熵、高風險」的時刻介入,以保證正確率;

當LLM處理完復雜部分、進入「低熵」區間時,它又能把控制權交還給SLM,繼續快速生成。

在每一步生成中,模型都會對所有候選詞計算一個概率分布,研究人員用這個分布的歸一化熵值(介于0到1之間)來衡量不確定性。

當SLM的熵值低于閾值τ(表示確定性高)時,它繼續生成;

當熵值高于閾值時,說明「有點拿不準」,此時就交由LLM接手;

反過來,當 LLM 的熵再次降到閾值以下時,它會把控制權還給SLM

這種基于熵的雙向切換策略,使系統能在推理鏈中靈活往返,實現速度與精度的動態平衡。

基于強化學習的動態切換

在R-Stitch 基礎之上,團隊進一步提出了 R-Stitch?,通過強化學習讓一個輕量級路由器學會更智能地決策何時切換。

這個路由器會在高熵時段讀取當前模型隱狀態,判斷是繼續用 SLM 還是交給 LLM。

團隊為它設計了兩種獎勵信號:

準確率獎勵:答案正確則加分;

效率獎勵:計算越快越好,但前提是不能犧牲正確率。

為準確評估推理成本,R-Stitch?引入了真實延遲感知的獎勵函數。

總的獎勵形式為:

其中表示預測正確與否,是整條推理軌跡的估計延遲,λ為平衡系數。

延遲只在輸出正確時被懲罰,確保模型不會「為快而快」。

由于在強化學習中直接測量每個樣本每條采樣軌跡的真實延遲代價太高,R-Stitch?采用了延遲估計器。

團隊為每個模型在不同輸入長度和緩存大小下采樣延時數據,并用線性回歸擬合出它們的延遲曲線。

預填充的延遲被建模為:

其中表示當前處理的token數量,為緩存長度,系數a, b, c, d由實測數據回歸得到。

解碼階段只需將,得到:

最終,整條推理軌跡的延遲由所有步驟的時間求和獲得。

通過這種方式,路由器在訓練時就能「腦補」每個決策的時間成本,真正實現延遲感知的策略學習——既考慮答得準,也懂得算得快。

實驗結果

速度提上去,精度穩得住

圖4 所提方法在數學推理數據集上的表現,所有延時均在vLLM推理框架下實測

團隊將所提方法集成到vLLM中,并在多個數學推理基準上評估了所提方法。結果顯示,R-Stitch在幾乎不損失準確率的前提下,顯著降低了推理延遲:以7B 與14B模型為例,在合理閾值下可實現約2–3×的整體加速,而在更大模型上提速可達 約3–4×

當閾值進一步提高時,速度繼續上升,但會帶來精度下降,形成穩定的效率–精度平衡。

相比之下,投機采樣在一致性較低的模型組合中常因頻繁回退導致開銷上升,甚至比原生 LLM 更慢;僅用小模型雖快但精度顯著下降。

總體來看,R-Stitch的熵路由機制在不同模型規模和推理預算下都表現穩健,實現了「快而不失準」的推理路徑。

進一步地,R-Stitch?通過引入強化學習路由器,使切換策略更加穩定,在不同閾值下都能保持較優的速度–精度表現。

圖5 R-Stitch?與投機解碼的逐樣本對比(LLM-7B, AMC 數據集)。 每個柱狀條表示單個樣本相對于大模型基線的加速比,顏色表示推理是否正確。虛線為無加速(1×),黑色曲線展示了各樣本的token減少比例。

從樣本級對比可以看到,R-Stitch?在大多數樣本上都能實現穩定提速,而投機解碼僅在少量樣本中表現出加速,大部分情況下反而因為一致性不足而變慢。 

理論上,投機解碼的加速上限受限于大小模型的延遲差距,在7B以及1.5B的模型組合上當一致性極高時最多只能接近2×;而 R-Stitch?額外利用了小模型生成更簡潔的表達,保持答案正確的同時,實際加速最高可達約 14×

圖6 R-Stitch與提早退出方法結合的效果

在此之外,團隊還驗證了R-Stitch能否與免訓練的提早退出方法DEER協同工作,以進一步提升解碼效率。DEER會在模型信心超過閾值時提前結束推理,而 R-Stitch 通過熵路由在生成過程中動態切換大小模型。兩者結合后,在縮短推理路徑的同時,也顯著降低了每個token的計算成本

從結果來看,R-Stitch與DEER的組合在多個數據集上都實現了顯著加速:在AIME上,生成token數量減少一半以上,延遲從210秒降至92秒;

在GPQA-D上,推理時間從117秒降至18秒,同時準確率還略有提升,對比原始LLM-7B推理相當于約9.5×加速

這說明兩種機制天然互補:DEER 縮短了生成序列,而R-Stitch降低了單步成本且進一步縮短生成序列。

總結

R-Stitch提出了一種基于熵的不確定性路由機制,讓大小模型在推理過程中動態協作:小模型負責簡單部分,大模型處理關鍵步驟,從而在不損失精度的前提下顯著提速。 

在此基礎上,R-Stitch?通過強化學習路由器進一步提升了切換的智能性與穩定性,實現了更平衡的速度–精度表現。

整體來看,R-Stitch提供了一種讓大小模型協同加速、兼顧靈活性與效率的高效推理方案。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-05-30 14:17:00

模型推理

2021-12-01 10:05:12

模型人工智能計算

2023-12-11 15:40:32

PyTorch代碼大模型

2024-08-06 11:30:00

2025-04-03 09:27:44

2025-04-18 09:25:00

2025-08-18 08:40:00

模型AI算法

2024-01-18 12:37:31

SOTA3D方法

2022-05-11 14:45:48

模型人工智能

2024-12-30 08:50:00

AI數據訓練

2025-08-26 08:50:00

AI開源LLM

2020-05-14 14:21:50

谷歌AI數據

2009-12-21 09:13:09

Ubuntu啟動速度

2025-01-13 12:33:42

2024-09-12 12:46:36

2009-09-23 18:14:48

2025-08-25 08:45:00

模型代碼開源

2025-06-10 02:30:00

智能體ARTIST強化學習

2025-06-05 08:40:00

2021-09-30 11:27:58

模型人工智能神經網絡
點贊
收藏

51CTO技術棧公眾號

国产专区一区| 日韩av懂色| av色综合久久天堂av综合| 久久久亚洲成人| 成人精品999| 国产精品亚洲欧美日韩一区在线| 亚洲一区二区三区中文字幕| wwww国产精品欧美| 亚洲福利视频免费观看| 久草精品在线播放| 久操视频在线免费播放| www.欧美.com| 国产主播在线一区| 日韩av在线播| 天天做天天爱天天综合网2021| 欧美成人三级在线| 日韩欧美在线免费观看视频| av网站网址在线观看| 久久嫩草精品久久久久| 亚洲一区精品电影| 天天爽夜夜爽人人爽| 欧美黄色一级视频| 中文国产亚洲喷潮| 久久久久亚洲AV成人无码国产| 欧美性生活一级| 日韩欧美极品在线观看| 欧美黄色免费网址| 欧美边添边摸边做边爱免费| 久久久精品国产99久久精品芒果| 成人精品水蜜桃| 一二三四区在线| 新67194成人永久网站| 欧美日本在线视频中文字字幕| 在线观看日本中文字幕| 精品国产午夜肉伦伦影院| 91精品国产综合久久香蕉的特点| 欧美三级午夜理伦三级| 操喷在线视频| 一区二区三区欧美| 一区二区三区在线观看www| 嫩草在线播放| 97久久精品人人爽人人爽蜜臀 | 成年人免费视频播放| 大奶在线精品| 欧美岛国在线观看| 在线播放黄色av| 中文在线字幕观看| 麻豆影院在线| 中文字幕永久在线不卡| 亚洲不卡1区| 视频三区在线观看| 97精品久久久久中文字幕| 99热在线播放| 亚洲精品成人区在线观看| 国产一区激情在线| 亚洲影院污污.| 国产日韩欧美一区二区东京热| 捆绑调教美女网站视频一区| 国产精品欧美在线| 怡红院成永久免费人全部视频| 久久久久久黄| 国产精品欧美日韩久久| 91资源在线视频| 激情五月婷婷综合| 亚洲一区精品电影| 亚洲欧美另类一区| 99热国产精品| 欧美日韩一区二| 黄色av网站在线| 亚洲国产精品av| 一本一道久久久a久久久精品91 | 久久久久久久久久久黄色| 欧美一区二区三区电影在线观看| 日本在线视频1区| 国产午夜精品一区二区三区视频| 四虎一区二区| caopo在线| 午夜视频在线观看一区二区| 精品国产一二三四区| 97久久香蕉国产线看观看| 欧美曰成人黄网| 樱花草www在线| 久久久免费毛片| 国产亚洲一区精品| 卡通动漫亚洲综合| a91a精品视频在线观看| 成人高清视频免费观看| 欧美丰满少妇xxxxx做受| 国产在线精品观看| 日本成人中文字幕| 2022国产精品| 国产在线三区| 中文字幕永久在线不卡| 黄页免费在线观看视频| 2019年精品视频自拍| 欧美一级理论片| 黄色a一级视频| 婷婷亚洲五月| 91精品国产色综合| 91在线观看喷潮| xfplay精品久久| 国产香蕉一区二区三区| 美女100%一区| 精品久久久久久久久久久久久久久久久 | 91国内在线| 色狠狠综合天天综合综合| 特级黄色片视频| 猛男gaygay欧美视频| 久久香蕉国产线看观看网| 国产三级av片| 国产福利精品导航| 亚洲韩国在线| 老牛影视精品| 午夜国产精品视频免费体验区| 欧美精品一区二区三区很污很色的| 中文字幕成人动漫| 亚洲无吗在线| 成人一区二区电影| 久蕉在线视频| 亚洲地区一二三色| 欧美一级免费在线| 欧美亚洲激情| 欧美一级视频免费在线观看| 亚洲av无码一区二区三区dv| 国产精品久久综合| 国产女女做受ⅹxx高潮| 66精品视频在线观看| 久久精品91久久香蕉加勒比| 国产熟妇一区二区三区四区| caoporn国产一区二区| 中文字幕色呦呦| 91麻豆精品| 最近2019中文字幕mv免费看| 一级久久久久久| 久久一二三国产| 免费国产黄色网址| 99re8这里有精品热视频免费| 久久久999精品视频| 中文字幕一区2区3区| 国产视频不卡一区| 亚洲视频网站在线观看| 特级特黄刘亦菲aaa级| 亚洲精品888| 91久久精品美女高潮| 欧美黄色激情| 7878成人国产在线观看| 精品人体无码一区二区三区| 美女网站色91| 亚洲午夜精品久久久中文影院av| 成人午夜毛片| 中文日韩在线视频| 亚洲午夜激情视频| 中文字幕五月欧美| 亚洲18在线看污www麻豆| 欧美国产美女| 亚洲影视中文字幕| 里番在线播放| 亚洲国产精品久久久久秋霞不卡| 日韩三级免费看| 99久久er热在这里只有精品66| 欧美大片在线播放| 亚洲桃色综合影院| 国产精品1234| 看黄网站在线| 日韩精品一区二区三区三区免费| 国产午夜福利精品| 99久久精品国产精品久久| av天堂永久资源网| 精品国产一区二区三区香蕉沈先生| 国产91在线高潮白浆在线观看| 国产高清自拍视频在线观看| 欧美日韩一区二区三区高清| 国产高清在线免费观看| 制服诱惑亚洲| 国产精品免费免费| 手机在线免费毛片| 亚洲经典视频在线观看| 秋霞毛片久久久久久久久| 不卡亚洲精品| 欧美激情欧美激情在线五月| 欧美日韩激情视频一区二区三区| 欧美性猛交xxxx黑人交| 日本a级片视频| 97se亚洲国产综合自在线| 爱情岛论坛成人| 欧美日本三区| 免费99视频| 国产精品一区二区精品视频观看| 久久久欧美一区二区| 成人亚洲综合天堂| 日韩一级黄色片| 亚洲不卡视频在线观看| 综合亚洲深深色噜噜狠狠网站| 女性生殖扒开酷刑vk| 丝袜亚洲另类欧美| 少妇久久久久久被弄到高潮| 欧美美女在线| αv一区二区三区| 日韩天堂在线| 欧美激情综合色| 99reav在线| 欧美mv日韩mv国产网站app| 国产午夜麻豆影院在线观看| 亚洲一区二区三区四区五区中文| 亚洲区自拍偷拍| 丁香六月综合激情| 日本黄色的视频| 亚洲欧美日本国产专区一区| 国产av第一区| 少妇精品久久久一区二区| 99爱精品视频| 久久人体av| 欧洲成人免费aa| a毛片不卡免费看片| www国产精品视频| 精品影院一区| 亚洲精品国产免费| 国内精品久久久久久久久久久| 在线一区二区三区四区五区| 中文字幕在线字幕中文| 亚洲人成影院在线观看| 91在线无精精品白丝| 99国产精品一区| 免费黄色a级片| 美女100%一区| 欧美色电影在线| 久久久久久少妇| 亚洲国产毛片aaaaa无费看| 亚洲女同二女同志奶水| 久久精品人人爽人人爽| 好吊一区二区三区视频| 成人一区二区视频| 欧美高清精品一区二区| 精品一区免费av| 亚洲另类第一页| 日韩精品欧美精品| 欧美v在线观看| 香蕉成人久久| 俄罗斯av网站| 一本色道久久综合亚洲精品高清| 久艹在线免费观看| 国产一区二区三区四区老人| 91视频成人免费| 亚洲久久久久| 黄色特一级视频| 欧美午夜一区| av在线免费观看国产| 亚洲精品久久久| 一区二区三区日韩视频| 性xxxx欧美老肥妇牲乱| 特级毛片在线免费观看| 亚欧美无遮挡hd高清在线视频| 亚洲欧美久久234| 欧美好骚综合网| 天天综合中文字幕| 亚洲人体av| 免费拍拍拍网站| 中文在线不卡| 日本男人操女人| 美腿丝袜在线亚洲一区 | 精品一二三四区| 亚洲综合20p| 国产激情视频一区二区在线观看 | 91在线国产福利| 国产一区国产精品| 牛牛视频精品一区二区不卡| 精品国产乱码久久久久久88av| 卡一精品卡二卡三网站乱码| 久久综合毛片| 欧美精品一区二区三区精品| 在线视频一区观看| 欧美成人亚洲| a在线视频观看| 日本美女一区二区三区视频| 国产成人美女视频| 国产成人8x视频一区二区| 日韩免费高清一区二区| 国产日韩欧美一区二区三区乱码| 欧美性生给视频| 亚洲一区二区三区影院| 人人草在线观看| 69成人精品免费视频| 日韩在线观看视频一区| 国产一区二区三区在线看| 人人干在线视频| 91精品国产高清久久久久久| av有声小说一区二区三区| 成人国产在线视频| 99久久婷婷国产综合精品青牛牛| 免费成人看片网址| 亚洲色图国产| 波多野结衣家庭教师视频| 极品美女销魂一区二区三区免费| 无人码人妻一区二区三区免费| 91视频你懂的| 黄色a级片在线观看| 欧美视频一区二区三区…| 白嫩情侣偷拍呻吟刺激| 盗摄牛牛av影视一区二区| 免费久久99精品国产自| 国产精品精品| 日日摸日日碰夜夜爽av| 国产一区二区三区在线观看免费视频| 色婷婷免费视频| 亚洲人成精品久久久久久 | 在线看国产一区二区| www.天堂在线| 中文字幕精品网| 美女视频在线免费| 99久久伊人精品影院| 日韩一区二区中文| 激情综合网婷婷| 成人毛片老司机大片| 四虎884aa成人精品| 色综合av在线| 天堂网av2014| 欧美区二区三区| 欧洲亚洲精品| 日韩精品一区二区三区四区五区| 伊人成人在线| 九九热视频免费| 国产精品久久久久久久裸模| 亚洲精品午夜国产va久久成人| 日韩一区二区三区av| 国产精品二线| 日韩美女中文字幕| 日本在线中文字幕一区| 韩日视频在线观看| 国产伦精一区二区三区| 天天鲁一鲁摸一摸爽一爽| 欧美午夜免费电影| 国产免费永久在线观看| 欧美一区二区视频97| 乱中年女人伦av一区二区| 国产肉体ⅹxxx137大胆| 国产一区在线视频| 蜜桃av.com| 欧美高清性hdvideosex| 日本最新在线视频| 国产精品香蕉国产| 日韩av有码| 小泽玛利亚视频在线观看| 欧美激情自拍偷拍| 国产在线一级片| 中文字幕9999| 国产第一亚洲| 亚洲三区视频| 精品一区二区三区免费| 婷婷激情四射网| 欧美电影一区二区三区| 国产视频一区二区| 97人人模人人爽人人喊38tv| 欧美片第1页综合| 特黄特色免费视频| 亚洲国产一区在线观看| 日本黄色不卡视频| 26uuu另类亚洲欧美日本一| 偷拍自拍一区| 日韩一级片播放| 国产精品日韩精品欧美在线| 中文字幕av影视| 久久精品视频在线播放| 久久九九精品视频| 男人插女人视频在线观看| 99精品欧美一区| 亚洲男人天堂网址| 日韩性生活视频| 亚洲国产欧美国产第一区| 妞干网在线观看视频| 91香蕉视频在线| 精品久久久久久久久久久国产字幕 | 国产精品av电影| 天堂网在线观看国产精品| 五月天六月丁香| 午夜影院久久久| 国产一级二级三级在线观看| 成人精品视频99在线观看免费| 最新精品国产| 久久久久国产精品区片区无码| 在线一区二区三区四区五区| av免费在线观看网站| 国产精品免费一区二区三区在线观看| 欧美亚洲一区| 91麻豆精品久久毛片一级| 亚洲成人网在线观看| 欧亚一区二区| 大片在线观看网站免费收看| 91美女蜜桃在线| 国产又大又长又粗| 91高潮精品免费porn| 日韩影院二区| 中文字幕一区三区久久女搜查官| 欧美视频自拍偷拍| 国产第一页在线视频| 亚洲成人蜜桃| 成人天堂资源www在线| 最新中文字幕第一页| 久久久亚洲影院| 久久美女视频| 三叶草欧洲码在线|