精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理時擾動高熵詞,增強LLM性能

人工智能 新聞
這項工作揭示了 LLM 在推理階段的一少部分高熵詞會顯著影響輸出正確性,并提出了 Minimal Test-Time Intervention (MTI),其中包含 Selective CFG intervention 和 Lightweight negative-prompt guidance。該方法無需訓練并即插即用,易于與現(xiàn)代加速框架和各種解碼策略或測試時擴展方法進行結(jié)合。

本文第一作者楊震,香港科技大學(廣州)博士生,研究方向是多模態(tài)理解與生成等。本文通訊作者陳穎聰,香港科技大學(廣州)助理教授,主要研究課題包括生成模型、具身智能等。

隨著對大語言模型的研究越來越深入,關于測試時間擴展 (test-time scaling) 的相關研究正迅速嶄露頭角。研究團隊重新審視測試時行為,發(fā)現(xiàn)了一個簡單但尚未得到充分探索的現(xiàn)象:LLM 推理時的不確定性高度局部化 —— 一小部分高熵詞會顯著影響輸出的正確性。

正是基于這一關鍵觀察,來自香港科技大學(廣州)的研究團隊提出了 Minimal Test-Time Intervention (MTI),其主要包含了 Selective CFG intervention 與 Lightweight negative-prompt guidance 兩種方法。MTI 能夠在推理階段無需額外訓練,就提升大型語言模型的推理能力。

  • 論文標題:Less is More: Improving LLM Reasoning with Minimal Test-Time Intervention
  • 論文地址:https://arxiv.org/abs/2510.13940
  • Github(代碼已開源):https://github.com/EnVision-Research/MTI
  • Huggingface Paper:https://huggingface.co/papers/2510.13940

Selective CFG intervention:減弱高熵詞的不確定性

LLM 在多步推理中經(jīng)常表現(xiàn)出鏈式不穩(wěn)定性:幾個步驟中的不確定性會放大并導致整個答案偏離軌道。為了找到這種不穩(wěn)定性的原因,研究團隊分析了 LLM 回答錯誤的問題,并發(fā)現(xiàn)錯誤回答的熵更高,而這主要是由回答中的高熵詞導致的。為此,研究團隊提出在高熵詞上使用 Classifier-free Guidance (CFG) 以在降低不確定性的同時穩(wěn)定推理過程,并能在保持高效率的同時提高性能。

Lightweight negative-prompt guidance:復用 KV cache 并注入負向詞,節(jié)省顯存分配的同時維護更優(yōu)的無條件空間

研究團隊觀察到,盡管 Selective CFG intervention 僅對高熵詞進行操作,但是仍需為無條件預測支路分配一個新的 KV 緩存,這大大降低了現(xiàn)代 LLM 推理加速器的效率。比如,維護雙 KV 緩存會削弱諸如 vllm 等框架的長上下文處理能力。此外,CFG 源自計算機視覺,其會在訓練過程中引入無條件標簽來學習全局數(shù)據(jù)分布。相比之下,LLM 中的 CFG 并未訓練建模全局文本分布的能力。因此,研究團隊認為無條件分支應該被視為一個負向提示通道:條件分支專注于生成正確的詞,而無條件分支則被鼓勵生成錯誤的詞。為此,研究團隊重用了條件分支的 KV 緩存,并附加了一條用于引出錯誤詞的短指令,最終實現(xiàn)了在維護更優(yōu)無條件空間的同時節(jié)省了 KV 緩存分配。此外,注入的短語非常靈活,比如研究團隊發(fā)現(xiàn) “OUTPUT ERROR” 就已經(jīng)產(chǎn)生了優(yōu)良的效果。

實驗結(jié)果

研究團隊在多個任務上進行了測試,其中包括通用任務(Winogrande,MMLU-Pro),代碼任務(Humaneval,Humaneval_plus,LiveCodeBench),數(shù)學與科學任務(GPQA-Diamond,MATH500)上進行了系統(tǒng)測試。結(jié)果顯示僅在很少的高熵詞上使用 MTI,就能在多個數(shù)據(jù)集上穩(wěn)定帶來性能提升,驗證了方法的有效性。比如在 Qwen3-14B-Reasoning 上,僅對 3.5% 的詞執(zhí)行 MTI,可以為所有任務平均提點 1.58。

從 AIME2024 的實驗中也發(fā)現(xiàn),MTI 方法具備顯著的優(yōu)勢。比如在 Qwen3-8B-Reasoning 模型中,僅需對 1.9% 的詞執(zhí)行 CFG,就可以為準確性帶來 4.9% 的增長,證明了 MTI 在維護高效率的同時,也改進了性能。

分析實驗

研究團隊發(fā)現(xiàn),一些低熵詞很難被 CFG 所改變,這是由于 LLM 在低熵詞上對自己的輸出非常確信,所以很難被 CFG 改變,而這些失敗的 CFG 操作便降低了效率。CFG 所能改變的預測主要集中在高熵詞部分,這是由于模型對自己的預測并不自信,因此 CFG 可以修正它。這些發(fā)現(xiàn)也從側(cè)面反映并非所有的詞都需要使用 CFG。

研究團隊發(fā)現(xiàn)對于基礎模型,詞云中的一些低信息量占位符(例如 **)被語義上更有意義的詞語所取代,從而創(chuàng)造了更豐富的推理分支,并最終提高了準確率。對于推理模型,研究團隊觀察到從單一連接詞(例如 so)向更多樣化的連接詞(例如 however、if、perhaps、alternatively、wait)的轉(zhuǎn)變。這有助于模型摒棄錯誤的先驗推理鏈,并開啟新的思路,最終得出正確的推理??傮w而言,應用該方法可以產(chǎn)生更加多樣化和平衡的詞匯,擴展更多的假設和推理軌跡,最終獲得更好的結(jié)果。

總結(jié)

總的來看,這項工作揭示了 LLM 在推理階段的一少部分高熵詞會顯著影響輸出正確性,并提出了 Minimal Test-Time Intervention (MTI),其中包含 Selective CFG intervention 和 Lightweight negative-prompt guidance。該方法無需訓練并即插即用,易于與現(xiàn)代加速框架和各種解碼策略或測試時擴展方法進行結(jié)合。該方法利用對推理階段高熵詞的擾動,不僅顯著提升了模型在大量任務上的表現(xiàn),也為未來挖掘 LLM 推理階段的潛力提供了全新的思路。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-26 07:43:10

大語言模型LLM推理框架

2025-04-24 10:26:40

2024-04-17 10:08:20

LLM人工智能大型語言模型

2025-03-05 04:00:00

2024-08-16 14:15:00

AI訓練

2023-09-01 15:22:49

人工智能數(shù)據(jù)

2024-12-09 13:40:26

2024-07-03 09:38:35

LLM人工智能

2024-05-20 08:31:33

檢索增強生成LLM大型語言模型

2023-11-27 13:19:54

模型訓練

2024-09-09 08:31:15

2023-08-25 09:34:24

模型訓練

2024-12-11 08:12:24

2025-10-10 02:00:00

2025-06-05 11:51:14

NVIDIAProRLLLM

2025-10-27 09:03:00

2023-11-30 15:56:54

大型語言模型人工智能

2025-06-11 02:30:00

2025-04-27 09:15:40

2025-04-07 09:23:00

大模型LLM推理
點贊
收藏

51CTO技術棧公眾號

色噜噜狠狠永久免费| 亚洲高清123| 日韩av片在线播放| 国产精品欧美日韩一区| 欧美性xxxxxx少妇| 欧美一级免费在线观看| 亚洲精品一区二区三区区别| 亚洲伊人网站| 一区二区成人精品| 无码人妻一区二区三区在线视频| 91www在线| 国产日韩欧美激情| 91影视免费在线观看| 国产无套内射又大又猛又粗又爽 | 久久视频在线| 精品奇米国产一区二区三区| 成人在线观看黄| 成人高清免费在线| 久久综合国产精品| 亚洲一区二区三区在线视频| 国产成人精品网| 婷婷综合网站| 亚洲男人第一av网站| 五月天丁香花婷婷| 日本久久免费| 亚洲一区二区三区小说| 色一情一乱一伦一区二区三欧美| 亚洲欧美激情国产综合久久久| 麻豆久久婷婷| 久久久久久国产三级电影| 亚洲图片另类小说| 精品国产影院| 91精品国产综合久久福利软件| 人妻有码中文字幕| 国内在线免费视频| 亚洲视频在线观看一区| 欧美中文娱乐网| 日韩在线观看视频网站| 久久国产精品区| 欧美中文字幕精品| 精品视频久久久久| 欧美a级在线| 丝袜亚洲欧美日韩综合| 丰满少妇高潮一区二区| 国产精品色呦| 日韩久久久久久| 欧美一级小视频| 91精品店在线| 色成年激情久久综合| 久久精品国产sm调教网站演员| 国产调教视频在线观看| 国产精品久久毛片a| 日韩电影天堂视频一区二区| 日韩一区二区三区中文字幕| 成人黄色a**站在线观看| 91亚洲va在线va天堂va国 | 成人av资源| 国产精品欧美激情在线| 久久国产精品免费| 91久久精品在线| 国产精品爽爽久久久久久| 青青草国产成人av片免费| 国产不卡视频在线| 无码人妻熟妇av又粗又大| 亚洲欧美视频一区二区三区| 97精品国产97久久久久久免费| 精品无码人妻一区二区三区| 一区二区亚洲精品| 国内精品久久久久久中文字幕| 中文字幕一区二区三区手机版| 欧美午夜不卡影院在线观看完整版免费| 久久偷看各类女兵18女厕嘘嘘 | 第九色区aⅴ天堂久久香| 国产亚洲欧美日韩精品| ass极品国模人体欣赏| 日本久久黄色| 精品国产网站地址| 高h视频免费观看| 国产综合自拍| 欧美一区二区三区免费视| 一二三区免费视频| 蜜臀av在线播放一区二区三区| 国产精品综合不卡av| 国产孕妇孕交大片孕| 国产激情一区二区三区四区| 成人网中文字幕| www.xxxx国产| 99久久免费国产| 欧洲亚洲一区二区三区四区五区| av在线首页| 亚洲免费av在线| 成熟丰满熟妇高潮xxxxx视频| 成人美女大片| 制服.丝袜.亚洲.中文.综合| 97人妻精品一区二区三区免费| 中文有码一区| 久久人人爽人人爽爽久久| 亚洲国产精品成人无久久精品| 美女精品在线观看| 91精品视频一区| 天堂在线视频网站| 国产精品你懂的| 国产精品久久..4399| 国产亚洲一区二区手机在线观看 | 国产精品色婷婷久久58| 伊人再见免费在线观看高清版 | 激情成人中文字幕| 在线免费观看视频黄| 一区二区三区在线资源| 国产一区二区三区欧美| 麻豆影视在线播放| 日本不卡视频在线观看| 国产精品一区二区不卡视频| 成年人在线观看视频| 亚洲午夜精品在线| 一级黄色特级片| 欧美爱爱网站| 九九久久久久99精品| 久久永久免费视频| av影院午夜一区| 五月天在线免费视频| 唐人社导航福利精品| 精品国产亚洲一区二区三区在线观看| 人人妻人人澡人人爽| 99国产精品私拍| 成人亚洲激情网| 岛国在线视频免费看| 亚洲风情在线资源站| 国产福利精品一区二区三区| 国产毛片一区二区三区 | 奇米视频888战线精品播放| 欧美黑人xx片| 91精品国产综合久久香蕉的特点| 亚洲自拍偷拍一区二区| 亚洲日韩成人| 俄罗斯精品一区二区| 国内精品久久久久久野外| 91黄色免费观看| 一级国产黄色片| 亚洲天堂偷拍| 99re视频在线播放| 国内精品久久久久久野外| 欧美日韩成人综合| 免费看的黄色网| 视频精品一区二区| 日本一区免费观看| 在线免费日韩片| 日韩激情片免费| 国产精品第一页在线观看| 国产成人aaa| 91网站在线观看免费| 欧美日韩中出| 久久6精品影院| 国产白浆在线观看| 亚洲伦在线观看| 亚洲天堂一区二区在线观看| 国产国产精品| 91美女福利视频高清| 大地资源网3页在线观看| 欧美精品亚洲二区| 一本色道久久88亚洲综合88| 免费观看亚洲视频| 国产精品成人国产乱| 你懂的国产精品永久在线| 国产日韩在线观看av| a√资源在线| 欧美日韩精品是欧美日韩精品| 午夜影院黄色片| 麻豆国产精品一区二区三区 | 久久久久久久久久久视频| 欧美黄色网视频| 欧美中文在线视频| www.国产精品.com| 在线电影一区二区三区| 欧美日韩在线视频免费播放| 国产91综合网| 日日橹狠狠爱欧美超碰| 亚洲婷婷伊人| 国产精品啪视频| 黄色成人影院| 亚洲经典中文字幕| 草莓视频18免费观看| 中文字幕中文字幕一区二区| 992tv人人草| 国产欧美一级| 亚洲视频导航| 91精品入口| 热久久这里只有精品| 在线视频1区2区| 日韩欧美www| 久久国产黄色片| 中文字幕一区二区三区不卡在线| 久久久久亚洲av无码专区首jn| 亚洲精品激情| 亚洲欧洲精品在线| jizz久久精品永久免费| 日韩美女写真福利在线观看| 欧美a免费在线| 亚洲国产日韩欧美在线99| 免费观看日批视频| 一区二区三区国产| 国产人妻大战黑人20p| 国产一区在线观看视频| 三上悠亚久久精品| 99久久影视| 精品国产aⅴ麻豆| 日韩国产91| 国产97色在线| 日韩免费影院| 在线丨暗呦小u女国产精品| 亚洲国产精品视频在线| 欧美中文字幕亚洲一区二区va在线| 在线免费观看亚洲视频| 国产亚洲精品bt天堂精选| 性生交大片免费看l| 奇米影视在线99精品| 欧美激情 国产精品| 天天精品视频| 欧美在线一二三区| 久久精品国产亚洲blacked| 国产欧美日韩免费看aⅴ视频| 麻豆mv在线观看| 成人97在线观看视频| caoporn国产精品免费视频| 亚洲黄在线观看| 精品久久久中文字幕人妻| 欧美调教femdomvk| 国产成人综合欧美精品久久| 亚洲愉拍自拍另类高清精品| 网站永久看片免费| 91在线视频18| 黄色性视频网站| 国产精品中文欧美| 欧美成人手机在线视频| 日本亚洲最大的色成网站www| 日日碰狠狠添天天爽超碰97| 欧美色123| 中文字幕精品在线播放| 四虎成人av| 先锋影音日韩| 国产一区二区三区站长工具| 久久精品国产综合精品 | 欧美一级高清大全免费观看| 中文字幕 国产| 色综合夜色一区| 成人免费视频毛片| 黄色成人在线免费| 久久久国产高清| 亚洲国产裸拍裸体视频在线观看乱了| 欧美日韩在线观看免费| 亚洲免费资源在线播放| 欧美视频www| 亚洲欧美一区二区不卡| 欧美日韩午夜视频| 亚洲日本在线观看| 免费在线观看h片| 亚洲激情五月婷婷| 久久久久久久黄色| 亚洲国产wwwccc36天堂| 日韩av免费网址| 欧美性jizz18性欧美| 区一区二在线观看| 色视频欧美一区二区三区| 无码人妻精品一区二区蜜桃色欲| 色综合久久66| 中文字幕av影视| 欧美日韩精品是欧美日韩精品| 国产精品无码久久av| 欧美一区三区二区| 亚洲国产精品欧美久久| 亚洲精品99999| 免费一级毛片在线观看| 亚洲视频在线观看视频| 男人和女人做事情在线视频网站免费观看| 亚洲日韩第一页| 欧美成人精品一区二区男人看| 美日韩精品免费视频| 国产传媒av在线| 秋霞av国产精品一区| 91天天综合| 亚洲aaaaaa| 久久久免费毛片| 日本成人看片网址| 亚洲成人99| 成年人视频观看| 美女性感视频久久| 成年人看片网站| 国产亚洲午夜高清国产拍精品| 国产又粗又硬视频| 亚洲一区二区三区中文字幕在线 | 欧美性色综合网| av免费在线不卡| 精品国产乱码久久久久久久久| 三级黄视频在线观看| 日韩视频精品在线| а√在线中文网新版地址在线| 国产精品久久久久久av福利软件| 在线播放成人| 久久一区免费| 亚洲经典一区| 久久人妻精品白浆国产| 国产一区二区在线视频| 插吧插吧综合网| 亚洲欧美一区二区久久 | av中文字幕在线播放| 51视频国产精品一区二区| 亚洲精品自拍| 欧美日韩视频在线一区二区观看视频| 99久精品视频在线观看视频| www黄色日本| 国产凹凸在线观看一区二区| jizz中文字幕| 亚洲国产日产av| 91 中文字幕| 亚洲男女自偷自拍图片另类| 日韩av官网| 成人激情视频在线观看| 欧美**vk| 国产美女主播在线播放| 国内成人自拍视频| 欧美激情亚洲色图| 欧美日韩色婷婷| 亚洲欧美另类日韩| 日韩在线观看免费高清完整版| 午夜欧美激情| 国产精品一区二区三区四区五区| 天天久久综合| 第四色婷婷基地| 久久久精品国产免大香伊| 国产真实夫妇交换视频| 日韩一区二区在线免费观看| 超碰国产在线| 国产成人亚洲综合91| 秋霞蜜臀av久久电影网免费| www.欧美黄色| 国产美女一区二区三区| 国精产品一区一区| 欧洲日韩一区二区三区| 丝袜视频国产在线播放| 欧美精品在线看| 国产精品成人**免费视频| 亚洲欧洲另类精品久久综合| 日本不卡一二三区黄网| x88av在线| 在线观看国产精品网站| 免费在线黄色电影| 欧美一级视频在线观看| 欧美绝顶高潮抽搐喷水合集| 蜜臀av色欲a片无码精品一区 | 在线免费观看污视频| 亚洲综合色自拍一区| www.激情五月| 久久久久久亚洲精品不卡| 中文字幕区一区二区三| 日韩一级免费看| 成人午夜激情片| 日韩av一二三区| 国产视频精品自拍| 午夜无码国产理论在线| 日本黑人久久| 男女性色大片免费观看一区二区| 天天摸日日摸狠狠添| 欧美日韩精品欧美日韩精品一 | 欧美激情视频网站| 好吊妞视频这里有精品| 777av视频| 久久久99久久| 亚洲天堂中文在线| 免费91在线视频| 中文字幕av一区二区三区四区| 国产二区视频在线| 久久久久久久国产精品影院| 最新中文字幕第一页| 久久精品电影网站| aaa国产精品视频| 国产精品无码av在线播放| 久久尤物电影视频在线观看| 亚洲婷婷久久综合| 久久久精品久久久| 久久365资源| 中文字幕第36页| 亚洲蜜臀av乱码久久精品蜜桃| 成人午夜免费福利| 热久久视久久精品18亚洲精品| 婷婷亚洲五月| 中文字幕三级电影| 欧美在线你懂得| 手机av免费在线| 蜜桃视频成人| 国内成人精品2018免费看| 日韩高清免费av| 色偷偷888欧美精品久久久| 亚洲图色一区二区三区| 97在线免费公开视频| 最新不卡av在线| 天堂在线中文字幕| 成人性生交xxxxx网站| 国产日韩一区二区三区在线| 日韩国产第一页| 精品爽片免费看久久|