精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華耶魯推理模型新范式:動態推理實現高效測試時擴展,大大節省Token消耗

人工智能 新聞
清華、耶魯團隊提出推理模型新范式:動態推理實現高效測試時擴展。

推理性能提升的同時,還大大減少Token消耗!

清華、耶魯團隊提出推理模型新范式:動態推理實現高效測試時擴展

圖片

測試時擴展(test-time scaling)技術加速推動了大語言模型在復雜推理領域的突破。

以OpenAI的o1系列、DeepSeek-R1等模型為代表,這些系統通過強化學習和大規模思維鏈(CoT)軌跡訓練,在數學證明、編程競賽等任務中展現出接近人類專家的水平。

例如,DeepSeek R1在MATH500數學基準上達到97.3%的準確率,其核心在于允許模型在推理時動態擴展計算資源——生成更長的思維軌跡意味著更高的解題成功率。

然而,這種“以計算換性能”的策略帶來了顯著的效率代價。

現有方法通常強制分割上下文窗口:模型必須在前半段完成完整推理(如R1采用…分隔符),即使面對簡單問題也需消耗很大一部分的思考tokens(thinking tokens)。

更嚴重的是,部分模型在復雜問題上會出現“過度思考”(overthinking)現象:生成冗余的循環推理步驟卻無法提升準確率。論文中揭示,直接截斷超過4096 tokens的思考過程可能導致DeepSeek-R1性能下降12.7%,這暴露了當前方法在效率與效果間的根本矛盾。

圖片

△(a) 與傳統長思考模型相比,Z1的動態思考窗口可以節省大量思考token,達到高效推理性能(b)

針對這一挑戰,來自清華、耶魯團隊基于純代碼數據訓練了一個高效思考模型,其具有天然的動態推理能力,可根據問題難度高低生成不同長度的推理軌跡,同時搭配可調節的思考窗口,使得模型可以在預先設定的推理預算下實現高效的推理思考。

Z1:動態推理實現高效測試時擴展

本文的主要創新在于兩個層面:

1、數據層面:構建Z1-Code-Reasoning-107K數據集

作者創建了一個包含10.7萬條編程問題及其長短思維軌跡的數據集Z1-Code-Reasoning-107K。通過QwQ-32B模型生成原始軌跡后,逐步提高推理等級,使其保留從“直接求解”到“多步推導”的連續復雜度分布。這種數據設計確保了模型在訓練過程中能夠接觸不同復雜度的推理軌跡,從而提升其在實際任務中的適應能力。在此數據集上訓練得到的Z1模型具備天然的動態推理能力,并且可遷移至數學等代碼以外的推理任務。

2、機制層面:設計動態思考窗口(Shifted Thinking Window)

作者拋棄了硬性分隔符約束,設計了Shifted Thinking Window機制。對于簡單問題(如BigCodeBench-Hard中的基礎函數實現),模型自動觸發弱推理模式,可直接輸出答案;當遇到GPQA鉆石級難題時,則自動啟用強推理模式,在max thinking tokens閾值內自由推導并給出結果,如果思考超限則自動追加提示短語引導輸出答案。

二者結合,使Z1模型具備動態思考能力和預算調整能力,在使用較少thinking tokens的同時,保持較高的基準準確率,實現高效動態的推理。

圖片

△Z1方法的數據構建、訓練與動態思考范式

實驗結果

多個benchmark上的實驗結果

圖片

實驗證明,該方法在效率-效果平衡上實現顯著提升。

在包含880道競賽編程題的LiveCodeBench v5測試中,Z1-7B以35.3%準確率明顯超過其他開源7B思考模型,且平均思考token大大降低(R1-Distill-Qwen-7B需要四倍以上思考token才能達到相同性能)。

此外,僅使用代碼軌跡訓練也使模型在數學推理任務上的性能提升,例如在GPQA鉆石級科學難題上,Z1-7B以47.5%準確率超越原始Qwen2.5-Coder-7B(37.4%)10.1個百分點,同時減少28%的tokens消耗,揭示了此高效推理能力的泛化性。

Test-Time Scaling Evaluation

圖片在三個推理benchmark上的測試時擴展實驗可以看到,僅在代碼的推理數據上微調后的Z1-7B在代碼之外的任務上也實現了Test-time scaling的能力。

同時,相較于R1-Distill-Qwen-7B,Z1-7B的都能以更短的平均思考長度獲得更高的分數,體現其高效的測試時擴展能力。

這項研究證明,通過多樣性思考軌跡的混合訓練和動態計算資源分配,大模型能夠突破”暴力計算”的局限,自適應地在不同難度的任務中使用不同級別的推理時計算資源;同時這個模型也將非推理模型與長推理模型進行統一,為大型推理模型在高效思考方面的發展提供了重要的貢獻。

論文鏈接: https://arxiv.org/abs/2504.00810

代碼鏈接: https://github.com/efficientscaling/Z1

模型鏈接: https://huggingface.co/efficientscaling/Z1-7B

數據鏈接: https://huggingface.co/datasets/efficientscaling/Z1-Code-Reasoning-107K

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-05-30 02:00:00

獎勵模型RRMAI

2025-05-28 02:40:00

AdaptThink推理模型AI

2025-10-23 08:50:32

2025-03-05 00:22:00

2025-09-15 09:43:33

分層推理模型循環網絡推理

2025-06-10 03:30:00

2025-06-26 09:06:59

2025-03-11 08:50:00

2025-06-27 08:40:00

模型推理AI

2025-06-13 01:00:00

人工智能大型推理模型推理模型

2023-05-30 14:17:00

模型推理

2025-03-06 12:14:43

2025-11-04 01:43:00

循環語言模型架構

2025-01-21 13:15:16

搜索版Search-o1框架

2025-05-26 09:16:00

2024-09-24 11:01:03

2025-09-04 11:58:42

2025-06-05 11:49:21

AI模型數據

2025-06-11 14:39:50

AILLMMistral
點贊
收藏

51CTO技術棧公眾號

亚洲女人天堂视频| 一区二区欧美国产| 国产精品美乳一区二区免费| 影音先锋男人在线| 国产精品久一| 亚洲亚洲精品在线观看| 久久riav| 亚洲一区二区人妻| 欧美天天在线| 欧美哺乳videos| www黄色av| 久cao在线| 不卡av电影在线播放| 国产v综合ⅴ日韩v欧美大片| 182在线观看视频| 国产乱人伦精品一区| 91福利视频在线| 天天综合五月天| 黄色av网站在线免费观看| 国产在线不卡一区| 欧美亚洲成人网| 波多野结衣不卡视频| 丝袜av一区| 欧美一级欧美三级在线观看| 精品一卡二卡三卡| 欧美一卡二卡| 国产精品欧美久久久久一区二区| 国产69精品久久久久9999apgf| 无码人妻丰满熟妇精品区| 欧美激情日韩| 日韩在线视频免费观看| 亚洲第一精品夜夜躁人人躁 | 日产中文字幕在线精品一区 | 日韩视频免费观看高清完整版在线观看| 久草热视频在线观看| 欧美激情二区| 久久精品在这里| 国产精品久久久久久免费观看| 最近中文字幕av| 国产精品久久777777毛茸茸| 久久成人18免费网站| 中文字幕黄色网址| 蜜桃国内精品久久久久软件9| 日韩欧美亚洲国产另类 | 国产精品亚洲视频| 国产精品久久久999| 欧美亚洲精品天堂| 亚洲国产专区校园欧美| 欧美理论片在线观看| 亚洲综合图片一区| 日韩国产在线| 一区二区三区精品99久久| 国产黄色三级网站| 国产精品一区二区三区美女| 欧美成人精品福利| 日韩av福利在线观看| 日韩成人在线一区| 欧美偷拍一区二区| 日韩一区二区三区不卡视频| 亚洲第一会所| 日韩中文字幕一区二区三区| 久久男女视频| www.欧美三级电影.com| 黄色三级生活片| 成人精品天堂一区二区三区| 亚洲欧美国内爽妇网| 波多野结衣 在线| 亚洲第一福利社区| 亚洲欧美日韩精品久久奇米色影视| 国产伦精品一区三区精东| 超碰成人福利| 日韩av影视在线| 中文字幕在线观看的网站| 欧美福利在线播放网址导航| 亚洲国产毛片完整版| 国产美女视频免费观看下载软件| 动漫3d精品一区二区三区乱码| 精品成人佐山爱一区二区| 在线观看亚洲免费视频| 六月丁香久久丫| 亚洲欧美福利视频| av片在线免费看| 亚洲精品一区二区妖精| 欧美成人午夜激情在线| 国产一级视频在线观看| 国产一级一区二区| 国产精品看片资源| 国产精品久久久久久久免费| 国产二区国产一区在线观看| 国产一区二区三区奇米久涩 | 精品五月天久久| 精品无码国产污污污免费网站 | 色乱码一区二区三区熟女| 国内精品久久久久久野外| 一区二区三区免费| 狠狠97人人婷婷五月| 99热播精品免费| 日韩欧美国产精品| 免费黄色在线视频| 偷偷www综合久久久久久久| 欧美极品xxxx| 波多野结衣视频在线看| 国产成人av电影在线播放| 精品一区二区三区日本| 在线看的av网站| 亚洲aⅴ怡春院| 99热这里只有精品在线播放| 久久三级中文| 亚洲色图17p| 看片网站在线观看| 蘑菇福利视频一区播放| 亚洲一区二区三区久久| 青青九九免费视频在线| 亚洲免费三区一区二区| 黄色片一级视频| 欧美成人精品一级| 亚洲欧美综合另类中字| 青草草在线视频| 日韩av电影一区| 国产尤物99| 国产人成网在线播放va免费| 欧美性猛交xxxx乱大交蜜桃| 色姑娘综合天天| 成人同人动漫免费观看 | 欧美成人a∨高清免费观看| 精品少妇人妻一区二区黑料社区| 婷婷综合亚洲| 国产精品久久久久久久av大片| 黑人精品一区二区| 亚洲天堂免费在线观看视频| 50路60路老熟妇啪啪| 136福利精品导航| 色偷偷噜噜噜亚洲男人| 91丝袜一区二区三区| 国产成人99久久亚洲综合精品| 亚洲国产一区在线| 97成人资源| 亚洲大胆美女视频| 青娱乐免费在线视频| 久久成人免费电影| 亚洲不卡中文字幕| 欧美日韩视频网站| 精品视频在线导航| www.av麻豆| av男人天堂一区| 日韩精品在线观看av| 精品视频一区二区三区| 中文字幕亚洲综合久久筱田步美| 精品国产乱子伦| 久久嫩草精品久久久精品一| 给我免费播放片在线观看| 精品国产亚洲一区二区在线观看| 中文字幕国内精品| 一区二区国产欧美| 国产精品国产精品国产专区不片| 在线视频日韩一区 | 欧美a级黄色大片| 日本一区二区中文字幕| 中文字幕综合在线| 在线免费观看中文字幕| 国产精品天天摸av网| 艹b视频在线观看| 国产亚洲一区二区三区不卡| 日本aⅴ大伊香蕉精品视频| 日本a一级在线免费播放| 精品电影在线观看| 国产福利短视频| 午夜在线a亚洲v天堂网2018| 久久综合伊人77777麻豆| 亚洲福利影院| 国产亚洲一级高清| 亚洲熟妇av乱码在线观看| 国产精品对白交换视频 | 精品久久久无码人妻字幂| 日韩一级淫片| 97在线精品国自产拍中文| 亚洲欧美日韩免费| 91成人免费在线视频| 99国产精品无码| 国产福利一区二区| 国产日产欧美视频| 凹凸成人精品亚洲精品密奴| 成人a在线观看| 欧美78videosex性欧美| 日韩激情av在线播放| 天堂网视频在线| 国产精品成人免费精品自在线观看| 久久精品久久99| 亚洲人人精品| 三区精品视频观看| 日韩中文字幕| 欧美一级淫片videoshd| 日本中文字幕视频在线| 欧美成人性战久久| 波多野结衣 久久| 日韩毛片一二三区| 精品无码国产一区二区三区51安| 日韩av不卡一区二区| 国产精品啪啪啪视频| 国产精品成人久久电影| 国产精品美女久久久久| 91国自产精品中文字幕亚洲| 精品视频一二区| 91精品麻豆日日躁夜夜躁| 日本少妇裸体做爰| 中日韩av电影| 欧亚乱熟女一区二区在线| 日本aⅴ免费视频一区二区三区| 中文字幕在线乱| 九热爱视频精品视频| 亚洲va电影大全| 日韩毛片免费观看| 欧美丰满少妇xxxxx做受| 九九九伊在人线综合| 欧美变态口味重另类| 性高潮视频在线观看| 亚洲一二三区在线观看| 欧美午夜激情影院| 91在线视频观看| 91欧美一区二区三区| 噜噜噜91成人网| 久久久久久免费看| 欧美91视频| 四虎永久在线精品免费一区二区| 风间由美一区二区av101| 国产女精品视频网站免费| 国产直播在线| 欧美日本国产在线| 青青青青在线| 伊人av综合网| 日韩精品123| 亚洲成人网久久久| 亚洲精品无amm毛片| 欧美日韩在线精品一区二区三区激情 | 国产无限制自拍| 国产美女撒尿一区二区| 91精品免费看| 福利一区二区| 国产精品99久久久久久久久| 成人国产电影在线观看| 欧美日韩第一页| 国产黄色在线免费观看| 色婷婷综合成人av| 日本在线免费网| 国产一区二区三区中文 | 青青热久免费精品视频在线18| 亚州av一区二区| 丰乳肥臀在线| 欧美日韩国产999| 成人在线播放| 不卡av电影在线观看| 色多多视频在线观看| 色999日韩欧美国产| 北岛玲日韩精品一区二区三区| 亚洲免费电影一区| 你懂的在线网址| 亚洲欧美色婷婷| 国产成人愉拍精品久久| 亚洲动漫第一页| 久久久久久久久艹| 夜夜揉揉日日人人青青一国产精品| www.av免费| 亚洲人成在线播放网站岛国| 精品国产视频一区二区三区| 亚洲欧美在线aaa| 老妇女50岁三级| 亚洲永久免费av| 日本中文字幕在线免费观看| 精品国产乱码久久久久久天美 | 欧美视频免费| 一区二区免费在线视频| 天天做综合网| 97久久国产亚洲精品超碰热| 韩国欧美一区| 日韩欧美亚洲天堂| 日韩av一区二区在线影视| 亚洲色图 在线视频| 精品影院一区二区久久久| 亚洲欧美一区二区三区不卡| 国产精品99久久不卡二区| 自拍视频第一页| 97精品电影院| 一二三四国产精品| 亚洲精品久久久蜜桃| 伊人久久综合视频| 欧美日韩精品欧美日韩精品| 国产黄色av片| 亚洲欧美日本精品| 免费成人黄色| 激情综合网五月| 99re6热在线精品视频播放速度| 天堂av一区| 日韩av在线电影观看| 99国产精品一区二区| 久久久久久免费看| 日韩不卡免费视频| 天堂va欧美va亚洲va老司机| 972aa.com艺术欧美| 最新日韩免费视频| 五月天亚洲精品| 国产精品热久久| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 国产成人午夜高潮毛片| 欧美深性狂猛ⅹxxx深喉| 国产精品色在线观看| 亚洲国产精品午夜在线观看| 欧美影院一区二区| 亚洲精品国产精| 在线播放亚洲激情| www视频在线观看| 国产在线精品自拍| 亚洲理论电影| 阿v天堂2018| 久久国产精品无码网站| 免费成人深夜夜行p站| 亚洲欧美另类在线| 色老头在线视频| 亚洲国产成人爱av在线播放| 欧美激情黑人| 国产盗摄xxxx视频xxx69| 国产精品超碰| 一级一片免费播放| 日韩电影免费一区| xxxx黄色片| 亚洲一区二区三区视频在线 | 欧美一区二区日韩| 成人av一区| 中文在线播放一区二区| 中文字幕日韩精品一区二区| 西西裸体人体做爰大胆久久久| 欧美专区第二页| 国产精品青草久久| 国产一级片av| 亚洲久久久久久久久久久| 男插女视频久久久| 亚洲一区亚洲二区亚洲三区| 大片网站久久| 五月婷婷狠狠操| 久久久99久久| 中文字幕一区二区人妻视频| 亚洲国产一区自拍| 678在线观看视频| 97超碰人人看人人| 自拍偷拍欧美| 久久久精品视频国产| 亚洲桃色在线一区| 亚洲天堂免费av| 色青青草原桃花久久综合| 浪潮色综合久久天堂| 快播亚洲色图| 男人的天堂成人在线| 国产av自拍一区| 大伊人狠狠躁夜夜躁av一区| 日韩在线视频观看免费| 久久久亚洲影院| 免费福利视频一区| 国产无套内射久久久国产| 成人av在线资源| 久久99国产综合精品免费| 亚洲精品影视在线观看| 88xx成人免费观看视频库 | 亚洲黄色一级大片| 久久久噜噜噜久久| 欧美日韩一区二区三区在线电影| 久久免费视频3| 久久久久久久久久久久久女国产乱| 一级黄色在线视频| 中文字幕在线精品| 色悠久久久久综合先锋影音下载| 8x8x华人在线| av电影在线观看一区| 蜜臀精品一区二区三区| 日韩中文字幕在线看| 亚洲精品高潮| 国产中文字幕免费观看| 中文字幕乱码亚洲精品一区 | 日韩专区在线视频| 最新黄色av网址| 欧美成人精品1314www| 小草在线视频免费播放| 天天好比中文综合网| 国产精品一二三四五| 91香蕉在线视频| 最近2019年好看中文字幕视频 | 国产视频一区三区| 欧美第一区第二区| 黄色网页在线看| 国产亚洲精品美女久久久m| 另类天堂av| 91日韩中文字幕| 亚洲欧美日韩爽爽影院| 欧美亚洲综合视频| 日韩精品 欧美| 国产精品高潮呻吟| 丝袜视频国产在线播放| 成人www视频在线观看| 国产一区二区你懂的| 性生交大片免费全黄| 亚洲精品成人网| 视频欧美精品|