精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理“剎不住車”?新框架讓DeepSeek-R1們告別過度思考,已開源

人工智能 新聞
來自浙江大學、天津大學和MSRA的研究團隊提出了一個新方法,Self-Braking Tuning(SBT)。

DeepSeek-R1、OpenAI o1等推理模型大放異彩。但隨著能力增強,一個副作用越來越明顯——

它們開始想太多了

從奧數題到程序邏輯,能解的題越來越多、推理鏈條越來越長。

也就是說,模型在完成推理任務時,常常出現過度思考

  • 步驟繁冗:明明兩步能解完,非要繞七八步,搞得邏輯鏈又長又亂;
  • 表述拖沓:簡單結論非要用復雜語言兜圈子,說了一堆才到點子上;
  • 輸出冗長:生成了大量無效tokens,既浪費算力,又拖慢推理速度。

這不光影響效率,更可能導致錯誤——在長鏈式思考中,每一步的小誤差都會累積放大,最后可能想著想著就跑偏了。

于是,一個關鍵問題擺在了現實面前:

如何讓模型既然會思考推理,也懂得“適可而止”,知道什么時候該停下來?

針對于此,來自浙江大學、天津大學和MSRA的研究團隊提出了一個新方法,Self-Braking Tuning(SBT)。

它是一種輕量級、通用的調優機制,可無縫集成到現有大模型中。其主要目的是讓模型不再一味求“多想”,而是在最短路徑上到達正確答案。

其核心設計包括剎車信號機制、多任務微調,且無需外部模塊或改動推理流程。

其中,剎車信號機制是在訓練階段引入一類特殊的信號,指示“當前信息已經足夠完成任務”,模型據此學習何時應終止推理。

多任務微調則指揮模型同時學習如何解題&何時停步,兼顧準確性與效率。

總結成一句話,SBT就像在大模型頭腦里裝了個“限速器”,讓它不再無休止地輸出,更聰明,也更節能。

圖片

讓模型知道自己“是否想太多”

SBT框架的核心目標,是讓模型具備自我判斷是否“想得太多”的能力,能夠在無需外部干預的情況下,適時終止推理過程。

圖片

它的特別之處在于,不依賴外部規則或指令,而是從模型內部出發,重塑模型對自身思考狀態的理解與掌控力。

簡單來說,就是讓模型像人一樣,在覺得“想得差不多了”時,能夠自然地停下來,而不是無休止地繼續推理。

圖片

構建過度推理識別指標體系

為了更有效地識別推理過程中可能出現的冗余部分,研究團隊構建了一套參考標準答案的評估體系。

他們將推理劃分為兩個主要階段:基礎方案(Foundation Solution)和進化方案(Evolution Solution)。

前者是模型在初步理解問題后給出的第一輪解答,而后者則是大模型后續對這一初始方案的進一步思考、補充和驗證。

基于此,團隊提出了兩個核心指標:推理效率比和過度推理標記比。

推理效率比衡量表示的是模型在達到第一個正確答案所需的推理步驟與整個推理過程總步驟的比例。

比例越接近1,表示模型的推理效率越高,過度推理的可能性越低。

過度推理標記比則通過分析推理過程中的語言模式,識別與過度推理行為相關的特定詞匯,如 “Wait”“But”“However” 等,來量化過度推理的嚴重程度。

這兩種指標相互補充,從結構和語言兩個維度全面評估推理過程中的冗余程度。

創新性數據構建策略

研究團隊基于上述指標體系,開發了Self-Braking Tuning Exact(SBT-E)和Self-Braking Tuning Dynamic(SBT-D)兩種互補的數據構建策略。

SBT-E采用了一種統一的截斷策略,對每條推理路徑進行結構化處理。

在存在過度推理的案例中,保留模型生成的基礎解決方案以及一個進化方案,并補充一小段被掩碼的后續內容。

這樣的設計有助于模型在訓練時明確區分哪些推理是必要的,哪些則是多余的,從而逐步學會控制推理的深度,避免無效延展。

SBT-D則采用逐步適應的策略,根據不同問題的特點動態調整推理長度。

從完整保留基礎解決方案開始,逐步添加后續推理步驟,并在每一步重新計算過度推理分數。當分數超過預設的閾值時,停止添加推理步驟,并將超出部分進行掩碼處理。

這種方法使得模型能夠在不同復雜度的問題上自適應地終止推理,避免過度推理的發生。

自我調節制動策略

除了數據構建策略外,研究團隊還引入了自我調節制動策略,進一步增強模型對推理過程的自我控制能力。

在SBT-E和SBT-D構建的數據樣本里,研究團隊對推理過程的后期冗余部分進行了掩碼處理。

這就像給模型的推理之路設置關卡,擋住那些非必要的重復思考。

模型能看見這些被掩碼的內容,但在訓練時,這些部分不會計入損失函數,仿佛是“只展示不考核”。

通過這種方式,模型逐漸學會聚焦關鍵推理步驟,不再深陷無意義的冗余思考,從而提升推理效率。

除了對冗余推理部分進行掩碼處理,SBT框架還引入了自然語言提示機制,作為引導模型停步的輔助方式。

這些提示以簡潔的語言表達模型當前的判斷,例如:”Wait, my answer is too verbose. Let me answer it more concisely”。

借助語言模型對語義的理解能力,這種方式能夠在推理過程中起到提醒作用,幫助模型識別信息已足夠、無需繼續展開,從而減少無謂生成,提升整體推理的效率與簡潔性。

實現“少思考但不失準確”的效果

在數學推理基準測試(AIME、AMC、MATH500、GSM8K)上,研究團隊對SBT框架進行了廣泛的實驗評估。

從實驗結果來看,SBT框架在多個數學推理數據集上展現出了顯著的性能提升,尤其是在推理效率方面,取得了前所未有的進展。

圖片

相比于傳統的完整推理過程,SBT通過識別并主動規避冗余推理步驟,實現了“少思考但不失準確”的效果。

以Llama-3.1-8B-Instruct模型為例,應用SBT-E策略后,模型在推理過程中生成的token數量減少了62.8%,但最終的準確率仍穩定維持在94.1%。

更為重要的是,這一方法在多個模型架構和規模下均表現出高度的穩定性和通用性,充分證明了其方法論的魯棒性和推廣價值。

它不僅證明了大量推理內容在實際任務中是冗余的,而且表明這些冗余部分的剔除不會損害模型對復雜數學問題的理解與解答能力。

論文地址:https://arxiv.org/pdf/2505.14604

項目主頁:https://ZJU-REAL.github.io/SBT

GitHub:https://github.com/ZJU-REAL/Self-Braking-Tuning

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-19 08:00:00

2025-04-11 14:54:44

2025-05-06 09:09:37

2025-02-08 09:44:11

DeepSeekAI模型

2025-03-05 03:00:00

DeepSeek大模型調優

2025-03-19 09:52:50

2025-03-06 17:29:21

2025-02-13 08:51:23

DeepSeek大模型

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-02-12 12:45:59

2025-02-17 08:43:00

模型推理訓練

2025-02-07 13:10:06

2025-02-03 14:17:27

2025-02-19 08:33:18

2023-05-05 10:16:39

2025-02-06 09:11:54

2025-04-09 10:40:32

點贊
收藏

51CTO技術棧公眾號

亚洲aⅴ男人的天堂在线观看| 欧美一区二区免费| 热舞福利精品大尺度视频| 亚洲免费视频二区| 欧美影视一区| 亚洲欧美资源在线| 少妇愉情理伦片bd| 欧美激情喷水| 亚洲欧美另类综合偷拍| 精品午夜一区二区三区| 制服丝袜在线一区| 欧美午夜一区| 在线观看欧美视频| 久久久高清视频| 青草综合视频| 色天天综合色天天久久| 51xx午夜影福利| 国产三级视频在线播放线观看| 麻豆成人久久精品二区三区小说| 美日韩在线视频| 欧美黑人欧美精品刺激| 日韩精品第二页| 疯狂做受xxxx高潮欧美日本| 黄色一级片网址| 可以直接在线观看的av| 丰满亚洲少妇av| 国产欧美日韩精品丝袜高跟鞋| 免费网站看av| 97精品97| 中文字幕欧美专区| 中文字幕av观看| 日韩精品中文字幕吗一区二区| 福利微拍一区二区| 久草视频国产在线| 亚洲妇熟xxxx妇色黄| 日本一区二区三区视频视频| 精品高清视频| 亚洲欧美另类综合| 韩国欧美一区二区| 国产精品影片在线观看| 国产91精品看黄网站在线观看| 欧美福利视频| 日韩视频免费观看| 四虎影视1304t| 欧洲乱码伦视频免费| 国产视频精品免费播放| 国产又粗又猛又色| 高潮按摩久久久久久av免费| 日韩精品一区二区三区蜜臀| 中文字幕55页| 色999久久久精品人人澡69| 在线免费视频一区二区| 超碰影院在线观看| 欧美日韩大片| 在线观看日产精品| 黄色手机在线视频| 免费视频成人| 51精品久久久久久久蜜臀| 欧美日韩一区二区三区69堂| 九九久久国产| 91精品国模一区二区三区| 亚洲精品mv在线观看| 91精品网站在线观看| 欧美高清视频一二三区 | 国产精品一二| 欧洲美女免费图片一区| 免费精品一区二区| 蜜桃视频第一区免费观看| 国产精品色视频| 国产又大又黄又爽| 国产成人aaa| 精品国产一区二区三区麻豆免费观看完整版 | 不卡av中文字幕| 国产电影精品久久禁18| 91久久精品在线| 黄色美女一级片| 久久日韩粉嫩一区二区三区| 色涩成人影视在线播放| 久热国产在线| 亚洲国产成人91porn| 1024精品视频| 日本a人精品| 日韩精品一区二区三区视频播放| 国产高潮视频在线观看| 亚洲精品小区久久久久久| 亚洲偷熟乱区亚洲香蕉av| 亚洲精品一区二区三区在线播放| 婷婷久久一区| 午夜精品一区二区三区在线 | aaa在线观看| 亚洲激情图片qvod| 免费观看日韩毛片| 四虎国产精品成人免费影视| 激情aⅴ欧美一区二区欲海潮| 欧美aaa在线| 亚洲xxxx做受欧美| 欧美日本网站| 亚洲狠狠丁香婷婷综合久久久| 国产日韩欧美精品在线观看| 国产超碰精品| 欧美成人午夜电影| 亚洲精品成人无码| 欧美日韩天堂| 国产精品一区二区三| 韩国中文字幕hd久久精品| 日本一区二区成人在线| 草草视频在线免费观看| 国产精品字幕| 亚洲成色777777在线观看影院| 中文字幕第4页| 韩国一区二区三区在线观看| 国产精品爱久久久久久久| 亚洲精品无遮挡| 国产精品免费久久| 日本日本19xxxⅹhd乱影响| 国产精品**亚洲精品| 亚洲免费av网址| 久久丫精品久久丫| 经典三级在线一区| 亚洲v国产v在线观看| 黄色在线免费观看网站| 精品免费视频.| 欧美风情第一页| 视频一区中文字幕| 国产一区二区精品免费| 亚洲图区一区| 欧美一区二区三区免费在线看| 老司机福利av| 91久久黄色| 99在线看视频| 亚洲婷婷噜噜| 日韩一区二区电影网| 国产视频精品免费| 蜜桃传媒麻豆第一区在线观看| 黑人中文字幕一区二区三区| 日日夜夜天天综合入口| 欧美日韩高清一区二区三区| 美国黄色特级片| 日韩精品免费专区| 欧美日韩精品一区| 成人一区福利| 亚洲欧美中文日韩v在线观看| 久久久久亚洲av片无码下载蜜桃| 日本在线播放一区二区三区| 欧美在线视频二区| 日韩欧美一区二区三区在线观看| 亚洲第一免费网站| 日本少妇bbwbbw精品| 懂色av噜噜一区二区三区av| av影院在线播放| 风间由美性色一区二区三区四区| 欧美成人h版在线观看| av中文字幕免费| 一区二区成人在线视频| 中文字幕乱码在线人视频| 欧美激情 亚洲a∨综合| 操人视频欧美| √8天堂资源地址中文在线| 亚洲国产女人aaa毛片在线| 日韩久久久久久久久| 26uuu另类欧美亚洲曰本| 国产麻花豆剧传媒精品mv在线| 日韩极品在线| 国产精品国产亚洲伊人久久| 在线免费av网站| 91精选在线观看| 国产精品30p| 久久亚洲一区二区三区明星换脸| 免费成人在线视频网站| 精品久久91| 成人激情在线观看| 欧美xxxx做受欧美88bbw| 亚洲精品电影久久久| 伊人成年综合网| 亚洲欧美日韩在线不卡| 宇都宫紫苑在线播放| 亚洲福利电影| 色乱码一区二区三在线看| 激情久久免费视频| …久久精品99久久香蕉国产| 成年人在线观看网站| 91精品国产综合久久久久 | 亚洲丝袜制服诱惑| 99久久久无码国产精品性波多| 亚洲激情黄色| 亚洲巨乳在线观看| 91久久精品无嫩草影院| 秋霞成人午夜鲁丝一区二区三区| yourporn在线观看视频| 欧美一二三四区在线| 中文字幕精品三级久久久| 国产精品入口麻豆原神| 日韩少妇一区二区| 美女网站一区二区| 3d动漫一区二区三区| 日韩一区三区| 久久国产精品一区二区三区四区 | 欧美日韩国产大片| 天海翼一区二区| 中文字幕一区日韩精品欧美| 男女性杂交内射妇女bbwxz| 日韩激情在线观看| www精品久久| 欧美oldwomenvideos| 精品在线视频一区二区| 中文字幕日本一区| 日本一本a高清免费不卡| 中文字幕中文字幕在线十八区| 日韩精品免费综合视频在线播放| 亚洲视频在线观看一区二区| 天天综合网 天天综合色| 特一级黄色录像| 国产欧美一区二区精品婷婷 | 日韩在线欧美在线| 亚洲 小说区 图片区 都市| 91麻豆精品国产91久久久资源速度 | 中文字幕亚洲一区二区av在线 | 久久麻豆视频| 5566成人精品视频免费| 中文字幕有码在线视频| 中文字幕在线看视频国产欧美在线看完整 | 热舞福利精品大尺度视频| 97久久综合区小说区图片区| 国产欧美精品va在线观看| 婷婷午夜社区一区| 欧美性在线视频| av今日在线| 欧美大荫蒂xxx| 国产在线激情| 菠萝蜜影院一区二区免费| 美丽的姑娘在线观看免费动漫| 91精品国产综合久久久久久久久久| 久久久久久久久久影院| 亚洲一区二区av在线| 亚洲成人生活片| 亚洲啪啪综合av一区二区三区| 亚洲码无人客一区二区三区| 99re66热这里只有精品3直播| 日本女人黄色片| 国产另类ts人妖一区二区| 天天干天天色天天干| 精品一区二区免费在线观看| 狠狠干狠狠操视频| 久久激情五月激情| 国产在线观看中文字幕| 国产一区不卡精品| 熟妇女人妻丰满少妇中文字幕| 激情av综合网| 午夜免费视频网站| 国产精品123| 娇妻高潮浓精白浆xxⅹ| 成人av手机在线观看| 日本japanese极品少妇| 91麻豆精东视频| av电影网站在线观看| 国产免费成人在线视频| 婷婷丁香综合网| 自拍偷拍国产精品| 久久久久99精品| 日韩欧美国产一区二区| 中文字幕在线日本| 欧美日韩一区 二区 三区 久久精品| 久久午夜鲁丝片| 91精品欧美综合在线观看最新 | 精品国产乱码久久久久久1区2区 | 最新精品视频| 国产真实久久| 日日摸日日碰夜夜爽av| 老司机午夜精品视频在线观看| 激情网站五月天| 麻豆传媒一区二区三区| 日韩精品――色哟哟| 91美女在线观看| 色www亚洲国产阿娇yao| 亚洲精品久久嫩草网站秘色| 99热国产在线观看| 欧美亚洲精品一区| av中文字幕在线免费观看| 亚洲第一区在线| yw193.com尤物在线| 欧美黑人xxxx| 日本在线中文字幕一区二区三区| 国产精品免费电影| 亚洲精品一区在线| 色爱区成人综合网| 国产精品s色| 91淫黄看大片| 成人免费精品视频| 日本不卡一区视频| 婷婷成人激情在线网| 一级aaaa毛片| 亚洲国内精品视频| 日本中文字幕电影在线免费观看| 欧美尺度大的性做爰视频| 伊人色综合一区二区三区影院视频| 国产精品福利在线观看| 在线一区二区三区视频| 五月天色一区| 亚洲精品一级| 日韩精品aaa| 久久精品视频一区| 久草中文在线视频| 欧美日韩亚洲综合在线| 香蕉视频网站在线| 欧美高清videos高潮hd| 国产精品4hu.www| 久久精品国产理论片免费| 欧美 日韩 国产精品免费观看| 国产欧美日韩网站| 国产美女精品人人做人人爽| 性高潮久久久久久久 | 天干夜夜爽爽日日日日| 欧美va亚洲va在线观看蝴蝶网| 久久久久久青草| 亚州成人av在线| 久久精品 人人爱| 欧美一区二区福利| 在线观看不卡| 波多野结衣在线免费观看| 国产欧美一区二区精品性色| 欧美亚洲精品天堂| 亚洲成人黄色在线| av免费在线观看网站| 国产在线视频不卡| av一区二区在线观看| 国产裸体免费无遮挡| 2017欧美狠狠色| 国产成人精品片| 亚洲国产欧美自拍| 动漫一区二区| 99久久一区三区四区免费| 亚洲综合小说| 亚洲精品中文字幕乱码无线| 国产精品久久久久影院亚瑟| 午夜精品久久久久久久蜜桃| 亚洲精品综合久久中文字幕| av免费在线视| 国产三区二区一区久久| 国产精品va| 日本50路肥熟bbw| 亚洲国产aⅴ成人精品无吗| xxxx国产精品| 午夜精品一区二区三区在线视| 欧美日韩黄网站| 欧美成人精品免费| 成人污污视频在线观看| 国产亚洲精品久久777777| 日韩免费观看高清完整版| 色呦呦网站在线观看| 波多野结衣久草一区| 在线国产欧美| 成人免费av片| 在线观看成人免费视频| 18免费在线视频| 91精品在线影院| 国产精品国码视频| www.啪啪.com| 91成人在线免费观看| 三区四区在线视频| 99免费在线视频观看| 一区在线播放| 亚洲永久精品ww.7491进入| 在线观看中文字幕不卡| 色大18成网站www在线观看| 91在线短视频| 午夜一级久久| 天美传媒免费在线观看| 日韩欧美电影一区| 欧美伦理91| 亚洲国产综合自拍| 国产丶欧美丶日本不卡视频| 国产精品一区二区6| 中文字幕精品久久| 日韩精品一区二区三区中文 | 日韩三级视频在线看| ****av在线网毛片| 天堂精品视频| 国产成人精品午夜视频免费| 99热在线观看免费精品| 国产一区二区三区在线| 韩国三级大全久久网站| 日韩avxxx| 最新成人av在线| 天天操天天射天天舔| 国产日韩欧美日韩| 在线观看亚洲| 激情高潮到大叫狂喷水| 精品国产a毛片| 青青国产精品| 精品人妻一区二区三区四区在线| 中文字幕免费不卡在线| 性猛交富婆╳xxx乱大交天津| 97视频免费看| 亚洲乱码在线| 久久成人激情视频| 精品久久五月天| 日韩黄色三级| 欧美视频免费播放| 亚洲黄色性网站| av在线电影网|