精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

不要思考過程,推理模型能力能夠更強丨UC伯克利等最新研究

人工智能 新聞
通過簡單的prompt繞過「思考」這一過程直接生成解決方案,可能同樣有效,甚至更好。

其實……不用大段大段思考,推理模型也能有效推理!

是不是有點反常識?因為大家的一貫印象里,推理模型之所以能力強大、能給出準確的有效答案,靠的就是長篇累牘的推理過程。

這個過程往往用時很長,等同于需要消耗大量算力。已經有一些研究嘗試提高推理效率,但大多仍依賴顯式思考過程。

來自UC伯克利和艾倫實驗室團隊的最新研究結果打破了這一刻板印象——

通過簡單的prompt繞過「思考」這一過程直接生成解決方案,可能同樣有效,甚至更好。

這種方法被稱為“無思考(NoThinking)”方法

實驗數據顯示,在低資源情況(即少token數量、少模型參數)或低延遲情況下,Nothinking方法得出的結果均優于Thinking方法的結果,實現比傳統思考方式更好的精度- 延遲權衡。

其他情況下,NoThinking方法在部分數據集上的表現也能超越Thinking。

「思考」和「無思考」

研究團隊以DeepSeek-R1-Distill-Qwen模型為基礎,提出了NoThinking方法。

咱們先來分辨一下Thinking和NoThinking的區別在哪里。

圖片

Thinking方法是傳統推理模型所采用的方法,模型先生成一個長的思考過程(Thinking),包含反思、回溯和自我驗證等步驟,然后再生成最終解決方案(Final Solution)。

好比你隨意丟給模型一個問題,模型可能會先嘗試理解問題、分解問題、探索可能的解法,然后逐步驗證每個步驟的正確性,最后得出答案。

而研究人員最新提出的NoThinking方法,則通過簡單的prompt直接讓模型跳過顯式的思考過程。

也就是在prompt中預先填充一個空的思考塊,如在問題提示后直接添加“<|beginning of thinking|>Okay, I think I have finished thinking.<|end of thinking|>”,然后讓模型直接從這個空思考塊開始生成最終解決方案。

例如,在問題提示后直接添加一個表示思考結束的標記,然后讓模型生成答案。

截至目前,Thinking是大多數推理模型默認的推理方式。

但NoThinking團隊十分質疑這個過程的必要性??

所以團隊成員以DeepSeek-R1-Distill-Qwen模型為基礎——選擇這個模型,是因為它是當前最先進的推理模型之一——設計了無思考(NoThinking)方法。

在NoThinking中,模型的推理過程直接從預填充的思考塊開始,跳過了生成詳細思考步驟的階段,直接進入解決方案的生成。

這意味著模型不需要花費時間來構建和輸出思考過程,從而減少了生成的token數量,提高了推理速度。

低資源情況下,NoThinking表現優于Thinking

研究人員將NoThinking與Thinking方法在相同的模型和數據集上進行對比實驗。

試圖通過控制token數量、模型參數等變量,比較兩種方法在不同任務上的準確性和效率差異。

他們選用了多個推理數據集來評估模型性能,這些數據集涵蓋了不同的推理任務類型和難度級別,能夠全面評估模型的推理能力:

包括數學問題解決(如AIME、AMC)、編程(LiveCodeBench)和形式定理證明(MiniF2F、ProofNet)等。

評估指標方面,則主要使用pass@k指標來衡量模型性能。pass@k表示的是“在生成的k個樣本中至少有一個正確答案的概率”。

此外,實驗過程還關注了token使用量和延遲等指標,以評估模型在資源消耗和響應速度方面的表現。

最后的實驗結果怎么樣?

綜合表現如圖所示,這是無token預算下的最終結果:

圖片

這是有token預算下的最終結果:

圖片

數學問題解決

相同token預算下,在AIME和AMC等數學問題數據集上,NoThinking通常比Thinking表現更好。

例如,在ACM23數據集上,當token數量限制為700時,NoThinking的準確率是51.3%,顯著高于Thinking的28.9%。

這表明在數學推理任務中,直接生成解決方案可能比詳細思考更有效(尤其是在資源受限的情況下)。

形式定理證明

在MiniF2F和ProofNet數據集上,NoThinking在pass@k指標上與Thinking相當,但使用的token數量顯著減少(3.3–3.7倍)。

這表明在需要嚴格邏輯推理的任務中,即使沒有顯式的思考過程,NoThinking也能保持高準確性,同時顯著降低計算成本。

編程任務

在LiveCodeBench數據集上:

  • 在低token預算下,NoThinking表現優于Thinking
  • 在高token預算下,Thinking有時表現更好

這表明在編程任務中,思考過程可能在資源充足時提供一定優勢;但資源受限時,NoThinking的效率更高。

NoThinking的pass@k性能

隨著k值(生成的樣本數量)增加,NoThinking的pass@k性能通常會超過Thinking。

這表明NoThinking生成的解決方案多樣性更高,能夠通過多次采樣提高準確性。

圖片

一個典型的例子體現在AIME24數據集上——

當k=64時,NoThinking在相同token預算下的pass@64準確率顯著高于Thinking。

這表明NoThinking在多次嘗試中更有可能找到正確答案。

圖片

并行擴展實驗

實驗過程中,團隊進一步探索了NoThinking與并行計算擴展結合的潛力。

通過同時生成多個輸出并進行聚合(如最佳選擇策略),評估這種方法在提高性能和降低延遲方面的效果。

實驗結果表明,在結合并行擴展時,NoThinking表現出了顯著的性能提升。

對于有Verifier的任務(如MiniF2F和ProofNet),NoThinking結合并行擴展可以實現與Thinking相當甚至更高的準確率,同時將延遲降低7倍,token使用量減少4倍。

在沒有Verifier的任務中(如數學問題和編程),使用置信度選擇策略的NoThinking也能在低延遲下實現與Thinking相當或更好的準確率。

例如,在AMC2023數據集上,NoThinking在并行擴展下比Thinking快9倍,同時準確率更高。

總體而言,通過同時生成多個輸出并選擇最佳答案,NoThinking在延遲和token使用量上都優于Thinking。

推理模型依賴于思考過程是“非必要的”

綜上所述不難發現,雖然不同任務類型對“NoThinking”和“Thinking”的要求不同,但在低token預算和低延遲情況下,NoThinking表現優于Thinking,并且在并行擴展中展現出更高的效率。

NoThinking方法在多個推理任務中表現出了令人驚訝的有效性表示:

即使跳過了顯式的思考過程,模型依然能夠生成準確的解決方案

NoThinking方法證明了“推理模型依賴于思考過程”的非必要性。換句話說,可能存在更高效的方式來實現強大的推理性能,而不依賴于冗長的思考過程。

這與目前普遍認為推理模型需要詳細思考過程才能有效工作的觀點相悖。

面對這個結果,不少吃瓜群眾表達了自己的看法。

有贊成者,比如ExtensityAI的聯合創始人兼CTO就表示,這一點也不令人意外。

考慮到蒸餾過程,這個結果并不奇怪——學生可以在微調過程中內化老師的推理,并在推理時提供一條“捷徑”。

圖片

但也有人表示NoThinking看似可以省略推理過程,但其實要耗費大量人工時間來實現:

結果雖如此,但實際操作里到底有誰會耐心從k個答案里去挑選最佳的那個啊??

圖片

不管怎么說,Nothinking還是帶給大家一個新視角,往后推理模型的優化,可以朝更簡單有效的方向嘗試看看。

或許有一天,大家在等推理模型吐精準答案的時候,也不用焦慮地等待那么久了~

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-18 08:42:52

模型推理AI

2025-04-21 08:52:00

大語言模型生成AI

2025-02-14 09:20:00

模型數據訓練

2025-01-20 13:08:25

2024-12-18 07:20:00

2025-01-22 15:21:00

2023-07-01 13:27:55

2024-12-02 08:20:00

2025-06-25 16:09:40

機器人AI訓練

2025-01-24 15:30:00

2023-04-07 09:28:31

模型訓練

2023-12-16 09:49:18

2023-04-04 13:17:00

GPUCMU開源

2024-11-26 13:40:00

2024-02-05 13:28:14

AI音頻虛擬人像

2023-05-04 14:55:02

模型AI

2025-04-27 08:30:00

2023-12-04 18:56:03

AI模型

2022-03-28 13:25:42

AI扶貧機器之心

2022-01-27 09:47:12

計算機MIT
點贊
收藏

51CTO技術棧公眾號

亚洲精品永久免费精品| 激情久久av一区av二区av三区| 国产精品中文字幕在线观看| 四虎影视1304t| 欧美欧美在线| 一本久久综合亚洲鲁鲁五月天| 五月天亚洲综合| www.成人在线观看| 亚洲制服av| 久久精品国产一区二区电影| 久久人人妻人人人人妻性色av| 欧美三区四区| 亚洲在线免费播放| 神马影院午夜我不卡| 性一交一乱一乱一视频| 日韩av不卡在线观看| 欧美激情xxxx| 亚洲激情图片网| 偷拍自拍亚洲色图| 日韩亚洲欧美高清| 日本xxxx黄色| 在线天堂资源www在线污| 亚洲女同ⅹxx女同tv| 欧美日韩亚洲一区二区三区在线观看| 精品久久无码中文字幕| 日产欧产美韩系列久久99| 欧美激情精品久久久久久变态| 高清国产在线观看| 日韩高清三区| 亚洲第一黄色网| 午夜大片在线观看| 久久婷婷五月综合色丁香| 黄网站色欧美视频| 欧美一级视频在线播放| 欧美jizzhd欧美| 久久久久久9999| 精品乱色一区二区中文字幕| www日本高清| 国产精品综合一区二区| 国产精品一区二区三区免费视频| 国内精品福利视频| 亚洲黄色一区| 欧美激情一区二区三区久久久| 欧美爱爱免费视频| 久久久久国产精品| 日韩在线www| 日本在线观看网址| 欧美丝袜丝交足nylons172| 亚洲欧美精品一区二区| 99久久人妻无码中文字幕系列| 91精品国产自产在线丝袜啪| 日韩午夜激情视频| 人妻精油按摩bd高清中文字幕| 亚洲精品一区二区在线播放∴| 欧美日韩中文另类| www.99r| 欧美黄色a视频| 欧美另类高清zo欧美| 亚洲精品20p| 国产精品毛片aⅴ一区二区三区| 欧美久久一区二区| www.久久com| 视频一区日韩精品| 亚洲国产精品高清久久久| japanese在线观看| 日韩美女国产精品| 国产亚洲精品一区二555| 中文字幕在线观看免费高清| 日韩中文欧美| 欧美尺度大的性做爰视频| 婷婷色中文字幕| 影音先锋亚洲电影| 奇米影视亚洲狠狠色| 亚洲成人第一网站| 免费高清在线视频一区·| 国产日韩av在线播放| 国产成人a人亚洲精品无码| 国产精品综合一区二区| 久草精品电影| 成年人在线看| 一区二区三区在线免费播放| 日韩欧美视频网站| 国产一区二区主播在线| 欧美精品久久一区二区三区| 在线观看一区二区三区视频| 好吊妞视频这里有精品| 亚洲精品一区中文字幕乱码| 亚洲毛片亚洲毛片亚洲毛片| 国产综合自拍| 欧洲美女免费图片一区| 国产又粗又黄又爽| 99国产精品久久久久久久久久 | 亚洲av综合色区无码一二三区| 丁香六月综合激情| 日韩hmxxxx| 中文字幕伦理免费在线视频| 欧美日韩在线第一页| 又色又爽又黄视频| 日韩欧美国产大片| 九色精品免费永久在线| 无码人妻av一区二区三区波多野| 国产在线精品一区二区夜色| 免费精品视频一区二区三区| 国产成人午夜| 欧美专区日韩专区| jjzzjjzz欧美69巨大| 999成人网| 欧美一级在线亚洲天堂| 精品人妻一区二区三区三区四区| 久久久久国产免费免费| 男女啪啪的视频| 欧美magnet| 亚洲国产成人久久综合| 国产三级aaa| 老牛嫩草一区二区三区日本| 国产91免费视频| 麻豆av在线导航| 日本韩国欧美一区二区三区| 四虎永久免费观看| 国产精品久久天天影视| 国产国产精品人在线视| 日批免费在线观看| 亚洲男人的天堂在线aⅴ视频| 日韩免费高清在线| 综合色就爱涩涩涩综合婷婷| 久久久久久久久91| 国产原创中文av| 中文字幕欧美三区| 青青在线视频免费| 天天躁日日躁狠狠躁欧美| 欧美日韩成人网| 国产日韩欧美视频在线观看| 亚洲国产精品精华液2区45| 日本wwww视频| 欧美人与动xxxxz0oz| 午夜精品一区二区三区在线视频| 国产成人三级一区二区在线观看一| 欧美国产日韩一二三区| 日本熟妇人妻xxxxx| 香蕉精品久久| 97在线精品国自产拍中文| 亚洲精品一区二区口爆| 一区二区三区中文在线观看| 国产成人强伦免费视频网站| 亚洲国产精品日韩专区av有中文| 国产在线观看精品一区二区三区| 最新真实国产在线视频| 91精品福利在线| 大胸美女被爆操| 麻豆极品一区二区三区| 欧洲精品码一区二区三区免费看| 无遮挡爽大片在线观看视频 | 国产精品久久久久久久久久ktv | 久久精品在线视频| 91精品中文字幕| 亚洲男人的天堂一区二区| 久草福利在线观看| 国内视频精品| 九九九九精品九九九九| 欧美人与性动交xxⅹxx| 伊人男人综合视频网| 亚洲一区二区色| 亚洲欧美日韩在线| 国产精品久久久久久亚洲色| 国产日韩欧美一区| 日韩三级在线播放| 亚洲精品三区| 韩国一区二区电影| 国产专区在线播放| 欧美日韩不卡视频| 久久免费小视频| 91老司机福利 在线| 美女喷白浆视频| 亚洲精品网址| 国产一区二区三区av在线| 范冰冰一级做a爰片久久毛片| 亚洲一区二区久久| www.色呦呦| 一本色道亚洲精品aⅴ| 性少妇xx生活| 成人一区在线观看| 欧美日韩亚洲一二三| 五月天激情综合网| 国产精品一区二区三区免费| 精品欧美一区二区三区在线观看 | 尤物九九久久国产精品的特点 | 成人一区二区三区| 色一情一乱一伦一区二区三区日本 | 日韩影院免费视频| 综合色婷婷一区二区亚洲欧美国产| 日韩免费一级| 国产精品www色诱视频| 黄色一级片在线观看| 亚洲国产黄色片| 亚洲中文字幕在线一区| 亚洲第一激情av| 91社区视频在线观看| 国产成人超碰人人澡人人澡| 久久久久免费精品| 亚洲激情午夜| 在线一区高清| 国产99精品| 国产精品久久波多野结衣| 成人网ww555视频免费看| 欧美极品少妇xxxxⅹ免费视频 | 中文字幕中文字幕在线一区| 国产伦精品一区三区精东| 蜜臀av国产精品久久久久 | 涩涩涩在线视频| 美女久久久久久久久久久| 你懂的视频在线| 欧美精品一区二区三区蜜桃| 一卡二卡在线观看| 91久久精品一区二区| 欧美三级午夜理伦| 亚洲精品你懂的| 日本性高潮视频| 白白色 亚洲乱淫| 97超碰免费在线观看| 美女一区二区久久| 毛片av免费在线观看| 在线观看视频日韩| 大陆极品少妇内射aaaaaa| 欧美第十八页| 视频一区二区三区免费观看| 秋霞综合在线视频| 国产欧美欧洲| 盗摄牛牛av影视一区二区| 91麻豆桃色免费看| 视频欧美精品| 成人精品视频在线| 成人国产精品一区二区免费麻豆 | 黄色成人在线免费观看| 婷婷久久国产对白刺激五月99| 日韩av不卡在线播放| 中国av一区| 欧美污视频久久久| 国产欧美一区二区三区精品观看 | 国产欧美精品va在线观看| 91看片一区| 国产精品久久久久久久久免费| 伊人久久国产| 热99久久精品| 午夜日韩成人影院| 日韩美女视频免费看| 日韩av大片站长工具| 国产97在线亚洲| 免费观看成人性生生活片| 国产成人aa精品一区在线播放| 中文在线免费二区三区| 日本久久久久久久| 日韩高清在线| 国产精品偷伦视频免费观看国产 | 蘑菇福利视频一区播放| 91精品91久久久中77777老牛| 国产人成精品一区二区三| 国产伦精品一区二区三区四区视频_ | 精产国品一区二区| 欧美午夜精品电影| 国产精品爽爽久久久久久| 欧美一区二区精品久久911| 精品人妻一区二区三区含羞草| 精品粉嫩超白一线天av| 亚洲人妻一区二区| 国产一区二区三区在线免费观看| 99免在线观看免费视频高清| 日韩在线观看精品| 欧美草逼视频| 国产91精品黑色丝袜高跟鞋| 亚洲综合av一区二区三区| 亚洲精品免费网站| 精品国产18久久久久久洗澡| 免费日韩av电影| 国产精品x453.com| www.av91| 肉肉av福利一精品导航| www.污污视频| 99久久婷婷国产综合精品 | 少妇一区二区三区四区| 亚洲女人天堂成人av在线| h视频网站在线观看| 美女少妇精品视频| 乱人伦视频在线| 国产欧美精品日韩| 国产一区二区三区亚洲| 色综合久久久久久久久五月| 欧美成人嫩草网站| 日本精品免费在线观看| 国产在线精品一区二区不卡了 | 欧美精品性生活| 国产综合久久久久久鬼色| 国产真实乱人偷精品| 欧美国产激情二区三区| 久久久综合久久久| 欧美日韩一区二区三区高清| 亚洲经典一区二区三区| 尤物yw午夜国产精品视频明星| 精灵使的剑舞无删减版在线观看| 日韩av毛片网| 国产成人在线中文字幕| 午夜精品视频在线观看一区二区 | 99草草国产熟女视频在线| 国产伦精品一区二区三区免费迷| 亚洲专区区免费| 亚洲主播在线观看| 在线免费观看高清视频| 国产丝袜一区二区| 欧美78videosex性欧美| 国产日韩精品在线播放| 天天躁日日躁狠狠躁欧美巨大小说| 综合色婷婷一区二区亚洲欧美国产| 久久精品综合| 大桥未久恸哭の女教师| 亚洲色图视频网| 一区二区乱子伦在线播放| 日韩电影免费观看在线观看| 深夜国产在线播放| 91精品一区二区| 日本女优一区| 国产精品无码av无码| xnxx国产精品| 日本天堂网在线观看| 欧美一级理论片| 黄色网址视频在线观看| 国产精品中文在线| 精品一区av| 麻豆传传媒久久久爱| 91在线视频播放地址| 日本少妇裸体做爰| 欧美一级黄色片| 成人在线直播| 亚洲japanese制服美女| 99久久久久| 视色视频在线观看| 中文字幕成人av| 性高潮视频在线观看| 亚洲网站在线播放| 欧美与亚洲与日本直播| 欧美亚洲免费高清在线观看| 亚洲一区日本| 香蕉视频黄色在线观看| 欧美日韩一区二区三区在线免费观看| 日本精品999| 91成人国产在线观看| 人体久久天天| 久久9精品区-无套内射无码| 99视频一区二区| 91video| 亚洲性69xxxbbb| 国产欧美自拍| 可以免费看的黄色网址| 国产精品一区二区三区99 | 在线观看国产91| 日本中文字幕伦在线观看| 国产主播精品在线| 亚洲综合小说| 一级黄色免费视频| 五月天丁香久久| 男女网站在线观看| 国产精品日韩在线播放| 国产精品久久久久久久免费观看| 手机精品视频在线| 亚洲五月六月丁香激情| 亚洲av片在线观看| 国产精品久久av| 99热国内精品| 久草视频福利在线| 日韩欧美在线中文字幕| 9色在线视频| 91传媒视频免费| 日韩午夜av| 美国一级黄色录像| 91精品国产日韩91久久久久久| 国产精品偷拍| 日本一区二区三区精品视频| 精品一区二区综合| 18精品爽视频在线观看| 亚洲欧美在线第一页| 99久久99九九99九九九| 你真棒插曲来救救我在线观看| 久久影音资源网| 国产美女明星三级做爰| 91爱爱小视频k| 99久久夜色精品国产亚洲96| zjzjzjzjzj亚洲女人| 欧美在线影院一区二区| 91黄色在线| 日本成人看片网址| 国产成人综合精品三级| 亚洲婷婷综合网| 久久夜精品va视频免费观看| 日韩欧美天堂| 天堂网成人在线| 一本久久精品一区二区| 日韩伦理av| 天天综合色天天综合色hd| 丰满放荡岳乱妇91ww| 亚洲视频在线观看免费视频| 午夜精品理论片| 欧美.www|