精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Bengio親手戳穿CoT神話!LLM推理是假象,25%頂會論文遭打臉

人工智能
原來,CoT推理竟是假象!Bengio帶隊最新論文戳穿了CoT神話——我們所看到的推理步驟,并非是真實的。不僅如此,LLM在推理時會悄然糾正錯誤,卻在CoT中只字未提。

圖靈獎大牛Bengio新作上線了!

這篇由牛津、谷歌DeepMind、Mila多家機構聯手論文指出——思維鏈并非可解釋性。

這一觀點徹底打破了許多人的認知:

CoT看似一步步給出答案,實則并不一定是其真實的推理過程。

圖片圖片

論文地址:https://www.alphaxiv.org/abs/2025.02

這么說來,能夠暴露LLM內心世界的「思維鏈」,如今也不可靠了?

論文中,研究人員撕開了CoT的面紗,揭露了一個令人震驚的真相:思維鏈的透明度,可能只是一種精心編織的假象!

圖片圖片

思維鏈「謊言」被揭穿

然而,現實中,約25%的近期AI論文錯誤地將CoT標榜為「可解釋性技術」。

這一概念最先由前谷歌研究院Jason Wei在論文中提出,一時間,CoT被廣泛應用在推理模型當中。

圖片圖片

它最大的特點,就是能夠多步驟推理,提升模型準確性。與此同時,讓AI黑盒變得不再那么神秘。

然而, CoT思考過程,是其真正的內心OS嗎?

一些論文信誓旦旦地宣稱,CoT可以讓我們看清AI的推理過程,但事實遠非如此。

圖片圖片

尤其是,在高風險領域,這個誤解的代價可能是致命的。

研究人員發(fā)現,在使用CoT論文中,約38%醫(yī)療 AI、25%法律AI、63%自動駕駛汽車相關論文,都盲目地將CoT視為可解釋性方法。

更令人毛骨悚然的是,帶有明確偏見的提示詞,可以輕易左右模型的答案。

而且,這些偏見在AI給出的「推理步驟」中只字不提。

AI能為帶有偏見的答案,編織出看似合理的解釋,卻從不暴露背后的「黑手」。

圖片圖片

因此,輕信這些帶有偏見的答案,可能十分危險。

不僅如此,AI還會在推理過程中,常常「偷偷」修正自己的錯誤。

表面上看,大模型給出的步驟可能漏洞百出,但它卻能通過未被表述的「暗箱操作」得出正確答案。

這便制造了一種透明的假象。為何會出現這種脫節(jié)?

研究人員推測,簡潔的CoT無法完全捕捉基Transformer大模型中存在的分布式并行計算過程。

CoT如何掩蓋真實推理?

越來越多的實證研究已經發(fā)現了大量案例,其中模型的思維鏈與其內部推理過程相偏離。

需要指出的是,在審視不忠實性的具體模式之前,CoT解釋的忠實性因模型架構等多種因素而異。

研究人員也總結了4項關鍵發(fā)現:偏見驅動的合理化與動機性推理、隱性錯誤糾正(Silent Error Correction)、不忠實的非邏輯捷徑(Unfaithful Illogical Shortcuts)、填充詞元 (Filler Tokens)。

每一項都闡明了CoT是如何誤導或掩蓋模型的實際決策過程,我們?yōu)槟闶崂砹岁P鍵發(fā)現中的要點問題:

偏見驅動的合理化與動機性推理

Turpin等研究者通過巧妙地偏置模型輸入證明偏見驅動的合理化。

舉個栗子:

在提示中重新排序多項選擇題的選項,使得正確選項總是在同一位置(例如,總是字母B)。

在這種情況下,盡管它們的CoT解釋從未提及選項重排是一個影響因素,GPT-3.5和Claude 1.0經常會選擇那個被偏置的選項。

當模型被偏向錯誤答案時,它們仍然會生成詳細的CoT來為那些錯誤答案進行合理化解釋。

結果導致在一系列任務上準確率下降了高達36%,而CoT則給出了一個具有誤導性的推理假象。

另一項研究通過在提示中添加明確答案(例如,「答案是C」)來調查提示注入的偏見,然后要求模型為其選擇提供理由。

Claude 3.7-Sonnet和DeepSeek-R1分別僅在約25%和約39%的情況下承認了被注入的答案。

這些發(fā)現表明,思維鏈常常作為事后合理化(post-hoc rationalisations)運作,忽略了真正的因果因素,并制造了一種透明解釋的假象。

隱性錯誤糾正(Silent Error Correction)

研究人員指出,模型可能會在其思維鏈中犯錯,然后在內部糾正這些錯誤,而CoT卻不反映這一糾正過程。

舉個栗子:

在一個CoT推理過程中,模型可能將一個三角形的斜邊錯誤地計算為16,而正確值應為13,但隨后卻陳述:「我們將斜邊長度13與其他兩條邊長相加得到周長?!?/p>

模型在內部檢測并糾正了錯誤,但CoT的敘述從未修正或標記這個錯誤——它讀起來像一個連貫的解題過程。

這些隱性錯誤表明,最終答案是通過敘述步驟之外的計算得出的。

不忠實的非邏輯捷徑(Unfaithful Illogical Shortcuts)

研究人員表示,模型會通過潛在的捷徑得出正確答案,例如利用記憶的模式作為替代推理路徑,從而繞過完整的算法推理,這使得明確的推理鏈變得不相關或不正確。

來個典型案例:

有研究者使用歸因圖(一種追蹤哪些計算步驟對最終輸出有貢獻的方法)發(fā)現,在解決像「36 + 59」這樣的問題時,Claude 3.5 Haiku同時使用了查找表特征(例如,用于「將接近36的數與接近60的數相加」)和加法計算特征。

有趣的是,當被要求描述模型如何得出答案時,模型報告稱,其執(zhí)行了逐位相加進位,完全忽略了其使用查找表捷徑的事實。

填充詞元(Filler Tokens)

研究指出,在某些算法推理任務中,使用填充詞元——例如「...」或學習到的「停頓」詞元這類對任務沒有語義貢獻但會影響模型內部計算的輸入詞元——可以提高模型性能。

方便你理解,舉個栗子:

研究者發(fā)現,輸入中附加可學習的停頓詞元(可作為一種填充詞元),在許多任務上都帶來了顯著的性能提升。

無獨有偶,研究者還發(fā)現,添加填充詞元使模型能夠解決它們以前失敗的問題,尤其是在使用密集監(jiān)督進行訓練時。

以上幾項關鍵發(fā)現,均解釋了CoT的不忠實性是一個普遍存在于不同模型架構和規(guī)模中的根本性挑戰(zhàn)。

其由提示詞偏見、未能承認隱藏影響以及在復雜推理任務中系統性的修復錯誤等因素導致,發(fā)生率相當高。

CoT解釋與內部計算不一致,是為何?

以上案例中,我們看到了一些關于CoT表里不一的現象,那么,究竟是什么原因導致的?

分布式并行計算,而非順序

「機制可解釋性」研究表明,Transformer架構可能從根本上限制了CoT的忠實度。

基于Transformer搭建的LLM,通常以分布式方式同時通過多個組件處理信息,而不是CoT呈現的順序步驟。

正是因為這種架構差異,導致了模型計算方式與語言表達方式之間,存在固有的不匹配。

舉個栗子,面對「24÷3=?」這樣簡單的數學問題,LLM會怎么做?

它一定不會像人類學生那樣,逐一分析「3能除24多少次」,或是列出長除法的步驟。

相反,LLM內的多個注意力頭,會同時處理這些數字之間的關系。

它可能將其識別為記憶中的事實,確認其為8的乘法表的一部分,并計算除法——所有這些都在并行進行。

為了生成簡潔且看似合理的輸出,LLM通常只生成一個這樣的敘述來合理化它們的答案,而不是表達所有并行路徑,即使是那些可能顯著影響最終答案的路徑。

因此,CoT通常會忽略有影響的因素,僅作為模型底層分布式、疊加計算的部分、事后合理化。

冗余路徑

此外,LLM在處理任務時,往往會通過多條冗余計算路徑得出相同結論。

以計算√144為例,模型可能同時執(zhí)行以下操作:

  • 識別這是一個記憶中的事實(12×12=144)
  • 應用平方根算法
  • 與訓練數據中的類似問題進行模式匹配

當從模型解釋「√144=12」的CoT中移除關鍵步驟「144=12×12」時,LLM仍能夠正確輸出12。

這表明,LLM的答案并不完全依賴于語言化的推理步驟,而是依賴其內部的多條冗余路徑。

這種冗余計算路徑的現象,被研究者稱為「九頭蛇效應」(Hydra Effect)。

即如果LLM一條路徑被阻斷或移除,另一條路徑可以接替。

這也就解釋了,為什么對CoT的某些部分進行修改或刪除,對最終答案的影響微乎其微。

CoT忠實性挑戰(zhàn)

Tanneru等研究者曾嘗試通過在訓練中懲罰不一致性,引導LLM生成忠實的CoT推理。

然而,這一方法僅取得了部分成功,尤其是在復雜問題上,模型傾向于生成看似合理但非因果的解釋。

比如,模型可能輸出一個邏輯清晰的CoT,卻掩蓋了其真正的決策路徑。

這種「合理化」傾向不僅難以完全消除,還可能在微調或持續(xù)學習過程中重新出現。

另有研究人員Chua和Evans,進一步研究了經過專門「推理訓練」的模型,結果發(fā)現:

DeepSeek-R1在59%的測試中能提及提示線索,但仍有41%的情況,未能識別關鍵影響因素。

即便是最先進的DeepSeek-V3,也僅在7%案例中提及線索,表明推理訓練的效果極其有限。

更令人擔憂的是,LLM可能通過CoT「欺騙」監(jiān)控機制。

當CoT被用于監(jiān)控RL獎勵函數中的推理時,模型學會生成看似無害的推理軌跡,實則暗中執(zhí)行有害策略。

CoT假象,破解之法

論文的最后,針對CoT透明度的問題,研究人員指出,「我們不能繼續(xù)被假象蒙蔽」。

為此,他們提出了以下幾點建議:

1. 重新定義CoT的角色

CoT不是可解釋性的「萬能鑰匙」,而應視為一種補充工具。它能提供線索,但絕非真相的全部。

2. 引入嚴格的驗證機制

通過因果驗證技術,如激活修補(activation patching)、反事實檢驗、驗證器模型,深入探查AI的推理過程是否忠實。

3. 借鑒認知科學

模仿人類的錯誤監(jiān)控、自我修正敘事和雙重過程推理(直覺+反思),讓AI的解釋更接近真實。

4. 強化人工監(jiān)督 

開發(fā)更強大的工具,讓人類專家能夠審查和驗證AI的推理過程,確保其可信度。

參考資料:

https://x.com/FazlBarez/status/1940070420692312178

https://www.alphaxiv.org/abs/2025.02

責任編輯:武曉燕 來源: 新智元
相關推薦

2024-09-23 09:40:00

AI數學模型

2025-06-10 09:25:27

2024-12-12 09:00:00

2025-06-17 08:52:00

蘋果AI論文

2020-06-28 10:16:53

PyTorchTensorFlow機器學習

2025-01-13 01:00:00

數據訓練AI

2025-05-21 09:02:20

2023-06-01 17:06:49

模型思維

2021-09-02 10:15:50

計算平臺MaxCompute 阿里云

2025-03-05 04:00:00

2020-06-13 16:16:27

CDMA韓國移動通信

2012-11-15 09:46:22

Xeon PhiIntel加速性能

2023-02-09 16:09:46

2025-08-01 09:14:00

2020-03-17 11:40:42

阿里云神龍

2023-04-14 18:35:19

Redis數據Async

2025-04-24 10:26:40

2025-10-27 09:03:00

2025-08-13 10:21:50

點贊
收藏

51CTO技術棧公眾號

日本欧美肥老太交大片| 日韩精品分区| 国模吧视频一区| 精品一区精品二区| www.99av.com| 色在线视频网| 欧美国产在线观看| 99在线观看视频| 中文字幕一区二区人妻视频| 午夜免费一区| 日韩av在线免费观看| 一级片视频免费观看| 不卡的av影片| 一区在线播放视频| 久久精品国产美女| 国产乱淫av免费| 日韩福利视频导航| 久久久久久久一| 欧美aaa级片| 少妇精品导航| 精品免费日韩av| 久久久久久久久久久久久久久国产 | 精品国产乱码久久久久久浪潮| 成人午夜视频免费在线观看| 色女人在线视频| 国产精品久久夜| 欧美日韩国产一二| 天天操天天舔天天干| 久久成人综合网| 欧洲永久精品大片ww免费漫画| 啪啪一区二区三区| 精品一区二区三| 国产视频精品va久久久久久| 精品人妻无码中文字幕18禁| 久久久加勒比| 欧美性大战久久| 午夜dv内射一区二区| 欧美aa在线| 亚洲午夜久久久| 欧美一级特黄aaaaaa在线看片| 好男人免费精品视频| 91香蕉视频黄| 国产在线一区二| 成人免费视频国产免费麻豆| 激情综合五月天| 国产精品一区二区女厕厕| 日本免费在线观看视频| 亚洲免费网站| 人人做人人澡人人爽欧美| 国产成人无码精品亚洲| 亚洲日本黄色| 7777精品久久久久久| 成年人免费看毛片| 在线亚洲激情| 日本免费久久高清视频| av图片在线观看| 日日夜夜精品视频天天综合网| 26uuu另类亚洲欧美日本一| 日韩精品视频免费播放| 99riav1国产精品视频| 97国产真实伦对白精彩视频8| 日韩欧美亚洲国产| 宅男噜噜噜66国产日韩在线观看| 亚洲**2019国产| 久久精品一二区| 视频在线观看一区二区三区| 国产精品成人免费电影| 亚洲视频中文字幕在线观看| 狠狠网亚洲精品| 9a蜜桃久久久久久免费| 天堂av手机版| 成人h在线观看| 精品国产一区二区三区香蕉沈先生 | 老熟妇高潮一区二区高清视频| 风间由美性色一区二区三区| 久草精品电影| 国产精品视频二区三区| 国产精品国产精品国产专区不蜜 | 欧美一区二区免费| jjzz黄色片| 九色精品国产蝌蚪| 久久偷看各类女兵18女厕嘘嘘| 久久久一区二区三区四区| 99精品视频免费观看| 国产激情综合五月久久| 国产乱淫av免费| av在线这里只有精品| 亚洲精品乱码久久久久久| 91久久极品少妇xxxxⅹ软件| 色欲av伊人久久大香线蕉影院| 97se亚洲国产综合自在线| 日韩精品久久久| 97影院秋霞午夜在线观看| 天天爽夜夜爽夜夜爽精品视频| 日韩欧美黄色大片| 超碰cao国产精品一区二区| 亚洲欧美一区二区三区在线| 肉色超薄丝袜脚交69xx图片| 亚洲午夜一级| 国产精品久久久久久久久久久久| 国产成年妇视频| 久久久影院官网| 男女激烈动态图| 欧美亚洲韩国| 亚洲第一页中文字幕| 色婷婷国产精品免| 中日韩视频在线观看| 成人h视频在线观看播放| 午夜影院免费视频| 亚洲人亚洲人成电影网站色| 国产成人无码av在线播放dvd| 欧美国产中文高清| 在线播放日韩专区| 国产精品黄色大片| 国产成人高清在线| 性欧美精品一区二区三区在线播放| 午夜小视频福利在线观看| 91久久精品网| 中文字幕在线观看网址| 欧美一区二区| 国产精品99导航| 神宫寺奈绪一区二区三区| 亚洲欧美日韩国产中文在线| 国产97色在线 | 日韩| 欧美a一欧美| 欧美激情精品久久久久久| 97国产成人无码精品久久久| 国产午夜精品久久久久久久 | 日韩中文一区二区三区| 精精国产xxxx视频在线播放| 日韩欧美电影在线| 艳妇荡乳欲伦69影片| 蜜桃精品在线观看| 日韩视频在线观看国产| 亚洲私拍视频| 日韩精品欧美国产精品忘忧草| 精品少妇theporn| 粉嫩一区二区三区在线看| 日韩中文在线字幕| 另类视频一区二区三区| 日韩视频免费观看| 一二三四区在线| 国产精品你懂的在线| 男女男精品视频站| 成人在线免费小视频| 国产精品久久久久77777| 国产理论电影在线观看| 欧美这里有精品| 一级在线观看视频| 蜜臀va亚洲va欧美va天堂| 日韩亚洲视频在线| 精品福利在线| 久久夜色精品国产欧美乱| 国产又粗又猛又色又| 中文字幕日韩一区| 亚洲AV无码久久精品国产一区| 午夜国产精品视频免费体验区| 2014亚洲精品| 啊啊啊久久久| 亚洲日韩中文字幕| 一级黄色片在线| 亚洲男同性视频| 日韩Av无码精品| 麻豆九一精品爱看视频在线观看免费| 欧洲亚洲一区二区三区四区五区| 国产精品亚洲成在人线| 蜜臀久久99精品久久久无需会员| www.桃色av嫩草.com| 亚洲成av人**亚洲成av**| 中文字幕一区二区三区人妻不卡| 日本视频免费一区| 日韩视频在线观看视频| 中文字幕av一区二区三区四区| 欧美性视频网站| jizz在线观看视频| 日韩午夜在线播放| 人人爽人人爽人人片av| 国产欧美精品区一区二区三区| 欧美成人手机在线视频| 在线精品一区二区| 视频一区不卡| 中文字幕一区二区三区日韩精品 | 欧美成人aaa| 欧美国产日韩一区| 国产在线播放av| 欧美一级欧美三级在线观看| 国产精品黄色网| 国产精品美女视频| 亚洲精品第二页| 久久精品国产网站| 99在线精品免费视频| 日韩电影免费网站| 激情伦成人综合小说| 欧美aaa级| 国产成人精品网站| 色呦呦久久久| 日韩一二三在线视频播| 日韩在线视频免费| 欧美精品在线一区二区三区| 日韩成人免费在线观看| 国产精品免费视频观看| 在线免费观看a级片| 精品一区在线看| 91传媒久久久| 亚洲视频久久| 超碰成人在线免费观看| 综合亚洲自拍| 国产精品一区二区三区免费| 欧美性www| 国产成人福利网站| av小说在线播放| 免费91麻豆精品国产自产在线观看| 国产乱视频在线观看| 日韩成人av网址| 国产精品人妻一区二区三区| 一本一本大道香蕉久在线精品| 久久久一二三区| 亚洲精品视频自拍| 欧美一区二区三区观看| 国产亚洲精品福利| 青青草成人免费视频| 成人夜色视频网站在线观看| 又色又爽又黄视频| 免费美女久久99| 亚洲精品中文字幕无码蜜桃| 最新成人av网站| 青草视频在线观看视频| 亚洲综合婷婷| 美国av在线播放| 久久影院100000精品| 色999五月色| 精品色999| 午夜精品福利一区二区| av在线不卡免费观看| 久久久久久久有限公司| 六月丁香久久丫| 精品国产乱码久久久久软件 | 日韩欧美精品久久| 久久91麻豆精品一区| 免费看成人片| 少妇精品久久久一区二区三区| 久久久综合亚洲91久久98| 天天躁日日躁狠狠躁欧美| 久久精品国产99精品国产亚洲性色| 嫩草国产精品入口| 久热这里只精品99re8久| 一道本一区二区三区| 欧美乱偷一区二区三区在线| 欧美禁忌电影网| 亚洲高清123| 91久久高清国语自产拍| 好吊色这里只有精品| 欧美激情综合色综合啪啪| 成人小视频在线观看免费| 亚洲午夜一级| 精品免费国产一区二区| 日韩电影在线观看网站| 国产欧美一区二| 国产精品69久久久久水密桃| 成人免费看片载| 91亚洲精品一区二区乱码| 亚洲第一香蕉网| 国产精品国产三级国产普通话99 | 欧美日韩激情在线| 国产精品乱码久久久| 欧美成人a∨高清免费观看| 少妇高潮一区二区三区69| 亚洲欧美日韩天堂| 午夜视频在线观看网站| 欧美国产日韩一区| 巨茎人妖videos另类| 成人两性免费视频| 国产精品玖玖玖在线资源| 欧洲精品亚洲精品| 中文av一区| 日韩中文字幕三区| 久久狠狠亚洲综合| 扒开伸进免费视频| 国产精品免费丝袜| 日本中文字幕免费观看| 日本韩国一区二区三区| 99久久精品日本一区二区免费| 亚洲激情在线观看| 免费**毛片在线| 51久久精品夜色国产麻豆| 久久av日韩| 国产欧美亚洲日本| 欧美激情电影| 乱人伦xxxx国语对白| 精品中文字幕一区二区小辣椒 | 国产av精国产传媒| 亚洲欧洲激情在线| 色呦呦网站在线观看| 国产成人亚洲综合91| 亚洲国产高清在线观看| 日韩国产在线一区| 国产一区欧美| 亚洲xxx在线观看| 97国产精品videossex| 五月天色婷婷丁香| 色噜噜夜夜夜综合网| 精品人妻午夜一区二区三区四区| 亚洲天堂色网站| 美女91在线| 成人观看高清在线观看免费| 亚洲精品白浆高清| 男人添女荫道口喷水视频| 麻豆成人91精品二区三区| 日韩www视频| 亚洲色大成网站www久久九九| 天堂网免费视频| 日韩精品免费看| 亚洲小说区图片区都市| 国产精品爽爽ⅴa在线观看| 日韩高清成人在线| 男的插女的下面视频| 国产一区二区在线影院| 九一在线免费观看| 色综合久久天天| 四虎精品成人免费网站| 视频一区二区欧美| 亚洲性视频大全| 三区精品视频| 噜噜噜躁狠狠躁狠狠精品视频 | 国产又粗又大又爽的视频| 日本aⅴ免费视频一区二区三区| 玖草视频在线观看| 亚洲大型综合色站| 亚洲精品97久久中文字幕| 精品国产美女在线| 欧美亚洲综合视频| 亚洲国产精品综合| 免费观看日韩电影| 国产精品久久久久久成人| 在线精品视频一区二区| 水中色av综合| 日韩av不卡电影| 国产精品日韩精品中文字幕| 亚洲乱码中文字幕久久孕妇黑人| www.久久精品| 美日韩一二三区| 亚洲欧洲在线免费| 国产亚洲一区二区手机在线观看 | 成人欧美一区二区三区在线湿哒哒| 欧美熟乱15p| 污网站在线免费| 日韩美女视频19| 99热这里只有精品在线观看| 欧美床上激情在线观看| 91国内精品| 99热自拍偷拍| 久久精品一区蜜桃臀影院| 中国a一片一级一片| 在线视频精品一| 青草综合视频| 青草全福视在线| 成人精品国产免费网站| 国产成人综合欧美精品久久| 亚洲免费成人av电影| 成人av集中营| 老司机午夜免费福利视频| 成人午夜碰碰视频| 成年人免费高清视频| 国产一区二区av| 亚洲免费一区| 亚洲精品蜜桃久久久久久| 久久综合资源网| 一级片免费网站| 欧美激情一级精品国产| 亚洲女娇小黑人粗硬| 黄色三级视频在线| 一区二区三区日韩在线观看| 欧美一级一区二区三区| 国产成人精品久久久| 外国成人激情视频| 日批在线观看视频| 欧美专区在线观看一区| 羞羞的网站在线观看| 欧美久久久久久久| 久久99国产精品久久99果冻传媒| 精品一区二区三区四| 亚洲天天在线日亚洲洲精| 国产精品成人**免费视频| 奇米精品一区二区三区| 国产精品网曝门| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 国产大片精品免费永久看nba| 在线精品小视频| 加勒比综合在线| 日韩久久久久久| 久久久久伊人| 精品无码一区二区三区在线| 国产精品久久网站| 天堂√在线中文官网在线| 成人福利视频在线观看| 久久狠狠婷婷| 国产亚洲欧美精品久久久www | 欧美卡一卡二| 日韩在线电影一区| aaa亚洲精品一二三区|