精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉” 原創

發布于 2025-11-7 17:07
瀏覽
0收藏

編輯 | 聽雨

出品 | 51CTO技術棧(微信號:blog51cto)

推理型大語言模型(LRM),像 ChatGPT-5、Claude 3.5、Gemini 1.5 Pro 等模型,能生成長篇、結構化的推理文本來說明自己的思考過程,比傳統LLM的推理能力更強,這已經不是什么稀奇事了。

但一項來自明尼蘇達大學、萊斯大學、史蒂文斯理工學院和 Lambda Inc 的華人團隊最新研究指出,LRM在執行推理任務時,會“陷入語言循環”,生成大量無意義的廢話,并且迅速燒掉你的 token。

研究者為此起了一個很生動的名字,“詞語沙拉”(Word Salad)。顧名思義:模型把詞語像生菜一樣不斷攪拌、重復、堆疊,看起來很豐盛,其實沒什么營養。

而更震撼的發現是,模型也會意識到自己在瞎說,但依然無法控制自己停下來。

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區

一、推理模型的隱形漏洞:詞語沙拉

研究團隊指出,LRM的“思維鏈”推理的代價極高。每一步內部生成的文本都要被再次解碼、存儲、預測,計算開銷遠超普通對話模型。而且,模型并非總在“思考”——很多時候,它只是在不停地說廢話。

“我們觀察到,LRM 在生成長鏈推理時,會出現一種‘幻覺式贅述’現象:重復先前的句子結構、枚舉無關情況、或在解釋中兜圈子。它們在形式上表現為推理,但在語義上是空洞的。”

以往的研究(如《Demystifying Long Chain-of-Thought Reasoning in LLMs》《Small Models Struggle to Learn from Strong Reasoners》)指出,大模型在 CoT 推理中容易出現“過度思考”現象:即輸出大量重復、松散的解釋句式,以掩蓋其邏輯不確定性。

而研究團隊在分析 DeepSeek-R1-Distill 系列模型時發現,在 GPQA-Diamond 數據集任務中:平均超過 55% 的生成 token 屬于“詞語沙拉”,即語義重復、無增量價值的內容。

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

這意味著,用戶在每次推理調用中,有一半的費用都被浪費在模型的“語言循環”上。

更關鍵的是,研究者發現這種行為并非偶然隨機,而是可預測的模式:

  • 在模型陷入循環前后,隱藏狀態的分布發生明顯變化;
  • 某些 token(特別是 \n\n)后面的狀態信號能準確預示模型是否“失控”;
  • 模型在內部表現出一種“覺察到自己在重復”的信號。

二、AI的“去水”神器:WordSaladChopper

為了解決這個問題,研究者的想法非常簡單粗暴:

如果模型在內部“知道自己在胡說八道”,那么我們就可以直接監聽它的隱藏層信號,在它開始胡說時立刻把它打斷。

他們提出了一個框架,叫WordSaladChopper(詞語沙拉切斷器) 。它的原理非常直接:1?? 在模型生成推理時,監控每個段落(以雙換行符分割);2?? 如果連續兩個段落的隱藏狀態顯示“循環模式”,3?? 系統立刻切斷生成,并自動補上提示讓模型“從這里重新回答”。

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

目前在github上已經開源:https://github.com/wenyaxie023/WordSaladChopper

實驗全部在單臺 NVIDIA H100 GPU 上進行。研究者主要在 o1-mini 模型(OpenAI 推理型模型) 上運行實驗,并將結果與 GPT-4o-mini 以及 Claude 3.5-sonnet 進行對比,以驗證問題的普遍性。

所有測試均使用 S1 benchmark(由 OpenAI 發布的 reasoning-focused 評測集),該數據集包含大量需要多步推理、算術運算或邏輯歸納的題目。對于每個模型,研究者共生成 1000 條推理軌跡(reasoning traces),每條軌跡約 1000–3000 token。

訓練用于檢測“詞語沙拉”的分類器時,他們將軌跡按雙換行符劃分為片段(chunk),每個 chunk 的最后一個 token 的隱藏狀態作為輸入特征。訓練目標是預測每個 chunk 是否屬于“詞語沙拉”循環。

為評估方法效果,研究者使用以下指標:

  1. Precision(精確率):被判定為“詞語沙拉”的片段中,實際為“詞語沙拉”的比例。
  2. Recall(召回率):所有真實“詞語沙拉”片段中,被正確檢測到的比例。
  3. F1 分數:精確率與召回率的調和平均。
  4. Token budget waste(Token 消耗浪費):重復循環所占的輸出 token 比例。

此外,他們還關注了兩個定性指標:

  • 模型是否在陷入循環后仍嘗試“自我修正”;
  • 在檢測到循環后手動終止生成并重新提示時,模型能否成功繼續回答。

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

結果發現:

1. 詞語沙拉的廣泛存在性

“詞語沙拉循環”不僅存在于 o1-mini,也普遍出現在其他推理型模型中。Claude 3.5、GPT-4o-mini 在長推理任務中,都出現了明顯的自我重復現象。

尤其在數學推理 和多步邏輯任務中,模型常在 2000–4000 token 之后陷入無意義的長段自我解釋、重述、或對“自身思路”的重復反芻。

“在 1000 條推理軌跡中,約有 61% 的軌跡出現過至少一次詞語沙拉循環,平均浪費了 23% 的解碼預算。”

2. 分類器檢測效果

線性分類器在僅使用隱藏狀態(無需額外輸入或模型修改)的情況下,就能以較高精度檢測出這些重復片段:

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區

研究者分析了模型的隱藏狀態,發現當模型陷入“詞語沙拉循環”時,內部激活信號會出現非常明顯的模式變化。

這也是論文最震撼的發現,不是模型啰嗦——而是它“知道自己在啰嗦”。

模型的神經層在“語義混亂”時,會呈現出特征性波動。換句話說,AI 自己知道自己開始胡說八道了。

只不過,它停不下來。就像一個講不出重點的發言人,只能不停補充、重復、重述,以維持表面的“邏輯連貫”。

3. 干預后的改進

在檢測器實時接入后,當系統監測到連續兩個片段被判定為“詞語沙拉”時,就會終止生成并發出固定再生成提示。結果表明:

  • 在不訓練模型本身的情況下,最多可縮短57%的輸出
  • 對整體正確率的影響可以忽略
  • 推理延遲顯著降低

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

大模型知道自己在瞎說,但是無法停下來!華人團隊研究發現:2000token以后,大模型就開始表演“詞語沙拉”-AI.x社區圖片

三、為什么推理模型特別容易陷入“詞語沙拉”

作者提出了三種主要原因:

  1. 長上下文窗口模型能“記住”自己說過的廢話,從而把它再度引用、重組,形成自我循環。
  2. 高一致性偏好推理型模型被訓練成要維持語言流暢、思維連貫,即使已經偏題,也會強行“接著講完”。
  3. 缺乏顯式終止條件當前推理架構沒有“我想不出來了”的機制,因此在邏輯死胡同時,只能繼續生成表面合理的文字。

這三點共同導致模型在推理任務中,更容易“過度思考”,甚至產生語言幻覺。

四、“AI的幻覺”,其實也是算力幻覺

這篇論文還有另一個隱含觀點:

我們一直以為模型的“幻覺(hallucination)”是事實錯誤,但它也可能是算力層面的幻覺——模型把計算資源浪費在無意義的循環上,卻仍然“自信滿滿”。

研究者批評了目前業界和學界用于評估推理模型性能的標準(如 GSM8K、MATH、GPQA 等)本身存在缺陷。這些 benchmark 關注模型是否“答對”,但很少衡量模型是否高效、是否在浪費預算。

“我們認為,許多所謂的‘高效推理方法’之所以看起來有效,部分原因是評估基準本身過于寬松。一旦未來出現更全面的評測體系,許多被吹捧的高效推理方法可能會徹底失效,或表現與原生模型完全不同。”

這其實也是對整個“CoT(思維鏈)熱潮”的一次隱性反思:

當前模型的“推理能力”,有相當部分只是看起來在思考,而不是真正地在推理。

那么,評論區的各位大佬們:

你用 AI 時,有沒有遇到它“越解釋越離譜”的情況?如果 AI 能自己檢測到在胡說八道,并停下來,你會更信任它嗎?

參考鏈接:https://arxiv.org/pdf/2511.00536

本文轉載自??51CTO技術棧??,作者:聽雨

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
噜噜噜91成人网| 成人一级视频| yourporn久久国产精品| 91精品国产色综合| 欧美特级黄色录像| 久久亚洲国产精品尤物| 亚洲精品v日韩精品| 国产偷久久久精品专区| 精品一区二区无码| 2023国产精品久久久精品双| 亚洲第一免费播放区| 中文字幕第21页| 日韩伦理电影网站| 久久久久久一二三区| 成人精品一区二区三区电影免费| 国产五月天婷婷| 日韩免费特黄一二三区| 日韩精品一区二区在线观看| 超碰网在线观看| 一区二区三区伦理| 久久久91精品国产一区二区精品 | 波多野结衣在线观看| 国产欧美一区二区三区在线看蜜臀| 成人有码在线播放| 国产九色在线播放九色| 亚洲成人一区| 国产一区二区久久精品| 亚洲午夜久久久久久久久| 99久久婷婷国产综合精品首页| 亚洲一区在线观看免费观看电影高清| 日本一区二区高清视频| 色婷婷激情五月| 国产一区二区免费视频| 国产精品∨欧美精品v日韩精品| 2021亚洲天堂| 91偷拍一区二区三区精品| 精品亚洲aⅴ在线观看| 师生出轨h灌满了1v1| 欧美韩国日本| 欧美三级电影精品| 97国产精东麻豆人妻电影| 四虎亚洲成人| 最好看的中文字幕久久| 亚洲高清不卡一区| 精品一二三区视频| 91在线观看一区二区| 99中文字幕| 精品国产一级片| 国产一区二区三区美女| 国产美女扒开尿口久久久| 国产污视频网站| 久久最新视频| 国产成人精品视频| 午夜精品免费观看| 丝袜亚洲另类丝袜在线| 欧美极品少妇全裸体| 黄页网站免费观看| 黄色综合网站| 欧美黄色片免费观看| 欧产日产国产v| 久久精品影视| 久久成人国产精品| 国产午夜精品理论片| 99九九热只有国产精品| www国产精品视频| 国产少妇在线观看| 午夜精品毛片| 欧美刺激性大交免费视频| 极品久久久久久| 欧美精品国产一区二区| 欧美韩日一区二区| 日韩成人高清视频| 亚洲视频播放| 日韩av手机在线看| 中文字幕永久在线观看| 老司机免费视频一区二区三区| 国产精品爽黄69天堂a| 91在线观看喷潮| 国产精品1区2区| 国产伦精品一区二区三区高清版 | 精品91久久久| 裸体素人女欧美日韩| 人体精品一二三区| 亚洲午夜激情视频| 国产激情一区二区三区四区| 国产欧美一区二区三区另类精品| 深夜福利在线观看直播| 国产日韩欧美a| japanese在线视频| 丁香花高清在线观看完整版| 欧美日韩国产精品| 欧美男女交配视频| 亚洲午夜免费| 亚洲欧美综合精品久久成人| 18精品爽国产三级网站| 欧美喷水视频| 日韩av电影在线播放| 一区二区三区日| 成人午夜看片网址| 日韩精品欧美在线| h片在线免费观看| 欧美日韩国产中文精品字幕自在自线| 天天操天天爱天天爽| 欧美激情三级| 亚洲午夜精品视频| 久久久久国产精品夜夜夜夜夜| 亚洲自拍另类| 亚洲自拍另类欧美丝袜| 欧美日韩伦理片| 亚洲欧洲中文日韩久久av乱码| 久久精品xxx| 成人高清一区| 亚洲电影免费观看| 国产精品嫩草影院俄罗斯 | 精品久久久噜噜噜噜久久图片| 国产精品2区| 亚洲人成在线观看| 国产一级淫片免费| 久久97超碰国产精品超碰| 精品一区二区视频| www免费在线观看| 欧美三区在线观看| 极品人妻一区二区三区| 黄色欧美日韩| 99久久精品无码一区二区毛片 | 中文字幕一区二区三区在线播放| 成年网站在线免费观看| 综合中文字幕| 欧美精品在线播放| 国产永久免费视频| 中文一区在线播放| mm1313亚洲国产精品无码试看| 国产毛片久久久| 欧美日产国产成人免费图片| 国产精品爽爽久久久久久| 国产日韩欧美激情| 麻豆av免费在线| 欧美三级午夜理伦三级在线观看 | av资源吧首页| 国产成人午夜精品影院观看视频| 色乱码一区二区三区熟女| 成人在线免费| 最新国产精品亚洲| 亚洲中文字幕在线一区| 中文在线资源观看网站视频免费不卡 | 97在线资源站| 在线观看小视频| 色综合视频一区二区三区高清| 久久久久久久久久毛片| 久久久人成影片免费观看| 国产成人精品一区二区三区| 色婷婷av一区二区三| 亚洲一区二区三区四区中文字幕| 99爱视频在线| 免费电影一区二区三区| 欧美精品videosex牲欧美| 国产欧美一级片| 国产精品理论片在线观看| 国产福利一区视频| 久久综合成人| 成人精品福利视频| 黄色小网站在线观看| 欧美性猛交xxxx黑人交| 永久免费毛片在线观看| 久久精品国产一区二区三区免费看| 欧美日韩亚洲一区二区三区在线观看| av在线视屏| 欧美精品一区在线观看| 国产性生活网站| 99视频热这里只有精品免费| 可以在线看的av网站| 日韩成人一级| 欧美一区二区三区免费视| 亚洲 另类 春色 国产| 亚洲图片自拍偷拍| 国产成人无码精品久久二区三| 久久亚洲精品伦理| 日韩精品久久久毛片一区二区| 久久亚洲精品爱爱| 亚洲美女动态图120秒| 亚洲在线视频播放| 亚洲精品午夜久久久| 中文字幕乱码在线人视频| 欧美日韩精选| 国产精品乱码视频| 欧美人体一区二区三区| 中文字幕一精品亚洲无线一区| 亚洲一区二区影视| 亚洲精品久久7777| 无码国产69精品久久久久网站| 在线综合亚洲| 一区二区三区四区五区视频| 精品久久在线| 九九热这里只有在线精品视| 日韩中文字幕免费观看| 一本一道综合狠狠老| 国产成人av免费在线观看| 国产成人免费视频| 白嫩少妇丰满一区二区| 国产精品精品国产一区二区| 亚洲影视九九影院在线观看| 伊人色综合一区二区三区影院视频| 亚洲丝袜av一区| 国产精品久久久久久久成人午夜| 亚洲夂夂婷婷色拍ww47| 国产一二三四五区| 懂色av中文字幕一区二区三区| 国产成人黄色片| 一区二区三区在线电影| 久久日韩精品| 欧美亚洲黄色| 97久久精品人搡人人玩| 日本在线播放| 亚洲黄色av女优在线观看| 又色又爽又黄无遮挡的免费视频| 精品久久久久久中文字幕| 亚洲色图 激情小说| 国产91精品在线观看| 成熟老妇女视频| 欧美欧美全黄| 强开小嫩苞一区二区三区网站| 日韩精品免费一区二区夜夜嗨 | 久久韩国免费视频| 日韩av高清在线| 欧美一区二区女人| 97超碰人人模人人人爽人人爱| 午夜精品福利在线| 国产极品美女在线| 久久久久久毛片| 午夜影院福利社| 国产一区二区在线视频| 99精品免费在线观看| 狠久久av成人天堂| 在线免费观看成人网| 日韩夫妻性生活xx| 欧美亚洲精品日韩| 欧美三级午夜理伦三级小说| 97人摸人人澡人人人超一碰| 精品视频一区二区三区在线观看| 国产精品高潮视频| 二区三区不卡| 91精品国产91久久久久久最新 | 国产一区二区三区网站| 国产黄色高清视频| 欧美一级片免费看| 亚洲资源在线播放| 欧美日韩一区二区三区视频| 日韩三级一区二区| 在线日韩一区二区| 天天干天天操天天爱| 午夜在线成人av| 国产一级做a爰片在线看免费| 亚洲欧洲综合另类| 国产又粗又硬又长又爽| 亚洲视频在线一区| caoporn91| 亚洲一区二三区| 久久久一二三区| 亚洲国产另类精品专区| 久久这里只有精品国产| 午夜精品久久久久久久| 免费看日韩毛片| 婷婷丁香久久五月婷婷| 国产黄色片视频| 色综合天天在线| 亚洲自拍一区在线观看| 日韩欧美在线一区| 免费无码国产精品| 6080午夜不卡| www.成人精品| 亚洲国产精品久久久久| 少妇喷水在线观看| 一本色道久久88综合日韩精品| 国产精品四虎| 少妇av一区二区三区| 免费黄色在线观看| 欧美激情久久久久| 天堂√中文最新版在线| 热久久99这里有精品| 91精品国产66| 国产精品视频导航| 91丨精品丨国产| 国产精品久久久对白| 欧洲亚洲视频| 亚洲午夜精品一区二区三区| 久久精品一区二区不卡| 国产成人永久免费视频| 亚洲在线免费| 五月天婷婷在线观看视频| 国产suv精品一区二区6| 一级做a爰片毛片| 国产精品视频看| 青青草原在线免费观看| 精品久久久久久久久久久久| 国产精品欧美激情在线| 亚洲第一网站免费视频| 狠狠狠综合7777久夜色撩人| 久久这里只有精品99| 欧美办公室脚交xxxx| 国产精品久久久久免费a∨| 精品91福利视频| 久久精品第九区免费观看| 亚洲精彩视频| 丝袜老师办公室里做好紧好爽| 日韩av网站免费在线| 中国老熟女重囗味hdxx| 欧美激情中文不卡| 久久久久久福利| 欧美三级日韩三级| 欧美美乳在线| 久久777国产线看观看精品| 中文在线а√天堂| 91超碰在线电影| 久久大综合网| 欧美 日韩 激情| 韩国三级中文字幕hd久久精品| 久久久久久无码精品人妻一区二区| 国产欧美日韩另类一区| 中文字幕一区二区三区手机版 | 亚洲图区在线| 特级黄色录像片| 香蕉av777xxx色综合一区| 另类小说第一页| 久久久国产午夜精品| 久久精品久久精品久久| 欧美电影一区二区| 91精品国产91久久久久游泳池| 孩xxxx性bbbb欧美| 国产高清视频一区二区| 欧美一区二区三区四区在线观看地址| 亚洲国产免费| 人妻少妇偷人精品久久久任期| 国产欧美日韩久久| 久久久久亚洲视频| 日韩不卡在线观看| 国产精品蜜臀| 99久久伊人精品影院| 欧美顶级大胆免费视频| www.天天射.com| 亚洲国产精品ⅴa在线观看| 制服.丝袜.亚洲.中文.综合懂色| 日韩欧美中文字幕制服| 2024短剧网剧在线观看| 国产精品流白浆视频| 九九精品在线| 欧美视频第一区| 久久一夜天堂av一区二区三区| 国产在线拍揄自揄拍| 欧美一区二区三区四区高清| av香蕉成人| 成人欧美一区二区三区在线| 欧美超碰在线| aaa毛片在线观看| 国产欧美精品一区| 一级一级黄色片| 亚洲一区二区久久久| 欧洲美女精品免费观看视频| 亚洲高清精品中出| 美女爽到高潮91| 欧美精品色哟哟| 欧美成人精品3d动漫h| 七七成人影院| 久久精品日产第一区二区三区精品版 | 免费成人av资源网| 看黄色录像一级片| 88在线观看91蜜桃国自产| 免费黄色电影在线观看| 国产精品入口尤物| 欧美黄色一区二区| 日本xxxx免费| 性久久久久久久久| 高清日韩av电影| 国产精品自拍网| 亚洲自拍偷拍网| 欧美大喷水吹潮合集在线观看| 黄色一区二区在线观看| 午夜视频免费在线| 国产噜噜噜噜噜久久久久久久久 | 成人性生交大片免费看中文网站| 久久久久久蜜桃| 日韩禁在线播放| 成人福利一区二区| 成年丰满熟妇午夜免费视频 | 亚洲图片欧美激情| 亚洲精品国产精品乱码不卡| 久久琪琪电影院| 欧美人与牛zoz0性行为| 99精品视频在线看| 国产精品乱人伦中文| 国产xxxx在线观看| 欧美在线视频一区二区| 久久精品高清| 粉嫩av懂色av蜜臀av分享| 在线看国产一区| 永久免费网站在线| 日韩欧美手机在线| 国产一区二区视频在线| 成人午夜视频精品一区| 久久九九精品99国产精品| 女同另类激情重口|