精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理越多,幻覺越重?多模態推理模型的「幻覺悖論」

人工智能 新聞
多模態推理模型真的「越想越明白」嗎?研究表明,R1系列模型在推理鏈條加長的過程中,其視覺感知能力出現下降趨勢,生成內容有時會偏離圖像本身,出現「看見」不存在事物的幻覺現象。

在多模態大模型的飛速發展中,R1 系列多模態推理模型憑借顯式的長鏈推理機制,在復雜任務中屢屢突破傳統「快思考」范式的性能瓶頸。

然而,研究發現,隨著推理鏈條的加長,這類模型的視覺感知能力卻呈現出明顯下滑的趨勢,逐漸轉而依賴語言先驗進行「腦補」,生成內容也越來越容易脫離圖像本身,甚至出現憑空捏造的幻覺現象。

這一「推理增強—感知削弱」的悖論,凸顯了當前多模態推理模型在推理能力與感知準確性之間面臨的平衡挑戰。

為進一步驗證這一現象,來自加州大學圣克魯茲分校、圣塔芭芭拉分校和斯坦福大學的研究團隊開展了系統性分析。

通過引入推理長度控制機制與可解釋性注意力可視化方法,研究者發現:隨著推理鏈的延長,模型對圖像內容的關注顯著下降,而對語言提示的依賴不斷增強,凸顯出語言主導下的視覺偏離趨勢。

圖片

論文鏈接:https://arxiv.org/pdf/2505.21523

項目鏈接:https://mlrm-halu.github.io

代碼鏈接:https://github.com/MLRM-Halu/MLRM-Halu 

在此基礎上,團隊提出了全新的評估指標RH-AUC,并構建了配套的診斷性基準集RH-Bench,首次系統量化了多模態推理模型在推理能力與視覺感知穩定性之間的平衡表現。

該工具不僅提升了模型幻覺風險的可測性,也為未來多模態系統的穩健性評估與改進提供了重要參考。

圖片

推理增強帶來的視覺幻覺放大效應

圖片

在當前多模態大模型的演進中,R1 類推理模型因引入顯式的長鏈語言推理過程(Reasoning Chain),在復雜任務上展現出強大的表達能力。

圖片

圖片

然而,研究人員系統性觀察到一個被廣泛忽視的現象:隨著推理鏈長度的加深,模型在感知任務中的視覺對齊能力顯著下降,幻覺風險隨之放大

這一趨勢在多組實證對比中被清晰觀察到。

例如,在圖 (b) 中,研究人員對比了多個 7B 規模的多模態模型在推理與感知兩類任務中的表現:盡管 R1-OneVision-7B 等模型在推理準確率上具備一定優勢,但其在感知任務中的準確率卻降至最低,顯著低于同規模的非推理模型(如Qwen2.5-VL-7B)。

這表明推理鏈的加深并非「無代價」的增強,而是以犧牲圖像感知能力為代價,放大了幻覺。

圖片

具體來說,當模型在圖文任務中逐步延展其語言鏈條時,原本應支撐答案的圖像證據信號卻被悄然邊緣化。

以典型視覺問答任務為例,在推理模型中生成的冗長輸出往往并未真正參考圖像內容,而是依賴語言常識「腦補」出一個聽上去合理、但圖像中并不存在的答案。這種現象在多個感知評測基準(如MMVP、MMHAL)中反復出現。

如圖所示,在多個視覺感知任務的綜合評估中,R1類模型普遍低于同規模的Base模型,尤其在需要細致圖像對齊能力的MMHAL和MMVP上,差距更為顯著。

這進一步印證了:推理鏈的增強不僅沒有提升感知質量,反而加劇了模型「脫圖而答」的幻覺傾向。

綜上,推理鏈的增強并非無代價,「更聰明」的推理模型在感知類任務上反而可能「看得更少」。

越「聰明」越容易出錯?

圖片

為了深入理解多模態推理模型為何更容易產生幻覺,研究團隊對模型內部的注意力分布進行了系統分析,揭示出一種結構性機制:推理增強并非免費午餐,它以犧牲視覺關注為代價換取語言推理能力的提升

具體來說,相較于非推理模型,R1類推理模型在生成過程中顯著減少了對視覺token的關注,取而代之的是將大量注意力分配給指令token與語言上下文(圖a)。

更為關鍵的是,這種「注意力遷移」并非固定偏差,而是隨著推理鏈條的延展而逐層加劇——越往后層,模型越傾向于忽略圖像輸入,而完全依賴語言信號進行推理。

如圖 (b) 所示,在視覺聚焦任務中,非推理模型(Qwen2.5-VL)在多層均展現出對圖中關鍵區域(如奶酪)的穩定關注;而R1模型(R1-OneVision)在同樣問題下,其注意力熱圖呈現出明顯的視覺退化,深層幾乎完全失焦。

這種結構性偏移使得模型即使面對明確依賴圖像的問題,也往往「憑語言猜」,最終生成與圖像嚴重脫節的幻覺答案。

圖片

不僅如此,研究發現這一現象在模型進入「過度思考」(Overthinking)階段時表現得尤為明顯。

隨著推理鏈的延長,模型對視覺token的關注持續減弱,而對指令等語言token的注意力則顯著增強,導致生成過程越來越依賴語言線索而非圖像內容。

圖片

推理鏈「長度悖論」:思考越多,幻覺越大?

圖片

模型推理鏈條的長短,真的越長越好嗎?研究團隊對比了三種不同的推理長度控制策略在多個基準測試中(Token Budget Forcing、Test-Time Scaling與Latent State Steering),首次系統揭示了一個關鍵現象:推理鏈條的長度與模型表現之間,呈現出非單調的「倒U型」關系

圖片

如圖所示,在以推理為主的任務中(左兩圖),模型準確率先隨推理鏈延長而提升,但當鏈條過長后反而回落,說明「過度思考」并不一定帶來更強的reasoning能力。

而在以感知為主的任務中(右兩圖),隨著推理長度的增加,幻覺率則持續上升,表明冗余語言生成會系統性干擾視覺對齊。

這一趨勢強調:合理控制推理長度,是提升模型穩健性與感知–推理平衡能力的關鍵。

RH-AUC等指標的引入,也為這一非線性關系提供了更具解釋力的定量刻畫。

RH-AUC:推理與幻覺的動態權衡評估

面對多模態模型中推理增強與幻覺放大的兩難局面,研究團隊提出了一項全新評估指標:RH-AUC(Reasoning-Hallucination Area Under Curve)

不同于傳統指標只在單一推理長度上評估準確率或幻覺率,RH-AUC從整體視角出發,衡量模型在不同推理深度下「思考力」與「看清力」的動態平衡水平

圖片

具體做法是:在新構建的RH-Bench數據集中(包含1000個跨感知與推理的樣本),分別統計模型在不同推理長度下的reasoning accuracy與hallucination risk,然后計算兩者構成曲線下的面積。

RH-AUC越高,說明模型在推理增強的同時,視覺對齊能力保持得越好——既能「想得深」,也能「看得清」。

圖片

實驗結果揭示出三個關鍵趨勢:

1. 更大規模模型更具穩健性:如圖 (a) 所示,7B 模型在不同思考深度下展現出更平滑的 RH-AUC 曲線,并在峰值處取得更高分數,說明其具備更強的推理–感知整合能力。

2. RL-only 訓練范式優于SFT+RL:如圖 (b) 所示,在不同訓練策略下,純RL訓練的模型平均 RH-AUC 均高于混合范式,尤其在長推理鏈條件下差距顯著(0.57vs0.50)。

這表明RL-only更傾向于自適應生成高質量的推理路徑,而SFT+RL更容易陷入冗余模仿,從而干擾感知判斷。

3. 數據「類型」比規模更重要:實驗發現,與其盲目擴展訓練集規模,不如引入少量具備領域感知特征的樣本(如數學推理或圖像感知任務),更有助于引導模型在「看圖」與「思考」之間實現平衡。

RH-AUC不僅填補了評估維度上的空白,也為未來多模態模型的訓練目標提供了更明確的參考方向:推理不是越多越好,保持在「看見圖像」與「想通問題」之間的張力,才是更優范式。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-06-10 03:30:00

2025-05-08 06:00:00

AI幻覺AI人工智能

2025-07-04 08:42:00

2025-02-27 10:08:19

2025-03-05 00:22:00

2025-06-13 01:00:00

人工智能大型推理模型推理模型

2025-09-15 09:43:33

分層推理模型循環網絡推理

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-05-28 02:40:00

AdaptThink推理模型AI

2023-10-30 15:06:00

模型數據

2025-05-30 02:00:00

獎勵模型RRMAI

2024-12-30 12:39:29

2025-03-19 09:00:00

模型AI訓練

2025-06-11 14:39:50

AILLMMistral

2024-09-24 11:01:03

2024-12-25 09:30:00

2025-05-26 08:30:00

2023-10-29 13:30:16

多模態LLM架構
點贊
收藏

51CTO技術棧公眾號

人操人视频在线观看| 久草视频免费在线| 欧美精品资源| 中文字幕综合网| 国产成人精品日本亚洲11 | jizzjizz欧美69巨大| 欧美日韩高清在线播放| 精品一二三四五区| 国产精品久久一区二区三区不卡 | 国产精品熟女一区二区不卡| 超免费在线视频| 日本一区二区三区久久久久久久久不 | 日韩欧美精品一区二区| 99在线观看免费| 蘑菇福利视频一区播放| xvideos亚洲人网站| 日韩成人av一区二区| jizzjizz少妇亚洲水多| 亚洲一级片在线观看| 人偷久久久久久久偷女厕| а√中文在线资源库| 久久婷婷影院| 久久久久免费视频| 国产3级在线观看| 日韩成人av在线资源| 欧美精选一区二区| 麻豆av免费在线| 羞羞的视频在线观看| 久久精品在线免费观看| 国产精品久久久久久久天堂第1集 国产精品久久久久久久免费大片 国产精品久久久久久久久婷婷 | 欧美舌奴丨vk视频| 亚洲一区二区三区自拍| 中文字幕av导航| 国产69精品久久app免费版| 丁香一区二区三区| 亚洲xxxx3d| 中文字幕激情视频| 视频一区中文字幕国产| 欧美激情亚洲自拍| 精品国产欧美日韩不卡在线观看| 综合国产视频| 日韩电影在线观看中文字幕| 成人性生交视频免费观看| 亚洲精品.com| 色婷婷精品久久二区二区蜜臂av| 免费看毛片的网址| 日本动漫同人动漫在线观看| 亚洲欧洲国产日韩| 一区二区三区在线视频111| 牛牛影视精品影视| 91丨九色丨蝌蚪丨老版| 久久精品成人一区二区三区蜜臀| 亚洲国产精品久久久久爰性色| 久久国产成人午夜av影院| 国产精品久久久久久久久久久久| 国产婷婷色一区二区在线观看 | 国产精品视频在线看| 欧美日韩一区二区三区在线观看免| 欧美一区二区三区黄片| 成人美女视频在线看| 国产精品嫩草在线观看| 国产小视频免费观看| 国产成人精品免费| 99热99热| 女人18毛片水真多18精品| 国产成人精品1024| 九九九久久久| 九色视频在线播放| 中文字幕巨乱亚洲| 一区二区免费电影| 男人和女人做事情在线视频网站免费观看| 亚洲国产成人私人影院tom | 欧美女人交a| 欧美黑人又粗大| 精品久久免费视频| 国产乱码精品| 国产在线久久久| 99精品视频免费看| 成人黄色av电影| 欧美精品成人一区二区在线观看 | 国产3p露脸普通话对白| 国产高清自产拍av在线| 一本到高清视频免费精品| 午夜激情福利在线| 成人av在线播放| 欧美精品一区二区三区高清aⅴ | 一卡二卡在线视频| 国产激情一区二区三区四区 | 日韩1区2区| 欧美大片第1页| 亚洲婷婷综合网| 美美哒免费高清在线观看视频一区二区| 成人福利视频网| 全国男人的天堂网| 欧美经典三级视频一区二区三区| 自拍偷拍亚洲色图欧美| tube8在线hd| 欧美日韩一二三区| 在线播放第一页| 欧美理论在线播放| 久久久久久久久久av| 日本黄色中文字幕| 高清国产一区二区| 视频在线观看成人| 成人爽a毛片免费啪啪动漫| 色欧美88888久久久久久影院| 91免费视频污| 亚洲人亚洲人色久| 久久99国产精品自在自在app| 亚洲影院在线播放| 国产精品2024| 亚洲伊人婷婷| 久久人体大尺度| 日韩三级视频在线观看| 51妺嘿嘿午夜福利| 一区二区激情| 91麻豆精品秘密入口| 美女做暖暖视频免费在线观看全部网址91 | 国产传媒一区二区三区| 麻豆传媒在线免费| 色老汉一区二区三区| 国产欧美视频一区| 66国产精品| 国产精品一区二区电影| 三级理论午夜在线观看| 亚洲综合免费观看高清完整版在线| 亚洲高清在线免费观看| 九九热精品视频在线观看| 欧美激情视频在线观看| 中文字幕永久在线观看| 久久久久久久久久看片| 久久久久久久久久网| 麻豆一区在线| 久久夜精品香蕉| 中文永久免费观看| 久久久久免费观看| 国产精品va无码一区二区| 9国产精品午夜| 欧美精品一区二区三区国产精品| 少妇无套内谢久久久久| 久久久99精品免费观看| 男人操女人免费| 天天躁日日躁狠狠躁欧美巨大小说| 久久久久久久久久久av| 午夜久久久久久久久久| 亚洲综合偷拍欧美一区色| 色欲无码人妻久久精品| 中文字幕乱码亚洲无线精品一区| 国产精品久久久久久av下载红粉| 激情小视频在线| 色综合天天综合网天天狠天天| 国产精品久久久久久久无码| 国内成人在线| 国产精品亚洲综合| 高清在线视频不卡| 亚洲精品大尺度| 国产精品999在线观看| 91视频免费播放| 久久久久久香蕉| 精品日本12videosex| 国产精品久久久久久亚洲影视 | 自拍偷拍福利视频| 国产精品视频在线看| 国内外成人免费在线视频| 久久一区二区中文字幕| 91久久久亚洲精品| 好久没做在线观看| 国产视频精品xxxx| 综合久久中文字幕| 亚洲精品欧美综合四区| 俄罗斯黄色录像| 国产美女一区| 日韩精品在在线一区二区中文| 欧美三级精品| 久久精品国产清自在天天线 | 黄色日韩网站| 欧美大片va欧美在线播放| 丰满熟妇乱又伦| 黑人极品videos精品欧美裸| 亚洲一区二区三区日韩| 国产一区二区三区视频在线播放 | 久久中文欧美| 伊人久久大香线蕉成人综合网| 美国十次综合久久| 欧美亚洲日本网站| 1769在线观看| 精品国产成人在线影院| 中文字幕一区二区人妻电影| 国产精品免费网站在线观看| 中文字幕永久免费| 久久久国产精品一区二区中文| 亚洲在线观看一区| 狼人精品一区二区三区在线| 国产精品69久久| 视频在线这里都是精品| 亚洲欧美激情一区| 精品国产无码AV| 色狠狠综合天天综合综合| 亚洲AV成人无码精电影在线| 99久久伊人精品| 8x8x成人免费视频| 在线一区欧美| www.黄色网址.com| 国产一区二区精品福利地址| 亚洲自拍另类欧美丝袜| 日韩三级影视| 久久频这里精品99香蕉| 思思99re6国产在线播放| 亚洲国产精品久久精品怡红院| 亚洲中文字幕在线观看| 欧美日韩免费在线| 国产一级二级三级| 国产精品人妖ts系列视频| 日本黄色动态图| 国产美女在线精品| 日本肉体xxxx裸体xxx免费| 亚洲高清成人| 日本福利视频在线观看| 青青草91久久久久久久久| 久久精品ww人人做人人爽| 久久久久久爱| 91精品久久久久久久久久久久久久 | 91成人短视频| 91日本在线视频| 狠狠久久综合| 国产精品美女www爽爽爽视频| 国产区美女在线| 欧美猛少妇色xxxxx| 成年在线观看免费人视频| 日韩二区三区在线| 日韩一级中文字幕| 精品欧美一区二区久久| 一区二区三区播放| 欧美年轻男男videosbes| 亚洲精品毛片一区二区三区| 岛国精品视频在线播放| 日本中文字幕网| 午夜久久久影院| 男女免费视频网站| 亚洲午夜视频在线| 精品少妇theporn| 亚洲一二三区视频在线观看| 欧洲猛交xxxx乱大交3| **网站欧美大片在线观看| 欧美成人另类视频| 亚洲国产精品黑人久久久| a毛片毛片av永久免费| 91美女片黄在线观看| 日韩av一二区| 91蜜桃婷婷狠狠久久综合9色| zjzjzjzjzj亚洲女人| 国产99久久久国产精品潘金| 91人妻一区二区三区| 国产成人av一区二区三区在线| 男插女视频网站| 成人午夜视频福利| 制服丝袜第一页在线观看| 91小视频在线免费看| 性欧美13一14内谢| 欧美激情一二三区| 免费一级suv好看的国产网站| 国产精品久久看| 国产日韩欧美在线观看视频| 亚洲综合色成人| 特黄视频免费看| 欧美在线一区二区| 亚洲一区精品在线观看| 欧美精品乱码久久久久久按摩| 国产精品久久久久久久久毛片| 欧美一区二区三级| 色一情一乱一区二区三区| 精品无人区乱码1区2区3区在线| 精品美女视频在线观看免费软件 | 懂色中文一区二区三区在线视频| 精品精品国产三级a∨在线| 欧美日韩一区二区三区免费| 99九九热只有国产精品| 99视频精品全部免费看| 一区在线视频观看| 十八禁视频网站在线观看| 黄色日韩网站视频| 国产精品入口麻豆| 国产视频在线观看一区二区三区 | 国产精品麻豆久久| 91免费黄视频| 日本不卡的三区四区五区| 免费黄频在线观看| 99国内精品久久| 国产精品酒店视频| 亚洲国产精品久久一线不卡| 久久亚洲精品石原莉奈 | 色www免费视频| 盗摄精品av一区二区三区| www.99热| 亚洲国产精品影院| 中文字幕视频免费观看| 欧美xfplay| 99免在线观看免费视频高清| 久久久久久久色| 人人玩人人添人人澡欧美| 国内精品久久国产| 91精品一区二区三区综合| www一区二区www免费| 久久精品国产精品亚洲精品| 人妖粗暴刺激videos呻吟| 欧美极品美女视频| 色网站在线播放| 欧美一区二区三区播放老司机| 欧美精品a∨在线观看不卡| 久久99国产精品自在自在app| 在线一区视频观看| 精品蜜桃一区二区三区| 99tv成人| 日韩欧美在线免费观看视频| 成人动漫精品一区二区| 蜜臀av午夜精品久久| 91久久人澡人人添人人爽欧美| 亚洲国产精品成人久久蜜臀| 久久精品国产91精品亚洲| 日韩一区精品| 农村寡妇一区二区三区| 国色天香一区二区| 国产精品久久久久久久99| 欧美国产视频在线| 中文字幕在线看人| 精品亚洲一区二区三区在线观看| 三级外国片在线观看视频| 日本国产高清不卡| 久久99国产精品久久99大师| 日本黄网站色大片免费观看| 激情欧美一区二区三区在线观看| 夫妇交换中文字幕| 一本大道久久a久久精二百| 午夜国产在线观看| 97国产在线视频| 国产乱论精品| 性一交一乱一伧国产女士spa| 国产在线精品免费| 三级在线观看免费大全| 538prom精品视频线放| 国产在线更新| 91传媒免费看| 亚洲先锋影音| 一级片免费在线观看视频| ...xxx性欧美| 国产麻豆精品一区| 毛片精品免费在线观看| 麻豆视频久久| 我的公把我弄高潮了视频| 成人激情综合网站| 日韩三级免费看| 日韩精品在线观看视频| 性欧美18~19sex高清播放| 久久久久se| 首页亚洲欧美制服丝腿| 欧美三级视频网站| 欧美日韩精品一区二区三区四区 | 国产一区二区三区在线观看| 日韩视频中文字幕| 国产精品视频一区二区三区| a级黄色片网站| 国产精品99久久久久久久女警| 免费在线黄色片| 亚洲国产精品va在线看黑人动漫| 偷拍自拍在线看| 亚洲激情一区二区三区| 久久国产精品99久久久久久老狼| 人妻久久一区二区| 日韩一区二区三| 欧美久久天堂| 午夜精品区一区二区三| 美女网站一区二区| 激情综合网五月天| 亚洲精品一区二区久| 国产成人精品一区二三区在线观看 | 男人av在线| 成人免费福利在线| 激情综合在线| 精品无码人妻一区二区免费蜜桃| 欧美性xxxxx极品少妇| 制服丝袜在线播放| 久久精品日韩| 精品一区二区综合| 丰满少妇乱子伦精品看片| 日韩在线国产精品| 国产三级精品三级在线观看国产| 乱妇乱女熟妇熟女网站| 国产精品女同一区二区三区| 精品人妻少妇AV无码专区| 人妖精品videosex性欧美| 亚洲成av人电影| 欧美做受喷浆在线观看| 69堂国产成人免费视频| 精精国产xxx在线视频app| 亚洲国产高清国产精品| 成人激情小说乱人伦| 中文字幕在线观看第二页| 孩xxxx性bbbb欧美| 羞羞答答成人影院www| 国产精品1000部啪视频|