精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

當視覺大模型陷入認知失調,馬里蘭大學構建了一個幻覺自動生成框架

人工智能 新聞
馬里蘭大學的研究團隊提出了一個名為 AutoHallusion 的視覺大模型幻覺自動生成框架。

本文的共同第一作者是馬里蘭大學電子計算機工程系的博士生吳曦旸(https://wuxiyang1996.github.io/)和計算機科學系的關天瑞(https://tianruiguan.phd/)。吳曦旸的研究方向主要涵蓋強化學習、自動駕駛,以及大語言模型在機器人導航和計算機視覺中的應用。關天瑞的研究則聚焦于計算機視覺和視覺語言模型在機器人、自動駕駛等領域的應用。本文的指導老師為李典奇,周天翼教授 (https://tianyizhou.github.io/)和 Dinesh Manocha 教授 (https://www.cs.umd.edu/people/dmanocha)。

想象一下,有一天你在沙漠中看到一個雪人,或者在雪地里發現一棵棕櫚樹。面對這些與周圍環境格格不入的景象,你是否會感到心理上的不適?

在認知科學領域,研究者普遍認為人腦傾向于利用以往的經驗來解讀觀察到的信息并構建記憶。然而,當人腦接收到與以往認知不符的信息時,可能會因為 “認知失調”(Cognitive Dissonance)而對外部環境產生誤判,進而在行為上表現出矛盾。例如,我們通常認為電腦是由人類操控的,但如果我們看到一只章魚在操控電腦,這種不符合常理的場景會讓人腦產生認知失調的不適感。

隨著對大模型的深入研究,研究人員發現,在認知和推理任務上,大模型的思維過程與人腦有一定相似之處。因此,針對人腦認知失調特點設計的實驗也能使大模型出現類似的 “幻覺” 現象。

基于這一觀察,馬里蘭大學的研究團隊提出了一個名為 AutoHallusion 的視覺大模型幻覺自動生成框架。這一工作基于團隊之前在 CVPR 2024 上發表的工作 HalluionBench(https://arxiv.org/pdf/2310.14566)。它通過在場景圖像中插入或刪除特定物體,并針對這些修改后的圖像提問,從而檢測大模型在回答時可能出現的幻覺現象。

這一方法能夠自動生成大量的大模型幻覺案例,有效緩解當前大模型幻覺研究中數據集缺乏的問題。在 GPT-4V、Gemini 和 Claude 等大模型上的實驗表明,這些模型在本文提出的提出的基準數據集上問答準確率最高僅為 66.0%。該研究成果已發表于 EMNLP 2024。

圖片

  • 論文標題:AUTOHALLUSION: Automatic Generation of Hallucination Benchmarks for Vision-Language Models
  • 論文鏈接:https://arxiv.org/pdf/2406.10900
  • 項目主頁及代碼:https://wuxiyang1996.github.io/autohallusion_page/

文章概述

大型視覺語言模型(LVLMs)在內容生成、自動駕駛和機器人等領域中扮演著重要角色。然而,它們也會出現 “幻覺” 現象,即生成的響應中包含視覺內容中不存在的信息。這些幻覺通常是由于語言模塊過度依賴語言先驗信息而忽略視覺輸入所致。

為了解決這一問題,之前的工作通常收集幻覺案例建立基準數據集,并以此對大模型進行微調,以減少可能存在的幻覺。然而,手動創建幻覺案例和基準既耗時又昂貴。此外,之前的工作對大模型產生幻覺的機制研究有限,在缺乏足夠代表性案例的情況下對大模型進行微調,可能會導致模型出現過擬合現象。

為此,本文提出了 AUTOHALLUSION 框架,可以自動生成各種幻覺案例并進行批量生產。該框架基于認知科學原理,針對大模型產生幻覺的原因,提出了三種主要策略:插入異常物體、插入成對物體和移除相關物體,通過操控場景中的物體構成來創建與語言先驗相沖突的圖像。

為了生成能夠觸發大模型幻覺的(圖像 - 問題)組合,本文針對修改后的圖像,設計相應的問題探測大模型的語言模塊,定位特定物體或其在相關情境中的語言先驗信息。如果大模型的推理受到語言先驗的偏見影響,例如在根據圖片回答某一特定物體的問題時,大模型根據場景圖片的先驗知識而非物體本身傳遞的信息來作答,那么就可能生成與事實不符或前后不一致的響應,從而導致幻覺現象。

AUTOHALLUSION 在包括 GPT-4V、Gemini、Claude 和 LLaVA 等最新的大模型上進行了實驗,并整理發布了一個基準數據集,來評估模型性能。在該基準數據集上的實驗結果表明,GPT-4V 等大模型的問答準確率最高僅為 66.0%。

數據集地址:https://github.com/wuxiyang1996/AutoHallusion

研究方法

圖片

AUTOHALLUSION 的整體流程分為四個部分:

1. 場景生成:AUTOHALLUSION 使用合成或真實世界圖像作為場景圖。例如,在辦公室場景中,假設場景中有電腦、辦公桌、辦公椅等與辦公室主題一致的物體,而不會有炒鍋等與主題無關的物體。圖像可以通過 DALL-E 等圖像生成模型根據提示生成,也可以從 MSCOCO 等公開數據集中提取場景。

2. 圖像處理:AUTOHALLUSION 采用三種策略操控場景中的物體構成,以創建與語言先驗相沖突的圖像:

  • 插入異常物體:將與場景主題不相關的異常物體添加到場景中,例如,在辦公室場景中添加通常不會出現的炒鍋。
  • 插入成對物體:對通常一起出現的兩個物體進行分離,保留一個并移除另一個。例如,牙刷和牙膏通常一起出現,而在修改后的圖像中,只保留牙刷并移除牙膏。
  • 移除相關物體:從原場景中移除一個相關物體,例如,在辦公室場景中抹除顯示器。

3. 構造問題:AUTOHALLUSION 針對圖像處理過程中插入或刪除的物體進行提問,并相應地構造事實信息。問題主要分為兩類:

  • 存在性問題:詢問目標物體是否存在于圖像中,問題提示信息的細節級別不一,從不提供額外信息到提供完整的圖像描述。
  • 空間關系問題:詢問目標物體與場景中其他物體的相對位置,并在問題提示中提供場景物體的名稱或描述。

圖片

4. 幻覺檢測:AUTOHALLUSION 通過對比大模型的回答與事實信息或其他回答,來判斷其回答中是否存在幻覺。目前,AUTOHALLUSION 能夠檢測以下兩種類型的大模型幻覺:

  • 正確性:大模型的回答與基本事實不一致。
  • 一致性:大模型在面對包括不同級別的補充信息的問題時,無法給出一致的答案,或者在針對某一特定物體的提問中,未能提供與圖像描述一致的答案。

實驗結果

下表展示了通過 AutoHallusion 生成的大模型幻覺案例的成功率,結果顯示出以下幾個主要發現:

  • 插入物體的幻覺生成策略比刪除物體的策略更有效。
  • 基于物體存在性構建的問題比基于物體空間關系的問題更容易引發幻覺。
  • GPT-4V 在防止大模型幻覺方面表現最好。
  • 針對真實世界數據集構建的幻覺案例成功率高于合成數據集。本文認為,這可能是由于大模型難以處理真實世界圖像中物體語義關系的復雜性所致。

圖片

下圖展示了針對物體 - 場景對齊關系的消融實驗結果。在該實驗中,本文采用不同的大模型來生成用于圖像編輯的物體,并在視覺問答(VQA)任務中進行評估。

圖片

基準數據集指標

本文從以下三個方面評估了通過 AutoHallusion 生成的基準數據集:

  • 多樣性:衡量數據集中不同場景和對象的數量,包括 200 個(合成)/160 個(真實世界)樣本。
  • 圖像質量:通過原始圖像和編輯圖像的 IS(Inception Score)分數,以及原始圖像與編輯圖像之間的 Frechet Inception Distance (FID) 距離來評估。
  • 有效性:通過每個樣本中引發幻覺的平均問題數量來衡量。

圖片

下表展示了 GPT-4V、Gemini、Claude 和 LLaVA 等大模型在通過 AutoHallusion 生成的基準數據集上的表現。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-31 12:23:17

GPT-4版本VLM

2025-09-18 09:00:47

2025-08-18 17:20:17

AI大模型數據

2025-09-03 14:02:08

AI大模型訓練

2023-10-07 06:50:03

2023-11-03 12:56:00

AI模型

2025-04-26 09:25:00

模型推理AI

2025-03-03 09:00:00

2020-10-26 10:51:09

人工智能AI語言

2025-04-15 09:00:00

模型推理AI

2019-01-03 09:04:04

谷歌系統機器

2025-01-23 08:22:22

2024-01-30 21:18:57

語言模型圖像序列機器人

2025-02-26 07:00:00

Go 語言Ollama 模型dubbogo

2021-10-09 15:32:11

信息安全技術

2021-07-02 16:24:08

自動駕駛無人駕駛人工智能

2025-01-06 11:10:00

架構模型AI

2024-06-17 13:34:38

2023-06-19 13:44:00

AI3D
點贊
收藏

51CTO技術棧公眾號

国产精品小仙女| 中文字幕日韩欧美精品高清在线| 日韩欧美精品中文字幕| 三区精品视频观看| 国产激情无套内精对白视频| 亚洲网站啪啪| 国产亚洲精品va在线观看| theporn国产精品| sm久久捆绑调教精品一区| 国产亚洲欧洲997久久综合 | 最近2019中文免费高清视频观看www99 | 男女免费观看在线爽爽爽视频| 成人精品免费网站| 国产成人中文字幕| 国产免费无码一区二区视频| 久久综合欧美| 日韩欧美一级二级| 91在线视频观看免费| 97超碰资源站在线观看| 久久久久久久久久久久久女国产乱 | 播播国产欧美激情| 中国av免费看| 中文字幕av一区二区三区四区| 91黄色激情网站| 自拍日韩亚洲一区在线| huan性巨大欧美| 欧美激情资源网| 久久大片网站| 丰满人妻熟女aⅴ一区| 蜜桃久久精品一区二区| 97成人精品区在线播放| 欧洲猛交xxxx乱大交3| 欧美日韩国产在线观看网站| 亚洲国产精品久久久| 亚洲理论中文字幕| 精品国产黄a∨片高清在线| 天天色天天操综合| 国产一线二线三线女| 国产区在线观看| 国产精品久久久久久久第一福利 | 最新中文字幕视频| 果冻天美麻豆一区二区国产| 日韩欧美一区二区在线视频| 欧美成人三级在线播放| 视频在线日韩| 在线一区二区三区四区五区| 无遮挡又爽又刺激的视频 | 午夜精品久久久久久久99水蜜桃| avove在线观看| 免费黄色在线网站| 国产精品不卡视频| 在线成人av电影| 青青青青在线| 国产精品国产自产拍在线| 日韩欧美亚洲日产国产| 黄色av网站在线看| 久久精品欧美一区二区三区不卡| 欧美伦理一区二区| 黄色片在线免费观看| 91美女精品福利| 欧美 日韩 国产在线| 欧美日韩国产综合视频| 91色乱码一区二区三区| 开心色怡人综合网站| 久热av在线| 日本一区二区免费在线观看视频 | 91夜夜揉人人捏人人添红杏| 国产免费高清av| 国产成人小视频| 国产自产精品| 免费在线一级视频| 中文字幕精品在线不卡| 樱花www成人免费视频| av网址在线看| 婷婷丁香久久五月婷婷| 乱子伦视频在线看| 四虎国产精品成人免费影视| 欧美一级免费观看| 欧美xxxx×黑人性爽| 综合亚洲自拍| 色噜噜狠狠狠综合曰曰曰88av| 顶级黑人搡bbw搡bbbb搡| 欧美色一级片| 国产mv免费观看入口亚洲| 中文字幕久久熟女蜜桃| 国产美女一区二区| 精品人伦一区二区三区| av网页在线| 亚洲综合另类小说| 爱福利视频一区二区| 日本a人精品| 精品国产乱码久久久久久牛牛| 右手影院亚洲欧美| 国产精品毛片一区二区在线看| 高清欧美性猛交xxxx黑人猛交| 天堂网中文字幕| 国产麻豆午夜三级精品| 麻豆91av| 色在线视频网| 欧美艳星brazzers| 特级特黄刘亦菲aaa级| 少妇精品久久久一区二区| 美乳少妇欧美精品| 亚洲欧美一二三区| 丁香亚洲综合激情啪啪综合| 视频一区视频二区视频三区视频四区国产 | 久久久免费观看| 在线中文字幕网站| 99精品黄色片免费大全| 美国av在线播放| 自拍一区在线观看| 日韩欧美中文字幕一区| 天天操天天干天天操天天干| 亚洲激情精品| 91成人免费观看| 秋霞a级毛片在线看| 疯狂做受xxxx高潮欧美日本| 无人码人妻一区二区三区免费| 妖精视频一区二区三区免费观看 | 亚洲不卡一卡2卡三卡4卡5卡精品| 五月婷婷在线观看| 色婷婷av一区二区三区gif | 久久久激情视频| 久久人人爽人人爽人人av| 成人久久网站| 亚洲欧美中文日韩v在线观看| 黄色在线观看免费| 激情综合五月婷婷| 亚洲7777| 成人四虎影院| 亚洲欧美成人网| 日韩精品成人一区| 懂色av噜噜一区二区三区av| 中国老女人av| 国产美女精品视频免费播放软件 | 51精品视频| 欧美一级淫片007| 欧美日韩生活片| 日韩精品成人一区二区三区| 欧美婷婷久久| 亚洲欧美se| 亚洲欧美在线一区二区| 人妻 日韩精品 中文字幕| aaa亚洲精品| av高清在线免费观看| 一区中文字幕电影| 欧美精品福利视频| 亚洲国产综合一区| 亚洲一区二区三区中文字幕在线| 欧美体内she精高潮| 亚洲精品网址| 成人午夜电影免费在线观看| 午夜av在线播放| 精品美女一区二区| 激情综合网五月婷婷| 99久久国产综合精品色伊| 久久久性生活视频| 欧美一级色片| 国产成人综合亚洲| www黄在线观看| 精品视频色一区| 视频国产一区二区| 国产精品亚洲第一区在线暖暖韩国| 最新黄色av网站| 97久久亚洲| 欧美有码在线观看| 国产精品久久久久久久龚玥菲 | 国内精品久久久久| 日韩电影网址| 欧美午夜寂寞影院| 久久久久久久久久网站| 97se亚洲国产综合自在线观| 国产精品无码一本二本三本色| 精品久久久久久久久久久下田 | 亚洲综合小说图片| 国产精品视频在线观看| av小次郎在线| 亚洲女人天堂网| 国产精品久久久久久久免费| 亚洲一区二区欧美日韩| 无码人妻精品一区二区中文| 看国产成人h片视频| 国产成人一二三区| 亚洲黄页在线观看| 国产主播在线一区| 国产高清中文字幕在线| 国产亚洲aⅴaaaaaa毛片| 999国产精品视频免费| 黄网动漫久久久| 老司机深夜福利网站| 成a人片国产精品| 国产精品v日韩精品v在线观看| 狠狠噜噜久久| 神马影院一区二区| aaa国产精品视频| 国产精品久久久久久久久| 18视频在线观看| 国产一区二区三区中文| www.亚洲黄色| 欧美午夜免费电影| 久久久国产精品成人免费| |精品福利一区二区三区| 精品视频站长推荐| 久国产精品韩国三级视频| www.99热这里只有精品| 亚洲不卡av不卡一区二区| 裸模一区二区三区免费| 在线精品视频一区| 国产精品中文久久久久久久| 欧美男人天堂| 欧美肥臀大乳一区二区免费视频| 国产粉嫩一区二区三区在线观看| 精品久久久久久无| 中文字幕资源网| 欧美日韩在线视频观看| 国产亚洲精品成人| 亚洲欧洲色图综合| 人妻av无码一区二区三区 | 91成人精品一区二区| 成人av综合一区| 91免费视频污| 精品一区二区三区视频在线观看 | 国产精品99久久久久久宅男| 乌克兰美女av| 美女久久一区| 成人一区二区免费视频| 欧美女人交a| 一本—道久久a久久精品蜜桃| 国产欧美日韩精品高清二区综合区| 国产欧美一区二区三区另类精品| 国产精品一区三区在线观看| 国产免费一区二区三区在线能观看 | 一区三区视频| 日韩一级特黄毛片| 中文字幕人成人乱码| 欧美日韩一区二区三区电影| 欧美国产偷国产精品三区| 日韩av一区二区三区在线观看| 欧美黄色网视频| 狠狠色综合一区二区| 久久动漫网址| 九九九九精品九九九九| 蜜桃久久久久| 快播亚洲色图| 免费不卡中文字幕在线| 欧美人与物videos另类| 宅男在线一区| 亚洲国产高清国产精品| 日韩激情图片| 亚洲第一精品区| 91精品一区二区三区综合在线爱 | 国产日韩精品久久| 黄色成人美女网站| 国产视频不卡| 亚洲区小说区| 神马一区二区影院| 97色伦图片97综合影院| 丰满女人性猛交| 国产精品草草| 无码aⅴ精品一区二区三区浪潮 | 欧美精品v国产精品v日韩精品| 亚洲无码久久久久| 日韩欧美黄色影院| 神马午夜精品95| 亚洲人成啪啪网站| 亚乱亚乱亚洲乱妇| 欧美黄色片在线观看| 国产精选在线| 国产精品18久久久久久首页狼| 日韩在线激情| 成人黄动漫网站免费| 欧美精品国产白浆久久久久| 欧美一区二区视频17c| 成人激情诱惑| 色一情一乱一乱一区91| 一区在线观看| 尤蜜粉嫩av国产一区二区三区| 国内久久婷婷综合| 99久久免费看精品国产一区| 国产无一区二区| 黄色片在线观看网站| 狠狠躁18三区二区一区| 亚洲男人天堂网址| 日韩三级电影网址| 可以在线观看的黄色| 欧美精品免费在线| 成人福利视频| 91成人理论电影| 欧美精品一区二区三区精品| 日韩中文在线字幕| 久久精品天堂| 久久久久亚洲av无码专区首jn| 91美女福利视频| 欧美三级 欧美一级| 色88888久久久久久影院野外| 国产精品毛片一区视频播| 亚洲精品mp4| 超鹏97在线| 国产精品18久久久久久麻辣| 99久久人爽人人添人人澡| 亚洲精品无人区| 国产欧美日本| 国产在线视频三区| 欧美国产视频在线| 久久久久久久伊人| 3d成人h动漫网站入口| 男人的天堂在线| 久久久久久久久久久成人| 欧美天堂在线| 欧美一区二区福利| 亚洲黄色免费| 又黄又爽又色的视频| 国产精品乱码人人做人人爱 | 久久久久高清| 欧美日韩网址| 五月天婷婷影视| 日本一区二区三区在线观看| 黄色在线观看国产| 精品88久久久久88久久久| 国产盗摄在线观看| 国产精品专区一| 国产尤物久久久| 中文字幕日本最新乱码视频| 成人在线视频一区| 午夜爽爽爽男女免费观看| 欧美在线观看视频在线| 女人偷人在线视频| 2019中文在线观看| 卡一精品卡二卡三网站乱码| 韩国无码av片在线观看网站| 国模无码大尺度一区二区三区| 国产传媒在线看| 91黄色小视频| www在线播放| 国产欧美一区二区三区在线看 | av毛片久久久久**hd| 国产一级av毛片| 亚洲成人教育av| 国产一线二线在线观看| www.成人av.com| 狠狠色综合网| 欧美熟妇精品一区二区蜜桃视频| 亚洲综合一二三区| 可以免费观看的毛片| 欧美极品少妇xxxxⅹ裸体艺术 | 久久精品国产亚洲av高清色欲 | 国内精品久久久久国产盗摄免费观看完整版| 中文字幕 欧美日韩| 中文字幕一区二区不卡| 97视频免费在线| 欧美高跟鞋交xxxxxhd| 午夜精品在线| 久久久久久久久久网| 成人av在线影院| 岛国av中文字幕| 伊人精品在线观看| 成人在线分类| 人妻无码一区二区三区四区| 成人h精品动漫一区二区三区| www.国产高清| 国产一区二区日韩| 日韩精品第二页| 国产91在线亚洲| 久久免费精品国产久精品久久久久| 五月婷婷激情视频| 视频在线一区二区| 亚洲网一区二区三区| 日韩国产欧美亚洲| 国产无一区二区| 精品国产乱码久久久久久蜜臀网站| 欧美黄色免费网站| 你懂的一区二区三区| 五月天av在线播放| 亚洲综合男人的天堂| 日本在线视频1区| 成人黄色av免费在线观看| 黄色av日韩| 国产又黄又粗视频| 日韩欧美久久一区| 欧美成人a交片免费看| 国产a级片免费看| 粉嫩久久99精品久久久久久夜| 亚洲精品男人的天堂| 日韩中文字幕在线| 精品国产导航| 国产精品一区二区小说| 亚洲午夜久久久久久久久电影网| 欧美日韩国产综合视频| 亚洲伊人第一页| 亚洲免费婷婷| 日本黄色片免费观看| 亚洲久久久久久久久久久| 高清久久精品| 北条麻妃在线视频| 一区二区三区精密机械公司| 成人综合影院| 精品国产乱码久久久久久108| 美女视频免费一区| 国产成人亚洲精品自产在线| www国产亚洲精品久久网站|