精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態LLM幻覺問題降低30%!業內首個“啄木鳥”免重訓方法誕生

開發 前端 人工智能
一個免重訓、即插即用的通用架構,直接從模型給出的錯誤文本下手,“倒推”出可能出現“幻覺”之處,然后與圖片確定事實,最終直接完成修正。

還在用指令微調解決多模態大模型的“幻覺”問題嗎?

比如下圖中模型將橙色柯基錯認為“紅狗”,還指出周圍還有幾條。

圖片圖片

現在,中科大的一項研究想到了一個全新辦法:

一個免重訓、即插即用的通用架構,直接從模型給出的錯誤文本下手,“倒推”出可能出現“幻覺”之處,然后與圖片確定事實,最終直接完成修正。

他們將這個方法命名為“啄木鳥”(Woodpecker)。

圖片圖片

就像這位所謂的“森林醫生”先找出樹木的蟲洞再吃掉里面的蟲子一樣,本文中所提出的“啄木鳥”也是多模態大模型們的“幻覺”醫生,能夠將問題先診斷出來再一一糾正。

結果是“醫術確實高明”,成功將:

(1)MiniGPT-4的準確性從54.67%提高到了85.33%;

(2)mPLUG Ow的準確性從62%提到了86.33%。

如下圖所示,各種難以檢測到的小對象、復雜的計數場景,它都能沒問題。

圖片圖片

那么,它具體是如何診斷的呢?

“啄木鳥法”治療多模態LLM幻覺

目前,業內對于大模型幻覺問題的解決辦法基本都是用特定數據進行指令微調。

比如說,一些多模態大模型(MLLM)在回答問題時總是傾向于肯定答案(eg. 面對一個光頭人物圖,問它頭發是什么顏色,張口就說“黑”),那么我們再喂給模型一些包含負樣本的數據,就能解決它“無中生有”的幻覺,遇到沒有的就說“no”。

除了指令微調,也有的會進行架構調整,反正都要重新訓練一個新的模型。

本文提出的“啄木鳥”框架,是業內第一個無需此操作就能解決“幻覺”的全新辦法。

它一共分為5個步驟,每一步都采用了清晰透明的設計方式,因此具備良好的可解釋性。

圖片圖片

具體而言:

第一步,關鍵概念提取。

指找出模型給出的答案中提到的主要對象,即最有可能解除“幻覺”的元素。

例如對于下圖,多模態大模型最開始可能描述圖中有一輛自行車停在一個垃圾桶旁邊,還說圖上有幾個人從垃圾桶旁邊走過。

圖片圖片

那么,我們就可以得到三個關鍵概念:自行車、垃圾桶和人。

第二步,問題構造。

指在獲取關鍵概念后,圍繞它們提出一些問題有助于檢驗“幻覺”所在的問題。

可主要分為對象層面和屬性層面,前者可以問“圖中有幾輛自行車?”,后者可問“垃圾桶位于什么位置?”。

在此,由于屬性問題比較依賴于上下文,作者也用了一些帶有上下文的例子來提示模型,以便提出的問題更有意義

第三步,視覺驗證。

指引用專家模型回答上步提出的所有問題,方便后續校正。

對于對象層面的問題,例如我們利用GroundingDINO來進行目標檢測,確定關鍵目標是否存在以及關鍵目標的數量。

對于屬性問題,則用BLIP-2來搞定。這類傳統VQA模型輸出答案的長度有限,"幻覺"問題更少。

第四步,視覺斷言生成。

簡單來說,就是基于于前兩步中獲得的問題以及對應的視覺信息,合成結構化的“視覺斷言”。

格式如下:

圖片圖片

最后,“幻覺”糾正。

即根據上步的總結比對模型原始的輸出,得出新的答案。

具體實施環節中,“啄木鳥”采用GPT-3.5-turbo來完成關鍵概念提取、提問和最后一步的糾正。

由于一些多模態模型的指令跟隨能力較弱,導致結果可能輸出無關文本(例如表情、特殊符號),再加上有時一些模型只輸出一個“是”或“否”,這讓實際的校正過程也面臨挑戰。

不過,我們兩個簡單措施就可以搞定:

(1)將模型回答的“是”或“否”與“啄木鳥”給出的答案組合起來,比如“是的,圖像中有一只狗”,就不怕模型原本只是給出一個簡單的“yes or no”逃過校正了。

(2)在校正過程中,將原始問題添加到LLM,以便LLM更好地掌握文本和任務要求。

效果驗證:幻覺減少30%

整個方法看起來非常好理解,效果如何呢?

在此,作者在POPE、MME和LLaVA-QA90數據集上進行了全面的定量和定性實驗。

基線模型選用這四個主流多模態大模型:

MiniGPT-4、mPLUG Owl、LLaVA和Otter。

最終,POPE數據集上的結果如下:

(w/Ours表示由“啄木鳥”校正的MLLM響應,x為未采用,對勾為采用)

可以看到,“啄木鳥”都能給這幾個模型帶來不同程度的提升,同時大幅降低模型回答“yes”的概率。

其中在隨機設定下,它給MiniGPT-4和mPLUG-Owl和在準確率指標上分別帶來了30.66%和24.33%的提升。

圖片圖片

在更全面的MME數據集上,“啄木鳥”也有效減少了多模態大模型在對象級和屬性級層面的“幻覺”,也就是某物是否存在、數量多少,以及它的位置和顏色。

比如LLaVA的顏色得分從78.33分大幅提升到155分。

圖片圖片

不過,位置方面的“幻覺”提升不是特別大,作者推測可能是VQA模型BLIP-2在位置推理方面的能力相對較弱等原因造成的。

為了更直接地衡量修正表現,更直接的方式是使用開放評測。

不同于以往將圖片轉譯后送入純文本GPT-4的做法,作者利用OpenAI最近開放的視覺接口,提出使用GPT-4V對修正前后的圖片描述直接對下列兩個維度進行打分:

(1)準確度:模型的答復相對于圖片內容是否準確;

(2)細節程度:模型答復的細節豐富度。 

在該實驗條件下,實驗結果如下表所示(滿分為10):

圖片圖片

結果表明經過“啄木鳥“修正后圖片描述的準確性有一定的提升,這說明該框架可以有效修正描述中幻視的部分。

另一方面,“啄木鳥“修正后引入的定位信息豐富了文本描述,提供了進一步的位置信息,從而提升了細節豐富度。

GPT-4V輔助的評測樣例如下圖所示:

圖片圖片

試玩

還有Demo供大家測試使用。

如下圖所示,上傳圖片并輸入請求,就可以得到修正前以及修正后的模型答復,以及供參考驗證的新圖片。

 

Woopecker論文地址:
https://arxiv.org/abs/2310.16045 Woopecker代碼地址:https://github.com/BradyFU/Woodpecker

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-10-30 15:06:00

模型數據

2025-06-27 08:40:00

模型推理AI

2025-01-08 08:21:16

2024-12-18 18:57:58

2024-11-14 13:05:12

2024-12-31 08:03:12

2024-01-24 13:16:00

AI訓練

2024-01-11 16:24:12

人工智能RAG

2025-05-06 08:40:00

2024-01-15 06:15:00

模型數據

2024-12-16 07:00:00

2025-08-06 09:10:10

2023-10-27 09:47:22

模態框架

2025-05-08 06:00:00

AI幻覺AI人工智能

2024-08-08 13:04:28

2024-01-03 13:37:00

模型數據

2023-12-25 09:07:50

AI人工智能Ferret

2024-12-17 08:05:34

大型語言模型MetaAILLM

2025-04-28 12:28:27

點贊
收藏

51CTO技術棧公眾號

暧暧视频在线免费观看| 国产日本精品视频| 欧美日韩一区二区综合| 欧美性感一区二区三区| 亚洲AV无码成人精品一区| 乱精品一区字幕二区| 视频一区二区三区中文字幕| 欧美成人在线影院| 麻豆国产精品一区| 九九99久久精品在免费线bt| 日韩欧美亚洲国产一区| 丰满人妻一区二区三区53号| 国产亚洲依依| 粉嫩av亚洲一区二区图片| 国产精品久久久久久久午夜| 精品无码一区二区三区电影桃花 | 午夜午夜精品一区二区三区文| 国产精品视频一二区| 国产欧美午夜| 欧美久久久精品| 极品人妻videosss人妻| 大陆精大陆国产国语精品| 欧美日韩色综合| 日韩中文字幕在线视频观看 | 51午夜精品视频| 国产精品一区二区亚洲| 九九免费精品视频在线观看| 日韩精品中文字幕一区| 美女少妇一区二区| 不卡av播放| 性做久久久久久久免费看| 手机成人av在线| 992tv免费直播在线观看| 99国产精品久| 国产精品免费一区二区三区观看| ,亚洲人成毛片在线播放| 久久婷婷久久| 97在线免费观看| 日本三级视频在线| 亚洲国产一区二区在线观看 | 永久免费网站在线| 中文字幕在线观看一区二区| 日本精品一区| 日本福利片高清在线观看| 国产激情一区二区三区四区 | 国产三级小视频| 麻豆一区二区三| 国产精品丝袜久久久久久高清| 性色av免费观看| 久久国产精品99国产| 欧美在线观看网址综合| 欧美性猛交bbbbb精品| 婷婷五月在线视频| 国产欧美一区二区精品久导航| 久久av免费观看| 午夜国产在线视频| xnxx国产精品| 日本不卡高清视频一区| 国产天堂素人系列在线视频| 国产亚洲精品中文字幕| 日本一区二区三区免费观看| 国产二区视频在线观看| 国产女同互慰高潮91漫画| 亚洲精品成人三区| 欧美videos极品另类| 中文字幕综合网| 亚洲精品少妇一区二区| 亚洲综合影视| 午夜视频在线观看一区二区三区| 91好吊色国产欧美日韩在线| 中文字幕在线直播| 在线亚洲免费视频| www.亚洲自拍| jizz性欧美2| 亚洲老板91色精品久久| 你懂得视频在线观看| 91国语精品自产拍| 久久久久国产一区二区三区| 四虎精品永久在线| 裸体一区二区三区| 国产精品久久久久av福利动漫| 无码精品人妻一区二区三区影院| 国产亚洲一区二区三区在线观看 | 97电影在线看视频| 亚洲人成网站色在线观看| 丰满的少妇愉情hd高清果冻传媒| 激情黄产视频在线免费观看| 91福利区一区二区三区| 国产精品探花在线播放| 清纯唯美亚洲经典中文字幕| 最新国产精品拍自在线播放| 九九热只有精品| 国产农村妇女精品一区二区| 91精品国产综合久久久久久蜜臀| 欧洲成人一区二区三区| 国产精品三级久久久久三级| 国产精品一色哟哟| 国产精品伊人| 亚洲国产精品yw在线观看| 国产真人做爰视频免费| 国产在线不卡| 国产精品一区二区三区久久| 日本高清视频www| 国产精品久久久久久久第一福利| 免费网站在线观看视频| 国产激情欧美| 亚洲欧美日本精品| 国产在线欧美在线| 精品一区二区av| 欧美日韩国产精品一卡| 免费不卡av| 91精品国产高清一区二区三区蜜臀| 久久久久久久久久久国产精品| 一区二区蜜桃| 国产欧美精品久久久| 天堂91在线| 国产精品一二三四五| 久久综合久久久| 久草免费在线色站| 91精品免费观看| 国产99在线 | 亚洲| 性色一区二区三区| 国内视频一区二区| 青春草视频在线观看| 欧美日本视频在线| 欧美黄色高清视频| 免费日韩视频| 精品999在线观看| 91精品国产91久久久久久青草| 欧美日韩国产免费| 精品欧美一区二区久久久| 亚洲激情婷婷| 国产91免费视频| 蜜臀av国内免费精品久久久夜夜| 欧美乱妇一区二区三区不卡视频| 免费看91的网站| 丝袜a∨在线一区二区三区不卡| 久久一区二区三区av| av岛国在线| 日韩欧美电影一区| 欧美极品aaaaabbbbb| 国产福利一区二区三区| 国风产精品一区二区| 国产精久久一区二区| 久久影视免费观看 | 黑人精品欧美一区二区蜜桃| 亚洲欧洲一区二区福利| 国产亚洲人成a在线v网站| 在线播放日韩av| 亚洲一区二区三区高清视频| 国产精品美女久久久久久久网站| 亚洲综合婷婷久久| 久久久久久久久久久久久久久久久久 | 在线男人天堂| 亚洲欧美日韩网| 波多野结衣一区二区三区在线| 国产色产综合产在线视频| 日本www.色| 国产精品传媒精东影业在线| 91色中文字幕| 免费污视频在线| 国产视频精品在线| 亚洲精品国产精品乱码视色| 中文字幕欧美国产| 国产91在线免费观看| 精品成人免费| 日本视频一区在线观看| 亚洲国产天堂| 久久久久久久亚洲精品| 青青青草原在线| 欧洲精品在线观看| 日韩欧美综合视频| 成人sese在线| 久久午夜夜伦鲁鲁一区二区| 国产精品久久占久久| 亚洲综合第一页| 蜜桃在线视频| 色七七影院综合| 亚洲精品无遮挡| 岛国av一区二区在线在线观看| 在线视频第一页| 国产经典欧美精品| 美女网站免费观看视频 | 国产极品在线视频| 国产一区二区三区电影在线观看 | 欧美性一区二区三区| 国产日韩精品在线看| 制服丝袜亚洲精品中文字幕| 精品在线播放视频| 国产精品久久久久影院亚瑟| 日韩av手机在线播放| 蜜臀av性久久久久蜜臀av麻豆| 国产小视频免费| 精品日韩欧美一区| 国产精品一区二区你懂得| 欧美日韩五码| 国模吧一区二区三区| 调教视频免费在线观看| 亚洲国产91色在线| 国产精品一级视频| 色婷婷亚洲综合| 免费中文字幕在线观看| 国产精品美女久久福利网站| 你懂得在线视频| 国产精品一色哟哟哟| 国产视频一区二区视频| 99精品国产在热久久下载| 椎名由奈jux491在线播放 | 成人av电影免费观看| 奇米视频888| 六月婷婷一区| 僵尸世界大战2 在线播放| 99热在线成人| 日韩中文字幕一区二区| 欧美1区二区| 痴汉一区二区三区| 国产专区精品| 国产欧美va欧美va香蕉在| 日韩大片欧美大片| 91国内在线视频| 日本一级理论片在线大全| 久久精品中文字幕| 69久久精品| 伊人伊人伊人久久| 精品三级久久久久久久电影聊斋| 精品成人免费观看| 亚洲第一天堂网| 日韩欧美色综合网站| 国产又粗又猛又爽又黄视频| 欧美日韩视频在线观看一区二区三区| 波多野结衣爱爱| 色视频成人在线观看免| 国产情侣在线视频| 亚洲 欧美综合在线网络| 久久成人国产精品入口| 亚洲综合色婷婷| 青娱乐在线视频免费观看| 亚洲精品高清视频在线观看| 动漫性做爰视频| 国产精品久久久爽爽爽麻豆色哟哟| 日本黄色激情视频| 国产精品沙发午睡系列990531| 成人激情五月天| 国产精品美日韩| 99久久久免费精品| 亚洲天堂精品在线观看| 日本少妇高清视频| 一区二区国产盗摄色噜噜| 久久久久久久极品内射| 亚洲在线免费播放| 日韩欧美不卡视频| 欧美日韩中文字幕在线| 免费看毛片网站| 在线观看免费亚洲| 在线观看国产黄| 欧美一级片免费看| 女人18毛片水真多18精品| 亚洲国产精品久久久久秋霞蜜臀 | 国产精品欧美日韩久久| 久久久久黄色| 999国内精品视频在线| 成人精品动漫一区二区三区| 精品亚洲欧美日韩| 国产精品嫩草影院在线看| 亚洲欧美国产精品桃花| 一本精品一区二区三区| 精品少妇一区二区三区在线| 久久久噜噜噜| 久久久久久久久久毛片| 成人做爰69片免费看网站| 男生裸体视频网站| 中文字幕 久热精品 视频在线| 国产又粗又硬又长又爽| 亚洲午夜精品一区二区三区他趣| 亚洲第一精品在线观看| 欧美日韩亚州综合| 高h震动喷水双性1v1| 亚洲男人天堂视频| 99福利在线| 欧美在线视频观看免费网站| 日韩三级成人| 国产一区二区三区四区五区加勒比| 偷拍一区二区| 永久免费在线看片视频| 亚洲欧美高清| www.久久com| 久久久久综合网| 免费三片在线播放| 日本韩国欧美三级| 成人久久久精品国产乱码一区二区| 亚洲人成网7777777国产| av超碰免费在线| 国产经典一区二区| 国产suv精品一区二区四区视频| 亚洲欧美在线网| 亚洲中午字幕| 久久久久久久久久久久国产精品| 中文字幕免费在线观看视频一区| 久久久国产精品人人片| 欧美日韩一区二区在线观看| 亚洲av毛片成人精品| 超在线视频97| 成人国产精选| 久久精品中文字幕一区二区三区 | 色婷婷久久综合| 亚洲av无码一区二区三区dv | 日本一级特级毛片视频| 欧美性猛交xxxx久久久| 午夜精品久久久久久久爽| 日韩在线激情视频| 欧美性xxx| 精品亚洲欧美日韩| 伊人久久综合| 男生和女生一起差差差视频| 欧美激情综合网| 久久久久99精品成人片三人毛片| 欧美精品一区二区三区久久久| 久久精品视频免费看| 国产成人在线亚洲欧美| 天堂综合网久久| 国产精品无码人妻一区二区在线| 国产精品综合网| 黑人狂躁日本娇小| 欧美日韩在线播放一区| 国产无套粉嫩白浆在线2022年| 欧美一二三视频| 麻豆精品av| 5月婷婷6月丁香| 成人av免费在线播放| 国产主播在线播放| 精品成人一区二区三区四区| 亚洲第一图区| 99中文字幕| 欧美日韩视频| 日韩女优在线视频| 亚洲在线视频网站| 天天操天天干天天爽| 久久人人爽国产| 久久久久久毛片免费看 | 国产欧美一区二区三区精品酒店| 久久久久久久久久久久久久久久av| 伊人天天综合| 五月婷婷综合在线观看| 色综合久久久久综合体桃花网| 男人久久精品| 国产精品99久久99久久久二8| 国产精品一在线观看| 乌克兰美女av| 中文字幕在线不卡一区| 99在线精品视频免费观看20| 久色乳综合思思在线视频| 亚洲日本va| 日本韩国欧美在线观看| 久久免费的精品国产v∧| 91久久国产综合久久91| 色综久久综合桃花网| 中文成人在线| 免费拍拍拍网站| 久久久三级国产网站| 中文字幕乱码一区二区| 久久久av电影| 久久久久观看| 91国产精品视频在线观看| 亚洲色图另类专区| 丰满肥臀噗嗤啊x99av| 欧美洲成人男女午夜视频| 欧美日韩亚洲在线观看| 亚洲精品久久久久久| 欧美性猛交xxxx久久久| 亚洲精品传媒| 国产精品久久久久免费| 久久精品盗摄| 日韩影院一区二区| 亚洲精品美女久久久久| 成人精品国产亚洲| a天堂资源在线观看| 久久精品男人的天堂| www夜片内射视频日韩精品成人| 91chinesevideo永久地址| 日韩欧美高清| yjizz视频| 精品视频999| 国产在线观看www| 亚洲视频精品一区| 成人午夜在线免费| 中文字幕乱码视频| 国自产精品手机在线观看视频| 日韩精品诱惑一区?区三区| 日本中文字幕精品| 在线观看日韩精品| segui88久久综合9999| 中文有码久久| 26uuu色噜噜精品一区| a在线观看视频| 国产精品三级久久久久久电影| 激情综合视频| 日韩一级片大全| 亚洲天堂第二页| 国产一级成人av| 超碰91在线播放|