精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用人工智能幻覺評估圖像真實感? 原創

發布于 2025-4-9 08:18
瀏覽
0收藏

本文提出了一種使用人工智能幻覺來評估圖像真實感的新方法,對此方法的實現原理進行詳細闡述,并給出詳細的實驗結果證明。

引言

最近,俄羅斯的一項新研究提出了通過一種非常規方法來檢測不切實際的人工智能生成的圖像。這種方法的主要思想是:不是通過提高大型視覺語言模型(LVLM)的準確性,而是通過有意利用它們??產生幻覺的傾向??。?

這種新方法使用LVLM提取有關圖像的多個“原子事實”,然后應用??自然語言推理??(NLI)系統地衡量這些陳述之間的矛盾,從而有效地將模型的缺陷轉化為檢測違背常識的圖像的診斷工具。?

使用人工智能幻覺評估圖像真實感?-AI.x社區

WHOOPS!數據集中的兩幅圖像以及LVLM模型自動生成的語句(左側圖像非常逼真,因此可以產生一致的描述,而右側圖像則不同尋常,導致模型產生幻覺,產生矛盾或錯誤的語句。圖片來源:https://arxiv.org/pdf/2503.15948)

當被要求評估第二幅圖像的真實度時,LVLM發現有些不對勁,因為所描繪的駱駝有三個駝峰,這在??自然界中是未知的??

然而,LVLM最初將大于2個駝峰與大于2只動物混為一談,因為這是你在一張“駱駝圖片”中看到三個駝峰的唯一方式。然后,它繼續產生幻覺,產生比三個駝峰更不可能的東西(即“兩個頭”),并且從未詳細描述似乎引發其懷疑的內容——不太可能的額外駝峰。

這項新研究的研究人員發現,LVLM模型可以原生地執行此類評估,并且與針對此類任務進行??微調???的模型相當(甚至更好)。由于微調復雜、昂貴且在下游適用性方面相當脆弱;因此,他們發現當前AI革命中??最大的障礙??之一的原生用途是對文獻中總體趨勢的一次令人耳目一新的轉變。?

開放式評估

作者斷言,上述方法的重要性在于它可以與開源框架一起部署。雖然像ChatGPT這樣的先進且高投資的模型(該論文承認)可能在這項任務中提供更好的結果,但對于我們大多數人(尤其是業余愛好者和VFX社區)來說,該文獻的真正價值在于有可能在本地實現中融入和開發新的突破;相反,所有注定要用于專有商業API系統的產品都可能被撤回、任意漲價和經受審查——這些審查政策更有可能反映公司的企業關切,而不是用戶的需求和責任。

??這篇新論文???的標題為《不要對抗幻覺,而要利用它們:使用NLI而非原子事實估計圖像真實性》,該文由來自斯科爾科沃科學技術學院(Skoltech)、莫斯科物理技術學院以及俄羅斯公司MTSAI和AIRI的五名研究人員共同撰寫。該論文還提供了一個相應的??GitHub頁面??。?

研究方法

論文作者們使用以色列/美國??WHOOPS!數據集??研究這個項目:?

使用人工智能幻覺評估圖像真實感?-AI.x社區

WHOOPS!數據集中不可能出現的圖像示例。值得注意的是,這些圖像如何組合合理的元素,并且它們的不可能性必須基于這些不兼容方面的串聯來計算。來源:https://whoops-benchmark.github.io/。

該數據集包含500張合成圖像和超過10,874條注釋,專門用于測試AI模型的常識推理和構圖理解。它是與設計師合作創建的,這些設計師的任務是通過文本到圖像系統(例如Midjourney和DALL-E系列)生成具有挑戰性的圖像——產生難以或不可能自然捕捉的場景:

使用人工智能幻覺評估圖像真實感?-AI.x社區

WHOOPS!數據集中的更多示例。來源:https://huggingface.co/datasets/nlphuji/whoops

他們提出的新方法可劃分為三個階段:首先,LVLM(具體來說是??LLaVA-v1.6-mistral-7b???)被提示生成多個描述圖像的簡單語句(稱為“原子事實”)。這些語句是使用??多樣化集束搜索??生成的,確保輸出的可變性。?

使用人工智能幻覺評估圖像真實感?-AI.x社區

多樣化集束搜索通過優化多樣性增強目標,提供了更多種類的字幕選項(來源:https://arxiv.org/pdf/1610.02424)。

接下來,他們使用自然語言推理模型系統地將每個生成的語句與每個其他語句進行比較,該模型分配的分數反映了語句對是否相互包含、矛盾或中立。

矛盾的話,表明圖像中存在幻覺或不切實際的元素:

使用人工智能幻覺評估圖像真實感?-AI.x社區

實驗中使用的檢測管道的架構

最后,他們將這些成對的NLI分數聚合為單個“現實分數”,以量化生成的語句的整體一致性。

研究人員探索了不同的聚合方法,發現基于聚類的方法效果最佳。他們應用k-means聚類算法將單個NLI分數分成兩個聚類,然后選擇值較低的聚類的質心作為最終指標。

使用兩個聚類直接符合分類任務的二元性質,即區分真實圖像和非真實圖像。其邏輯類似于簡單地選擇總體最低分;然而,聚類允許指標表示多個事實的平均矛盾,而不是依賴于單個異常值。

數據和測試

研究人員使用旋轉??測試分割???(即??交叉驗???)在WHOOPS!基線基準上測試了他們的系統。測試的模型是分割的??BLIP2 FlanT5-XL???和??BLIP2 FlanT5-XXL??,以及零樣本格式的BLIP2 FlanT5-XXL(即無需額外訓練)。?

對于遵循指令的基線,作者用短語“Is this unusual? Please explain briefly with a short sentence(這不尋常嗎?請用一個簡短的句子簡要解釋一下)”提示LVLM,??先前的研究??發現這對發現不切實際的圖像很有效。?

評估的模型是??LLaVA 1.6 Mistral 7B???、??LLaVA 1.6 Vicuna 13B???和兩種大小(7/130億個參數)的??InstructBLIP??。?

測試過程圍繞102對真實和非真實(“怪異”)圖像展開。每對圖像由一張正常圖像和一張違背常理的圖像組成。

三位人類注釋者對圖像進行了標注,達成了92%的共識,表明人類對“怪異”的定義具有高度的認同感。評估方法的準確性是通過正確區分現實和非現實圖像的能力來衡量的。

該系統使用三重交叉驗證進行評估,使用固定種子隨機打亂數據。作者在訓練期間調整了蘊涵分數(邏輯上一致的陳述)和矛盾分數(邏輯上沖突的陳述)的權重,而“中性”分數固定為零。最終準確率計算為所有測試分割的平均值。

使用人工智能幻覺評估圖像真實感?-AI.x社區

對五個生成事實的子集進行不同NLI模型和聚合方法的比較,以準確性作為衡量標準。

對于上面顯示的初步結果,論文指出:

“clust方法脫穎而出,成為表現最佳的方法之一。這意味著,匯總所有矛盾分數至關重要,而不是只關注極端值。此外,最大的NLI模型(nli-deberta-v3-large)在所有聚合方法中的表現優于所有其他模型,這表明它更有效地抓住了問題的本質。”

作者發現,最優權重始終傾向于矛盾而非蘊涵,這表明矛盾對于區分不切實際的圖像更具參考價值。他們的方法優于測試的所有其他零樣本方法,接近經過微調的BLIP2模型的性能:

使用人工智能幻覺評估圖像真實感?-AI.x社區

各種方法在WHOOPS!基準上的表現。微調(ft)方法顯示在頂部,而零樣本(zs)方法列在下面。其中,模型大小表示參數數量,準確率用作評估指標。

他們還指出,在同樣的提示下,InstructBLIP的表現優于同類LLaVA模型,這多少有點出乎意料。在承認GPT-4o的卓越準確性的同時,該論文強調了作者傾向于展示實用的開源解決方案,而且似乎可以合理地宣稱在明確利用幻覺作為診斷工具方面具有新穎性。

結論

作者承認他們的項目得益于2024年??FaithScore??活動,這是德克薩斯大學達拉斯分校和約翰霍普金斯大學合作舉辦的活動。?

使用人工智能幻覺評估圖像真實感?-AI.x社區

FaithScore評估的工作原理說明。首先,識別LVLM生成的答案中的描述性陳述。接下來,將這些陳述分解為單個原子事實。最后,將原子事實與輸入圖像進行比較以驗證其準確性。其中,帶下劃線的文本突出顯示客觀描述內容,而藍色文本表示幻覺陳述,從而使FaithScore能夠提供可解釋的事實正確性衡量標準。來源:https://arxiv.org/pdf/2311.01477。

FaithScore通過驗證與圖像內容的一致性來衡量LVLM生成的描述的忠實度,而新論文中抽出的方法明確利用了LVLM幻覺,通過使用自然語言推理生成的事實中的矛盾來檢測不切實際的圖像。

新成果自然取決于當前語言模型的怪異之處,以及它們產生幻覺的傾向。如果模型開發最終產生一個完全不產生幻覺的模型,那么新成果的一般原理也將不再適用。然而,這仍然是一個充滿挑戰的前景。

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:??Using AI Hallucinations to Evaluate Image Realism??作者:Martin Anderson

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-4-9 08:23:03修改
收藏
回復
舉報
回復
相關推薦
免费av手机在线观看| 欧美大片免费观看| 北条麻妃在线观看| jizz在线免费观看| 国产最新精品免费| 欧美精品日韩三级| 日韩www视频| 日韩一区二区三区免费| 亚洲天堂中文字幕| 好吊色欧美一区二区三区视频| 国产精品久久久久久人| 国产精品久久久久久影院8一贰佰| 欧美成人国产一区二区| 任你操这里只有精品| 久草中文在线观看| 99国产精品国产精品久久| 国产精品国产自产拍高清av水多| 久草视频手机在线| 亚洲福利天堂| 欧美tk丨vk视频| 色七七在线观看| 成人影院在线播放| 国产精品久久久久aaaa| 精品免费二区三区三区高中清不卡| 丰满人妻一区二区三区四区| 欧美三区美女| 久久韩国免费视频| 欧美激情aaa| 成人综合日日夜夜| 色综合天天做天天爱| 乱子伦一区二区| 国产在线高清| bt欧美亚洲午夜电影天堂| 国产欧美一区二区三区在线| 中文字幕超碰在线| 国内自拍一区| 久久九九有精品国产23| 亚洲欧美va天堂人熟伦| 青青久久av| 精品久久国产字幕高潮| 亚洲最大天堂网| 亚洲一区二区三区四区| 黑人巨大精品欧美一区免费视频| 97在线免费视频观看| 久久精品视频免费看| 国产欧美日韩综合| 欧美动漫一区二区| 亚洲区小说区图片区| 国产不卡在线视频| 97碰碰视频| 99热在线只有精品| 韩国女主播成人在线| 国产区亚洲区欧美区| 波多野结衣视频在线看| 欧美一区=区| 青青草成人在线| 久久久久久久极品| 亚洲国产专区| 91精品国产高清| 国产一卡二卡在线播放| 国产精品va| 欧美激情三级免费| 欧美激情国产精品免费| 欧美日韩专区| 97福利一区二区| 日韩欧美亚洲视频| 免费亚洲婷婷| 国产91在线播放九色快色| 中文字幕亚洲乱码熟女1区2区| 亚洲精品影院在线观看| 欧美亚州一区二区三区| 色av性av丰满av| 日韩精品视频网站| 国产精品亚洲自拍| 一级黄色片免费| 国内精品写真在线观看| 操一操视频一区| 欧美在线精品一区二区三区| 91在线小视频| 天堂va久久久噜噜噜久久va| 欧洲日本在线| 一区二区三区中文字幕电影| 热99这里只有精品| 午夜激情成人网| 在线不卡一区二区| 怡红院一区二区| 国产精品手机在线播放| 久久精品视频一| 日本一区二区欧美| 日韩av中文字幕一区二区| 成人美女免费网站视频| 亚洲第一精品网站| 久久精品日产第一区二区三区高清版| 亚洲高清视频一区| 亚洲小说区图片区都市| 精品久久久久久久久久久久久 | 日韩视频二区| 国产精品成人v| 国产普通话bbwbbwbbw| 成人av中文字幕| 午夜精品短视频| 黑人极品ⅴideos精品欧美棵| 色先锋久久av资源部| 久久久福利影院| 亚洲人挤奶视频| 色综合久久久888| 免费黄色小视频在线观看| 国产精品18久久久久久久久| 免费日韩av电影| 制服丝袜中文字幕在线| 日韩欧美在线第一页| 无码人妻一区二区三区在线视频| 丝袜久久网站| 久热在线中文字幕色999舞| 老熟妇仑乱一区二区av| 成人av片在线观看| 麻豆中文字幕在线观看| 成人av观看| 精品成人一区二区三区四区| 久久久久久国产免费a片| 亚洲午夜极品| 91精品中文在线| 免费福利在线视频| 亚洲3atv精品一区二区三区| 手机av在线网| 精品国产欧美日韩| 久久久久久亚洲精品不卡| 91麻豆成人精品国产| 久久久久久免费网| 日本韩国欧美在线观看| 亚洲国产aⅴ精品一区二区| 中文字幕日韩在线播放| 国产性生活视频| 91在线丨porny丨国产| 亚洲熟妇无码一区二区三区导航| 伊人国产精品| 日韩中文字幕免费视频| 久久精品99北条麻妃| 久久久久久久久久电影| 欧美黄色免费影院| 日本欧美韩国国产| 国内精品久久久久伊人av| 精品人妻一区二区三区含羞草| 国产精品大尺度| www午夜视频| 久久成人综合| 国产精品十八以下禁看| 国产日本在线视频| 色成年激情久久综合| 魔女鞋交玉足榨精调教| 亚洲一区自拍| 久久婷婷开心| 欧美激情喷水| 亚洲人精选亚洲人成在线| 国产精品777777| 91啪亚洲精品| 中文字幕无码不卡免费视频| 九九久久成人| 国产精品视频自拍| 欧美日韩欧美| 欧美一区二区视频免费观看| 天堂网avav| 国产精品99久久久久久似苏梦涵| 丁香色欲久久久久久综合网| 日韩第一区第二区| 性色av一区二区三区红粉影视| 日韩一级在线播放| 狠狠干狠狠久久| 中国毛片在线观看| 久久99精品视频| 男同互操gay射视频在线看| 婷婷视频一区二区三区| 久久久在线视频| 天堂av电影在线观看| 一道本成人在线| 日韩av片在线免费观看| 国产精品一二三区| 国产97在线 | 亚洲| 国产一区2区| 亚洲自拍在线观看| 韩国精品一区| 中文字幕欧美日韩在线| www视频在线| 欧美性xxxxxx| 国产天堂av在线| 成人精品在线视频观看| 黄色一级一级片| 91精品久久久久久久久久不卡| 国产精品二区在线观看| 国产污视频在线播放| 在线a欧美视频| 亚洲成a人片在线| 91久久香蕉国产日韩欧美9色| 日韩精品久久久久久久的张开腿让| 国产成人综合亚洲91猫咪| 国产精品亚洲αv天堂无码| 亚洲精品一区二区妖精| 精品1区2区| 亚洲综合伊人| 国产91免费看片| 欧美人与牲禽动交com| 亚洲最新视频在线| 丰满熟女一区二区三区| 欧美午夜在线一二页| 欧美一级高潮片| 国产精品久久看| 免费在线观看成年人视频| 国产一区二区三区美女| www.日本xxxx| 一本综合久久| 亚洲精品天堂成人片av在线播放| 国产精品视频一区二区三区四蜜臂| av一区二区三区在线观看| 日韩毛片一区| 日本在线观看天堂男亚洲| 黄页网站大全在线免费观看| www.欧美精品| 川上优的av在线一区二区| 精品国产伦一区二区三区免费| 一级片在线免费观看视频| 日韩欧美综合在线视频| 国产盗摄x88av| 综合婷婷亚洲小说| 国产一二三四五区| 波多野洁衣一区| 中文字幕第10页| 狠狠色伊人亚洲综合成人| 亚洲免费av一区二区三区| 国产精品三上| 男女猛烈激情xx00免费视频| 91精品亚洲| 中国一区二区三区| 日本欧美肥老太交大片| 欧洲久久久久久| 日韩欧美ww| 成人三级在线视频| 男人天堂a在线| 91精品观看| 国产欧美自拍视频| 欧美国产美女| 亚洲综合首页| 日韩理论在线| 欧美h视频在线观看| 日韩大片在线观看| 亚洲乱码一区二区三区三上悠亚| 精品国产中文字幕第一页| 日本不卡久久| 国产毛片一区二区三区| 久久亚洲高清| 欧美男男gaytwinkfreevideos| 久久青青草综合| 综合干狼人综合首页| 蜜桃传媒视频麻豆一区 | 日韩网站在线看片你懂的| 国产农村妇女毛片精品久久| 欧美一区二区三区爱爱| 亚洲国产精品二区| 亚洲精品一区二区精华| 午夜成人免费影院| 精品亚洲一区二区三区在线播放 | 日韩有码在线视频| 国产原创在线观看| 久久97精品久久久久久久不卡| av毛片在线看| 午夜精品久久久久久久久久久久久| sm在线观看| 日韩免费视频在线观看| 黄色成人小视频| 亚洲淫片在线视频| 国产成人一二片| 日本免费一区二区三区| 99久久婷婷| 日韩在线观看a| 欧美一级专区| 欧美激情第一区| www..com久久爱| 91资源在线播放| 亚洲男女毛片无遮挡| 日韩成人高清视频| 欧美在线一区二区| 国产99视频在线| 日韩精品免费在线观看| 亚洲视频tv| 久久久久久久久久久网站| 欧美日韩五码| av资源站久久亚洲| 国产乱码精品一区二区亚洲| 桥本有菜av在线| 国产日韩欧美一区在线| 一级做a免费视频| www.欧美色图| 一本一本久久a久久| 五月婷婷久久综合| 91tv国产成人福利| 日韩精品视频免费在线观看| 午夜伦理在线| 992tv成人免费影院| 亚洲精品成人一区| 国产伦精品一区二区三区四区视频 | 香蕉视频在线免费看| 国语自产精品视频在线看一大j8 | 国产精品20p| 夜夜嗨av一区二区三区网页| 久久久久久久久久成人| 欧美一区二区成人| 国产人成在线观看| 欧美精品成人91久久久久久久| 视频一区在线免费看| 国产美女在线精品免费观看| 亚洲草久电影| 熟妇人妻无乱码中文字幕真矢织江 | 555www成人网| 蜜桃在线一区| 亚洲欧洲精品在线| 久久电影一区| 99久久免费看精品国产一区| 亚洲视频一区二区在线| 在线观看国产区| 日韩av在线直播| 国产丝袜在线播放| 91在线观看免费| 日韩理论电影| 日本久久久久久久久久久久| 99精品在线观看视频| 久久久久久福利| 欧美高清激情brazzers| 国产九色在线| 日本欧美精品在线| 另类尿喷潮videofree| 少妇一晚三次一区二区三区| 久久国产欧美日韩精品| 黄色av免费播放| 色呦呦网站一区| 日本护士...精品国| 91av在线影院| 日韩成人av在线资源| 男女猛烈激情xx00免费视频| 国产不卡高清在线观看视频| 侵犯稚嫩小箩莉h文系列小说| 欧美日本一区二区| 在线免费av电影| 国产精品日日做人人爱| 日韩欧美大片| 青青草久久伊人| 亚洲欧美综合另类在线卡通| 一级片在线免费观看视频| 中文字幕亚洲第一| 欧美男女视频| 久久久一二三四| 精品写真视频在线观看| 欧美激情精品久久久久久免费 | 亚洲精品福利网站| 欧美精品手机在线| 视频精品一区二区三区| 4444在线观看| 夫妻av一区二区| 中文字幕一区二区三区手机版| 亚洲成人黄色网| 欧美私密网站| 色狠狠久久av五月综合|| 蜜桃精品视频在线观看| 亚洲av无一区二区三区| 91精品婷婷国产综合久久| 中文在线免费| 国产专区一区二区| 免费看黄裸体一级大秀欧美| 精品国产av无码| 欧美日韩一区二区三区四区| 国产精品实拍| 国产福利久久精品| 先锋亚洲精品| 特黄一区二区三区| 日韩欧美视频在线| 大菠萝精品导航| 欧美精品在线一区| 久久99久久久欧美国产| 免费在线视频一区二区| 亚洲激情国产精品| 欧美日韩尤物久久| japanese在线播放| 99精品热视频| 亚洲视频在线观看免费视频| 久久高清视频免费| 日本午夜精品久久久| www.色偷偷.com| 亚洲一区二区三区国产| 极品美乳网红视频免费在线观看| 成人免费观看a| 91久久午夜| 成人午夜免费影院| 亚洲国产成人精品电影| 日本美女久久| 成年女人18级毛片毛片免费 | 亚洲一级生活片| 日韩成人在线网站| 成人综合日日夜夜| 四虎永久在线精品无码视频| 亚洲三级电影网站| 邻居大乳一区二区三区| 99re国产视频|