精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD

發(fā)布于 2024-4-7 14:04
瀏覽
0收藏

GPT-4V 的推出引爆了多模態(tài)大模型的研究。GPT-4V 在包括多模態(tài)問答、推理、交互在內(nèi)的多個領(lǐng)域都展現(xiàn)了出色的能力,成為如今最領(lǐng)先的多模態(tài)大模型。


然而,近期很多工作發(fā)現(xiàn) GPT-4V 在很多基本能力上卻意外的出現(xiàn)短板。例如,在微軟一篇長達(dá) 166 頁的技術(shù)報告《The Dawn of LMMs:Preliminary Explorations with GPT-4V (ision)》中,作者發(fā)現(xiàn),對于一個不太復(fù)雜的圖像中的蘋果數(shù)量,GPT-4V 竟然怎么數(shù)也數(shù)不對。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


然而,學(xué)術(shù)界和工業(yè)界尚不清楚導(dǎo)致這些問題的底層原因。


這個問題在清華大學(xué)、新加坡國立大學(xué)和中國科學(xué)院大學(xué)的一篇題為《LLaVA-UHD: an LMM Perceiving Any Aspect Ratio and High-Resolution Images》的論文中得到了解釋。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


  • 論文鏈接:https://arxiv.org/pdf/2403.11703.pdf
  • 項目鏈接:github.com/thunlp/LLaVA-UHD


其原因在于 GPT-4V 很可能存在:視覺編碼漏洞。


該工作對當(dāng)前最強(qiáng)的商業(yè)大模型 GPT-4V 和最受歡迎的開源模型 LLaVA-1.5 進(jìn)行了實(shí)驗,揭示了目前多模態(tài)大模型中的視覺編碼漏洞。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


漏洞 1:GPT-4V 將圖像進(jìn)行有重疊的切片后再編碼


作者首先設(shè)計了一個實(shí)驗來觀察:圖像中的位置如何影響 GPT-4V 的計數(shù)回答。


具體來說,作者合成了如圖 1 (a) 所示的圖像,并向 GPT-4V 提問題:“圖像中有多少個圓圈?” 同時,通過改變圓圈的位置而保持提問不變,進(jìn)一步生成了一系列圖像變體。


圖 1 (b) 中以熱圖的形式顯示了 GPT-4V 對圖像中每個位置平均回答的數(shù)量,作者發(fā)現(xiàn)了一個與圖像中目標(biāo)位置高度相關(guān)的有趣模式如圖 1(b)所示,具體表現(xiàn)為被 256×256 的正方形網(wǎng)格分割的三種不同模式:


(1) 中央正方形區(qū)域展示了最高的響應(yīng)數(shù)量,

(2) 中間邊緣區(qū)域的響應(yīng)數(shù)量較低,

(3) 角落區(qū)域的響應(yīng)數(shù)量最接近于真實(shí)值。


在對 GPT-4V 的響應(yīng)進(jìn)行數(shù)值區(qū)分后,作者發(fā)現(xiàn)除了正確答案和接近正確答案的情況,還有兩種異常答案(8 個圓和 16 個圓),這些異常答案呈現(xiàn)了答案數(shù)量翻倍或四倍的錯誤模式。結(jié)合 OpenAI 公開的信息,這一現(xiàn)象的最可能原因是,當(dāng)圖像分辨率無法被 512 整除時,GPT-4V 處理圖像的切片之間會出現(xiàn)重疊。如圖 1 (e) 所示,兩個切片之間的重疊區(qū)域?qū)е聰?shù)量翻倍,而四個切片的交叉重疊區(qū)域會使得識別出的數(shù)量增加至四倍。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


作者設(shè)計了另一個實(shí)驗來觀察:圖像分辨率如何影響 GPT-4V 的計數(shù)回答。


具體來說,作者將圖 2 (a) 中的圖像按比例縮放至連續(xù)遞增的分辨率,并詢問 GPT-4V 其中圓圈的個數(shù)。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


圖 2 (b) 中展示了 GPT-4V 的回答結(jié)果。隨著圖像分辨率的變化,GPT-4V 的回答顯示出顯著的相位變化:(1)在第 1 階段,由于沒有圖像切片,大多數(shù)答案是正確的;(2)在第 2 階段,答案 12 在響應(yīng)中占主導(dǎo)地位,可能是由于每個切片中的圓不完整;(3)第 3 階段顯示了 9、12 和 16 的混合答案。請注意,16 可以很好地解釋圖 1 (e) 中的錯誤模式。


以上兩個實(shí)驗結(jié)果揭示了 GPT-4V 在處理高分辨率圖像時存在重疊切片,導(dǎo)致錯誤響應(yīng),啟發(fā)作者需要進(jìn)一步研究更合理的圖像預(yù)處理和編碼方式。


漏洞 2:LLaVA-1.5 進(jìn)行大范圍的圖像填充(Padding)


LLaVA-1.5 作為出色的開源多模態(tài)大模型被學(xué)術(shù)界廣泛關(guān)注。


為了處理具有不同長寬比的圖像,LLaVA-1.5 在將圖像輸入視覺編碼器之前將其填充為正方形。這種編碼方法導(dǎo)致非正方形圖像的計算浪費(fèi)。例如,將 1:4 圖像填充為正方形后,有效計算量僅為 25%。


更重要的是,LLaVA-1.5 實(shí)際上無法確定填充像素是來自圖像預(yù)處理還是原始輸入圖像的實(shí)際部分。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


為了演示這個問題,作者合成了一系列輸入圖像,如圖 3(右)所示,其中不同長寬比的綠色矩形被灰色(即填充對應(yīng)的 RGB 值)所包圍。給定輸入圖像,作者提示:“最左 / 最右 / 最上 / 最下區(qū)域的顏色是什么?” 從圖 3(左)的結(jié)果中,作者觀察到 LLaVA-1.5 忽略了灰色輸入?yún)^(qū)域(將其視為填充),并置信地回答了中心矩形的顏色。


綜合以上 2 個明顯的視覺編碼漏洞可以知道,多模態(tài)模型中的視覺策略必須謹(jǐn)慎設(shè)計。常見做法,如填充、形狀扭曲調(diào)整和重復(fù)切片,可能導(dǎo)致計算資源的浪費(fèi)、模型能力的喪失,甚至容易受到對抗性攻擊。


于是,作者提出 LLaVA-UHD,該模型可以對 180 萬像素任意長寬比圖像進(jìn)行編碼,相比于 LLaVA-1.5 在 9 個主流評測基準(zhǔn)實(shí)現(xiàn)提升,訓(xùn)練和推理計算開銷相比于 LLaVA-1.5 均有顯著下降。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)



LaVA-UHD 包括三個關(guān)鍵部分:一種圖像模塊化策略,將原始分辨率的圖像分成更小的可變大小的切片,以便進(jìn)行高效和可擴(kuò)展的編碼;一個壓縮模塊,進(jìn)一步壓縮來自視覺編碼器的圖像 tokens,一個空間裝飾模式,用于為 LLMs 組織片段 tokens。


圖像模塊化策略中主要包含兩個部分:


1. 高分辨率圖像劃分策略(如圖 4 左側(cè))。目標(biāo)是確定高分辨率圖像的劃分方式,使每個切片的分辨率變化最小。給定圖像分辨率和和在固定分辨率上預(yù)訓(xùn)練的 ViT,首先確定處理圖像所需的切片數(shù)。然后將切片數(shù)因式分解為和幾種劃分方式。為了選擇最合適的劃分,作者定義一個評分函數(shù)來衡量與 ViT 標(biāo)準(zhǔn)預(yù)訓(xùn)練設(shè)置的偏差,進(jìn)而選擇最佳的劃分方法。


2. 任意寬高比切片編碼(如圖 4 右側(cè))。目的是等比例調(diào)整圖像以適應(yīng)預(yù)訓(xùn)練模型的位置嵌入數(shù)量。首先將 ViT 的 1D 位置嵌入轉(zhuǎn)換為 2D 格式,并進(jìn)行插值以匹配動態(tài)切片分辨率,從而獲得自適應(yīng)圖像尺寸的視覺編碼。實(shí)驗表明,此方法在保持 ViT 和位置嵌入?yún)?shù)不變的情況下,通過后期微調(diào)即可提升性能。此外,還編碼一張低分辨率概覽圖像,有助于提供全局語義信息,增強(qiáng)模型對圖像的整體理解。


LLaVA-UHD 利用壓縮模塊(Resampler)壓縮每張切片的 tokens,實(shí)現(xiàn)比 LLaVA-1.5 在 336×336 分辨率圖像中更低的計算成本來編碼 672×1008 分辨率的圖像。由于圖像切片在不同圖像之間是動態(tài)的,因此有必要通過位置修飾符來告知 LLM 圖像切片的相對位置。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


表 1 報告了主要的實(shí)驗結(jié)果。在性能表現(xiàn)上,LLaVA-UHD 相對于 LLaVA-1.5 取得了顯著的改進(jìn)。通過簡單地感知原生高分辨率圖像,LLaVA-UHD 在 TextVQA 上實(shí)現(xiàn)了 6.4 的準(zhǔn)確率提升,在 POPE 上實(shí)現(xiàn)了 3.2 的準(zhǔn)確率提升。原因在于低分辨率圖像中的模糊內(nèi)容可能會阻止 LMMs 準(zhǔn)確識別具有挑戰(zhàn)性的細(xì)粒度目標(biāo)和 OCR 字符。在計算效率和可拓展性上,LLaVA-UHD 僅使用 94% 的推理計算即支持任意寬高比的 672×1088 分辨率圖像,能夠適應(yīng)更大分辨率的拓展。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


為了更直觀地展示 LMM 在處理高分辨率圖像方面的能力,在圖 5 中提供了 LLaVA-UHD 和 LLaVA-1.5 的定性結(jié)果。可以看到,LLaVA-UHD 可以正確識別課表上的密集內(nèi)容,小海報上的文字以及手機(jī)上的圖標(biāo)和文字,實(shí)現(xiàn)了細(xì)粒度的識別和推理。


未來展望


LLaVA-UHD 將圖像分辨率限制在最大 672×1008。但是在未來,考慮到其具有潛力的效率和可擴(kuò)展性,將探索更高分辨率的圖像以及更具挑戰(zhàn)性的任務(wù),如小目標(biāo)檢測和分割。此外,目前圖像片段是獨(dú)立編碼的,只在 LLMs 中進(jìn)行交互。計劃通過改進(jìn)的視覺編碼策略,在圖像片段之間建立高效的連接,實(shí)現(xiàn)細(xì)粒度全局信息交互。


本文轉(zhuǎn)自 機(jī)器之心 ,作者:機(jī)器之心


原文鏈接:??https://mp.weixin.qq.com/s/5CKBR_KA-YNIqkz1ZcC79A??

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
久久婷婷av| 伊人手机在线| 麻豆一区二区在线| 欧美巨乳在线观看| www.日本高清| 成人做爰免费视频免费看| 亚洲欧美日韩国产成人精品影院| aa成人免费视频| 午夜精品久久久久久久蜜桃| 亚洲精品中文字幕乱码| 亚洲国产天堂久久国产91| www.xxx亚洲| 国产黄色大片在线观看| 欧美国产丝袜视频| 国产欧美在线一区二区| 中文字幕在线观看精品| 国产精品日本| 欧美高清在线观看| 少妇视频一区二区| 久久不卡国产精品一区二区 | 26uuu精品一区二区三区四区在线| 国产精品18久久久久久麻辣| 久久久综合久久久| 久久国产电影| 在线亚洲国产精品网| 第四色在线视频| 亚洲精品一区国产| 91精品在线一区二区| 久草精品在线播放| 最新黄网在线观看| 亚洲色图丝袜美腿| 亚洲草草视频| 欧美精品a∨在线观看不卡| 成人一级片网址| 99re在线| www.xxx国产| 狠狠色丁香久久婷婷综合丁香| 国产97在线视频| 日韩精品在线免费视频| 黄色成人91| 欧美激情一二三| 草视频在线观看| 久久精品青草| 久久久av网站| 国产suv精品一区二区68| 色狮一区二区三区四区视频| 在线视频精品一| 欧美巨胸大乳hitomi| 精品成人影院| 中文字幕欧美国内| 国产一二三av| 亚洲国产一区二区三区在线播放| 中文字幕亚洲欧美日韩在线不卡| 丁香花五月婷婷| 日本不卡高清| 久久韩剧网电视剧| 黄色片在线观看网站| 在线精品视频在线观看高清| 欧美激情xxxxx| www.av视频在线观看| 亚洲少妇在线| 日韩av成人在线| 中国精品一区二区| 麻豆精品在线播放| 亚洲aaa激情| 亚洲欧美另类视频| 91丨porny丨国产| 日韩av影视| 精品美女在线观看视频在线观看 | 精品自拍视频在线观看| 免费在线黄色片| 国产欧美高清| 国产精品久久久久久久7电影 | 欧美mv日韩mv| 中文字幕 亚洲一区| 伊人久久大香线蕉av不卡| 亚洲视频电影图片偷拍一区| 国产无遮挡在线观看| 在线电影一区二区| 欧美一区二区三区免费观看| 亚洲国产成人精品女人久久| 精品一区二区三区免费毛片爱 | 亚洲精品ww久久久久久p站| 亚洲色欲久久久综合网东京热| 欧美理论电影| 91国内精品野花午夜精品 | 亚洲天堂五月天| 寂寞少妇一区二区三区| 激情小说综合网| 91caoporn在线| 亚洲第一在线综合网站| 激情五月婷婷久久| 成人h动漫精品一区二区器材| 日韩激情在线视频| 天天色天天综合| 日韩午夜在线| 国产精品永久免费观看| 成人久久久精品国产乱码一区二区| 91影院在线观看| 正在播放一区| 自拍网站在线观看| 欧美一区二区三区免费| asian性开放少妇pics| 亚洲有吗中文字幕| 国产精品a久久久久久| 亚洲精品中文字幕成人片| 欧美精彩视频一区二区三区| r级无码视频在线观看| 日本中文字幕视频一区| 2020国产在线视频| 欧美日韩黄网站| 日韩高清a**址| 中文字幕求饶的少妇| 少妇荡乳情欲办公室456视频| 国产91丝袜在线播放九色| 日本黑人久久| 久草在线视频资源| 欧美日韩国产片| 我和岳m愉情xxxⅹ视频| 中文字幕一区二区三区欧美日韩| 欧美专区在线视频| 亚洲AV无码精品自拍| 国产精品天干天干在线综合| 国产青青在线视频| 中文在线免费一区三区| 日韩在线欧美在线国产在线| 天天干天天操天天爱| 成人免费毛片嘿嘿连载视频| 强开小嫩苞一区二区三区网站 | 一区二区三区免费网站| 特级丰满少妇一级| 精品一区电影| 国产不卡av在线免费观看| 人人妻人人玩人人澡人人爽| 亚洲精品国产无套在线观| 99re精彩视频| 成人羞羞动漫| 国产欧美精品久久久| 精品一二三区视频| 色一情一伦一子一伦一区| 亚洲 欧美 日韩在线| 欧美91大片| 亚洲一区二区三区香蕉| av观看在线| 日韩精品一区二区三区在线观看 | 欧美高清www午色夜在线视频| 亚洲AV无码成人精品区明星换面| 国产精品尤物| 久久综合九色欧美狠狠| 在线免费av资源| 亚洲免费高清视频| 欧美性猛交bbbbb精品| 91丝袜美腿高跟国产极品老师| 国产人妻777人伦精品hd| 欧美激情极品| 国产成人精品久久二区二区91| 久久经典视频| 欧美视频精品在线观看| 久久成人小视频| 高清在线不卡av| 亚洲熟妇av日韩熟妇在线 | 少妇熟女一区二区| 国模大尺度视频一区二区| 久久91亚洲精品中文字幕奶水| 亚洲不卡免费视频| 污片在线观看一区二区| 一级片手机在线观看| 奇米在线7777在线精品 | 成人黄色a级片| 精品影视av免费| www.夜夜爱| 神马久久av| 国产伦精品免费视频| 午夜成年人在线免费视频| 日韩av在线最新| 国模私拍一区二区| 亚洲免费在线视频一区 二区| aaa黄色大片| 视频一区二区国产| 久久久成人精品一区二区三区| 高清精品xnxxcom| 国产精品扒开腿做爽爽爽视频| 欧美日韩在线资源| 亚洲国产精彩中文乱码av在线播放 | 五月天激情播播| 伊人天天综合| 亚洲精品久久区二区三区蜜桃臀 | 精品日韩成人av| 青青国产在线观看| 国产精品不卡在线| 中文字幕一区三区久久女搜查官| 日本一不卡视频| 成人av在线播放观看| 欧美男同视频网| 99久久伊人精品影院| 欧美男女交配| 欧美风情在线观看| www.91在线| 日韩电影中文 亚洲精品乱码| 91精东传媒理伦片在线观看| 午夜电影网一区| 国产高潮流白浆| 久久久.com| 怡红院一区二区| 国产在线播放一区三区四| ww国产内射精品后入国产| 五月天久久网站| 日本在线免费观看一区| 国产毛片久久久| 91精品视频大全| 日韩在线影院| 欧美一级在线亚洲天堂| 四季久久免费一区二区三区四区| 一本一道久久a久久精品逆3p| 亚洲精品久久久久avwww潮水| 欧美影视一区在线| 青青青国产在线| 亚洲午夜电影网| 国产又黄又爽又无遮挡| 国产精品色婷婷| 黄色aaa视频| 97超碰欧美中文字幕| 成人三级做爰av| 麻豆精品一区二区av白丝在线| 日本一区二区黄色| 夜夜嗨网站十八久久| 国产一区二区三区乱码| 亚洲经典一区| 强伦女教师2:伦理在线观看| 成人羞羞网站入口| 小说区图片区图片区另类灬| 国产精品羞羞答答在线观看| 久久久久免费网| 日韩av系列| 久久久久久久久久久久久久一区| 9l亚洲国产成人精品一区二三| 亚洲xxxxx性| 日韩精品视频在线看| 91久久精品日日躁夜夜躁国产| 久久久久久久性潮| 国产剧情久久久久久| 欧美一级网址| 成人免费网站在线| 国产成年精品| 亚洲字幕一区二区| 亚洲视频国产精品| 国产精品一区二区欧美| 国产在线播放精品| 久99久在线| 国产99久久精品一区二区300| 蜜桃999成人看片在线观看| 日韩欧美黄色| 日本不卡二区| 99九九热只有国产精品| 裸体裸乳免费看| 欧美亚洲不卡| 97视频在线免费| 亚洲一区黄色| 中文字幕国产传媒| 激情成人午夜视频| 麻豆短视频在线观看| 91婷婷韩国欧美一区二区| 一区二区三区伦理片| 国产精品久久福利| 青娱乐国产在线| 日韩欧美精品免费在线| 亚洲av综合一区| 日韩一区二区三区在线观看| 成人爽a毛片一区二区| 国产视频一区在线| 午夜国产福利在线| 韩国美女主播一区| 亚洲电影有码| wwwxx欧美| 国产成人1区| 超级碰在线观看| 久久综合导航| 亚洲一二三av| 99精品桃花视频在线观看| av电影在线不卡| 一区二区在线看| www.久久久久久久| 欧美哺乳videos| 国产主播福利在线| 九九热这里只有在线精品视| 周于希免费高清在线观看| 91麻豆桃色免费看| 小说区图片区色综合区| 三年中国中文在线观看免费播放 | 亚洲女女做受ⅹxx高潮| 精品成人av一区二区在线播放| 欧美无砖砖区免费| 欧洲av在线播放| 色综合伊人色综合网| 蜜桃视频在线观看播放| 成人激情免费在线| 久久av电影| 每日在线观看av| 九九精品视频在线看| 无套内谢大学处破女www小说| 自拍偷拍亚洲激情| 在线观看 亚洲| 精品毛片乱码1区2区3区| 成人在线观看一区| 奇米四色中文综合久久| 日本少妇精品亚洲第一区| 欧美日韩一区二区三区免费| 黄色日韩在线| 国产5g成人5g天天爽| 国产欧美日韩三区| 特级毛片www| 亚洲成人a级网| 97超碰资源站在线观看| 国产精品香蕉国产| 尤物tv在线精品| 搞av.com| 国产成人日日夜夜| 2018天天弄| 欧美精品黑人性xxxx| 成人影院免费观看| 欧美在线视频一二三| 久久夜色精品国产噜噜av小说| 一级黄色片播放| 激情欧美一区二区三区在线观看| 谁有免费的黄色网址| 色综合天天天天做夜夜夜夜做| 黄色片一区二区三区| 久久中文字幕国产| 亚洲精品无播放器在线播放| 日韩欧美视频第二区| 日韩电影在线一区二区三区| 中文人妻一区二区三区| 婷婷成人激情在线网| 欧美一级一区二区三区| 欧美巨猛xxxx猛交黑人97人| 日韩三级不卡| 人妻互换免费中文字幕| 国产成人免费在线视频| 久久久国产精品人人片| 日韩欧美aaaaaa| 欧美xxxx做受欧美88bbw| 波多野结衣一区二区三区在线观看 | 亚洲乱码国产乱码精品精天堂| 美女高潮在线观看| 久久国产手机看片| 亚洲欧美日韩一区在线观看| 魔女鞋交玉足榨精调教| 色综合亚洲欧洲| 国产精品毛片一区二区三区四区| 国产精品678| 日本精品黄色| 亚洲欧美日本一区二区| 亚洲乱码一区二区三区在线观看| 精品国产999久久久免费| 欧美成人亚洲成人| 国产伦理久久久久久妇女 | 最新黄色av网站| 国产东北露脸精品视频| 国产真实的和子乱拍在线观看| 亚洲第一级黄色片| 成人va天堂| 天堂av免费看| 成人久久18免费网站麻豆 | 国产一区二区免费在线| 毛片aaaaa| 精品一区二区亚洲| 91av一区| 久久免费一级片| 99久久精品国产毛片| 69xxxx国产| 不卡av电影在线观看| 久久资源综合| 九九热免费精品视频| 亚洲男人都懂的| 天天干,夜夜操| 国产精品香蕉国产| 欧美三级网页| 国产交换配乱淫视频免费| 欧美日韩欧美一区二区| 黄网av在线| 日本精品二区| 国产激情91久久精品导航| 在线观看亚洲天堂| 中文字幕久久久av一区| 国产伦精品一区二区三区在线播放| 精品视频无码一区二区三区| 国产精品福利av | 色偷偷888欧美精品久久久| 一区二区三区视频播放| 熟妇人妻无乱码中文字幕真矢织江| 日韩毛片一二三区| 日本中文字幕一区二区有码在线| 成人精品视频99在线观看免费| 9色国产精品| 三级av在线免费观看| 国产一区二区三区丝袜| 911精品国产| 伊人网在线综合| 色伊人久久综合中文字幕| ririsao久久精品一区|