精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

14 項任務測下來,GPT4V、Gemini等多模態大模型竟都沒什么視覺感知能力?

人工智能
本文提出了BLINK,這是一個新的測試集,包含了重新構想的傳統計算機視覺問題,使我們能夠更全面評估多模態大模型的視覺感知能力,帶你揭開GPT4V、Gemini等大模型的視覺界限秘密。

2023-2024年,以 GPT-4V、Gemini、Claude、LLaVA 為代表的多模態大模型(Multimodal LLMs)已經在文本和圖像等多模態內容處理方面表現出了空前的能力,成為技術新浪潮。

然而,對于這些模型的評測多集中于語言上的任務,對于視覺的要求多為簡單的物體識別。相對的,計算機視覺最初試圖解讀圖像作為3D場景的投影,而不僅僅處理2D平面“模式”的數組。

為響應這一情況,本文提出了BLINK,這是一個新的測試集,包含了重新構想的傳統計算機視覺問題,使我們能夠更全面評估多模態大模型的視覺感知能力,帶你揭開GPT4V、Gemini等大模型的視覺界限秘密。

作者相信BLINK將激勵社區幫助多模態LLMs達到與人類同等級別的視覺感知能力。

圖片

論文鏈接:https://zeyofu.github.io/blink

什么是BLINK?

BLINK 是一個針對多模態語言模型(Multimodal LLMs)的新基準測試,專注于評估其核心視覺感知能力,這些能力在其他評估中并未涉及。

BLINK包含 14 項視覺感知任務,擁有3.8k個選擇題和7.3k張圖像。

人類可以“一眨眼”之間解決這些任務 (例如,相對視深、視覺對應、目標定位,和多視角推理等);但對當前的多模態大型語言模型(Multimodal LLMs)而言,這些任務構成了重大挑戰,因為它們難以通過自然語言處理來解決。

平均而言,人類在這些任務上的準確率為95.70%,然而即使是GPT-4V和Gemini也只達到了51.26%和45.72%的準確率,比隨機猜測僅高出13.17%和7.63%。 

圖片


BLINK與其他基準測試的區別

圖片

  • BLINK 運用了多種的視覺prompts, 如圓形、盒形, 和圖像遮罩 masks, 而以前的基準測試僅包含文本問題和答案。
  • BLINK評估了更全面的視覺感知能力,如多視角推理、深度估算和反射率估算。以往的基準測試通常更側重于基于物體識別的視覺問答(VQA)。
  • BLINK只包含“視覺”常識性問題,這些問題人類不需要接受教育就可以在一秒鐘內回答,而以前的基準測試像MMMU這樣的則需要專業領域知識。
  • BLINK涵蓋了14個需求感知的任務,這些任務受到經典計算機視覺問題的啟發。雖然這些問題僅需人類“一眨眼”的時間即可解決,但它們超出了當前多模態大型語言模型的能力。

BLINK 實驗結果

圖片

本文評估了17個不同大?。?B,13B,34B)的多模態LLMs在BLINK上的表現。并觀察到一個悖論:盡管這些問題對于人類來說很容易(平均準確率為95.70%),但對現有機器來說卻極其困難。

7B和13B開源多模態大型語言模型(LLMs)的平均準確率大約在35-42%之間,與隨機猜測(38.09%)相似。

最好的開源模型是LLaVA-v1.6-34B,達到了45.05%的準確率。

即使是最新的大模型,如GPT-4V、Gemini Pro和Claude 3 OPUS,其準確率也僅為51.26%、45.72%和44.11%。它們的表現僅比隨機猜測好13.17%、7.63%和6.02%,并且比人類的表現差44.44%、49.98%和51.59%。

值得注意的是,在某些任務上,如拼圖、語義對應、多視角推理、對象定位和相對反射率,一些多模態LLMs甚至表現不如隨機猜測。

圖片

BLINK展示大模型的錯誤范例

對于每項任務,該文章展示了LLaVAv1.6-34B、Qwen-VL-Max、Gemini Pro、GPT-4V和人類的選擇。紅色選項指的是正確答案。請注意,為了視覺效果,作者故意放大了標記,并且將一些圖片做成插圖以節省空間。

對于智力測驗,第三張圖片是通過疊加第一張和第二張圖片構成的。 

圖片

BLINK實驗分析

把圖片轉換成文字是否是解決多模態問題的正確選擇?

為了回答這個問題,本文使用GPT-4V將圖片轉換為與任務無關的密集圖片字幕,并使用基于文本的LLM來完成任務(Caption + LLM)。這種密集字幕利用語言描述了圖像及視覺提示的詳細信息(例如,每個圓圈的位置)。

作者在BLINK、MMBench和MMMU上進行了實驗。令人驚訝的是,Caption + LLM的配置在MMBench和MMMU上的結果遠優于BLINK。這些結果表明,圖像字幕攜帶了回答其他基準所需的大部分視覺信息。同時,BLINK需要的高級感知能力超出了通用字幕目前可達到的范圍。

圖片

視覺提示(visual prompts)對多模態大模型能產生多大的影響?

本文分析了BLINK中多個任務上圓圈大小和顏色的影響。

實驗表明,視覺提示可能對多模態LLM的性能產生重大影響,改進視覺提示或提高模型對提示變化的魯棒性是未來研究的有前景的方向。根據分析,作者發現最佳圓圈大小依賴于具體任務,平均而言,10px的圓圈效果最好。同樣,對于所有任務來說,紅色比灰色更好。

圖片

傳統計算機視覺專家模型能解決BLINK任務嗎?

專家可以作為多模態LLM可能達到的上限的代理。這揭示了一個可能性,即多模態LLM可能因正確的數據和培訓策略而在這些任務上取得進展。 

圖片

責任編輯:姜華 來源: 機器之心
相關推薦

2023-11-13 07:48:08

AI檢測

2023-10-23 12:28:18

AI訓練

2024-03-01 11:58:26

MLLMs大語言模型人工智能

2024-01-22 06:40:00

模型視覺

2024-02-02 21:53:58

AI訓練

2023-10-17 12:34:04

2024-07-10 11:38:15

2025-04-10 09:15:00

模型AI數據

2023-12-22 12:41:01

模型訓練

2024-08-08 13:04:28

2024-06-12 11:49:44

2023-05-08 10:14:07

模型AI

2023-07-03 16:21:25

數據模型

2023-11-08 13:05:37

AI訓練

2023-12-29 09:55:03

視覺模型

2023-11-13 18:19:35

AI訓練

2024-01-03 12:56:39

2024-11-13 09:39:13

2023-11-15 13:15:47

AI模型

2023-09-15 13:32:00

AI模型
點贊
收藏

51CTO技術棧公眾號

日本wwww色| 欧美一区二区福利| 免费人成在线观看| 校花撩起jk露出白色内裤国产精品| 欧美日韩在线免费| 一本色道久久综合亚洲二区三区| 精品国产乱码一区二区三 | 一道本在线观看视频| 亚洲精品无码久久久| 久久久久91| 久久99精品久久久久久噜噜| 亚洲第一成人网站| 日韩一区二区三区色| 日本久久一区二区三区| 久久综合亚洲精品| yourporn在线观看中文站| 丁香一区二区三区| 国产精品自产拍在线观| 日韩欧美不卡视频| 91精品精品| 亚洲欧美日韩久久久久久| 一二三av在线| 成人国产在线| 色综合天天综合网国产成人综合天| www.亚洲一区二区| 成人18在线| 91麻豆精品秘密| 国产精品久久亚洲7777| 国产女人18毛片水真多| 日本美女一区二区| 奇米4444一区二区三区| 久久精品国产亚洲av香蕉| 国产国产精品| 在线日韩中文字幕| 免费毛片视频网站| 日韩极品少妇| 亚洲国产高清福利视频| 91精品国产高清91久久久久久| 9999精品视频| 欧美日韩1234| 亚洲精品久久久中文字幕| 不卡福利视频| 欧美天堂在线观看| 六月丁香婷婷在线| а√天堂中文资源在线bt| 一区二区三区四区国产精品| 国产大尺度在线观看| 免费看美女视频在线网站| 久久精品一区二区三区四区| 欧美在线一区二区三区四区| 三级国产在线观看| 91麻豆精品视频| 欧美亚洲另类久久综合| 亚洲三区在线播放| 91亚洲精品久久久蜜桃网站| 国产一区二区精品在线| 手机在线精品视频| 91在线看国产| 日本福利一区二区三区| 国产爆初菊在线观看免费视频网站| 久久色在线视频| 日韩在线三区| 麻豆影院在线观看| 又紧又大又爽精品一区二区| 男人天堂手机在线视频| 麻豆mv在线看| 在线观看av一区| 亚洲一级片网站| 91精品福利观看| 91精品国产综合久久久久久漫画| 日本一本在线视频| 99re8这里有精品热视频免费 | 日本亚洲欧美三级| www.久久视频| 国产一区高清在线| 成人一区二区在线| 亚洲人成色777777老人头| 国产午夜亚洲精品不卡| 亚洲一区二区精品在线| 日韩少妇视频| 丰满岳妇乱一区二区三区| 一级黄色香蕉视频| 国产亚洲字幕| 亚洲精选在线观看| 很污很黄的网站| 国内精品福利| 国产成人在线一区| 99热这里精品| 91蝌蚪porny| 青少年xxxxx性开放hg| 99爱在线视频| 欧美日韩中文字幕一区二区| 国内精品国产三级国产aⅴ久| 群体交乱之放荡娇妻一区二区| 亚洲欧洲av一区二区| 182在线观看视频| 在线精品福利| 国产欧美韩国高清| 五月天激情婷婷| 中文字幕一区二区三区四区 | 免费成人在线网站| 国产高清精品一区| 91网在线播放| 婷婷综合久久一区二区三区| 手机在线成人免费视频| 国产精品极品国产中出| 色一区av在线| 99久久精品国产亚洲| 国产精品一区二区x88av| 青青成人在线| caoprom在线| 欧美日韩国产影片| 国产交换配乱淫视频免费| 欧美天天在线| 国产日韩欧美在线播放| 日韩精品一二| 亚洲一区二区三区中文字幕| 三上悠亚av一区二区三区| 欧美成人基地| 欧美极品xxxx| 国产999久久久| 国产精品久久免费看| 国产女女做受ⅹxx高潮| 成人午夜网址| 欧美另类在线观看| 亚洲天堂手机版| 久久精品一区二区三区四区| 日韩中字在线观看| 一区二区三区在线免费看| xvideos亚洲| 波多野结衣网站| 久久女同性恋中文字幕| 热99这里只有精品| jizz久久精品永久免费| 麻豆成人在线看| 91久久久久久久久久久久| 国产农村妇女精品| 老头吃奶性行交视频| 美女精品一区最新中文字幕一区二区三区| 欧美激情一区二区久久久| 国产a级免费视频| 亚洲少妇30p| 国产又粗又长又爽又黄的视频| 精品无人区麻豆乱码久久久| 国产成人高潮免费观看精品| 欧洲天堂在线观看| 色一区在线观看| 中文字幕第20页| 日精品一区二区三区| 日韩欧美视频一区二区三区四区| 日韩大尺度黄色| 亚洲天堂av图片| 中文在线免费观看| 国产精品视频线看| 免费不卡av网站| 精品成人国产| 久久综合狠狠综合久久综青草 | 国产精品在线看| 日本在线视频网| 欧美精品777| 中文字幕在线有码| 风间由美一区二区三区在线观看| 久草免费福利在线| 亚洲+变态+欧美+另类+精品| 日韩av快播网址| av网站在线播放| 欧美一区二区美女| 国产无遮挡又黄又爽又色| 99精品黄色片免费大全| 日本老熟妇毛茸茸| 婷婷综合网站| 国产在线欧美日韩| 日韩精品99| 久久久精品亚洲| 国产综合在线播放| 欧洲激情一区二区| 欧美国产日韩在线观看成人| 岛国av在线一区| 国产成人av影视| 亚洲国产一成人久久精品| 国产精品一区二区a| 成人直播视频| 久久五月天综合| 天堂av电影在线观看| 欧美日韩精品欧美日韩精品| 久久久久香蕉视频| 久久精品欧美一区二区三区不卡 | 久久久久久不卡| 亚洲欧美在线aaa| 双性尿奴穿贞c带憋尿| 久久99精品一区二区三区三区| 分分操这里只有精品| 精品av一区二区| 99蜜桃在线观看免费视频网站| 中文字幕在线直播| 色中色综合影院手机版在线观看| 你懂的免费在线观看视频网站| 这里是久久伊人| 五月婷婷六月婷婷| 亚洲黄一区二区三区| 这里只有久久精品| 成人久久久精品乱码一区二区三区| 黄色一级免费大片| 一区在线免费观看| 性做爰过程免费播放| 精品久久久久久久久久久下田| 成人国产一区二区| 九九热这里有精品| 欧美综合在线观看| 国产乱妇乱子在线播视频播放网站| 伊人久久男人天堂| 日本精品专区| 精品久久久久久亚洲综合网| 亚洲一线在线观看| 一本一本大道香蕉久在线精品| 久久久精品视频在线| 国产精品久久久久毛片软件| b站大片免费直播| 丰满放荡岳乱妇91ww| www.51色.com| 蜜臀精品一区二区三区在线观看| 成人免费观看cn| 欧美喷水视频| 天天做天天爱天天高潮| 精品国内自产拍在线观看视频 | 国产爆初菊在线观看免费视频网站 | 97人洗澡人人免费公开视频碰碰碰| 免费超碰在线| 在线观看久久久久久| 亚洲欧美日韩动漫| 亚洲成人在线视频播放| 精品黑人一区二区三区国语馆| 欧美日韩国产另类不卡| 黄色av一区二区| 91高清在线观看| 伦av综合一区| 欧美午夜久久久| 亚洲黄色免费观看| 色一区在线观看| 黄瓜视频在线免费观看| 欧美日韩国产麻豆| 97久久久久久久| 欧美日韩在线观看视频| 青青青国产在线| 欧美日韩一区二区免费在线观看| 国产在线精品观看| 午夜一区二区三区在线观看| 国产系列精品av| 午夜精品一区在线观看| 日韩欧美高清在线观看| 亚洲国产日韩一区二区| 日本免费观看视| 欧美视频在线免费| 久久久久久av无码免费看大片| 欧美色窝79yyyycom| 中文字幕在线观看欧美| 在线不卡中文字幕| 性猛交xxxx乱大交孕妇印度| 日韩精品中文字幕在线不卡尤物| 成人av免费播放| 亚洲黄色在线观看| 你懂的视频在线| 中文字幕日韩免费视频| 国产在线观看免费麻豆| 久久91精品国产91久久跳| 538视频在线| 国产va免费精品高清在线| 巨大黑人极品videos精品| 成人免费在线视频网址| 超碰97久久| 欧美日韩国产精品一卡| 97精品国产| 美脚丝袜脚交一区二区| 亚洲一区国产一区| 国产福利在线免费| 福利91精品一区二区三区| 好吊日免费视频| 中文字幕在线不卡| 国产福利拍拍拍| 精品视频一区二区三区免费| 精品久久国产视频| 亚洲视频在线观看视频| www视频在线看| 日韩69视频在线观看| 99综合久久| 免费久久99精品国产自| 久久久国产精品| a级黄色一级片| 久久成人免费网站| 午夜视频在线观看国产| 欧美精彩视频一区二区三区| 欧美成人免费观看视频| 日本高清免费不卡视频| 国产99久一区二区三区a片| 国产视频精品久久久| 日韩子在线观看| 97国产精品视频人人做人人爱| 免费一区二区三区四区| 精品无人区一区二区三区 | 这里只有精品视频| 91九色国产在线播放| 国产美女主播一区| 日韩a级大片| 成人国产在线看| 麻豆传媒一区二区三区| 人妻丰满熟妇aⅴ无码| 亚洲免费大片在线观看| 香蕉污视频在线观看| 亚洲大胆人体av| 国产视频一区二区| 国产精品高潮在线| 日韩欧美美女在线观看| 成人污网站在线观看| 免费观看在线综合| 欧美老熟妇乱大交xxxxx| 亚洲免费av在线| 中文字幕理论片| 亚洲视频第一页| 超碰一区二区| 美女亚洲精品| 亚洲久久视频| 韩国av中国字幕| 亚洲精品欧美在线| 国产一区二区小视频| 中国日韩欧美久久久久久久久| 午夜激情在线播放| 国产偷国产偷亚洲高清97cao| 最新国产精品| 国内av免费观看| 亚洲色图丝袜美腿| 夜夜嗨av禁果av粉嫩avhd| 国产一区二区三区丝袜| 欧美电影h版| 日韩av一级大片| 视频一区二区三区入口| 国产亚洲无码精品| 精品久久久久久久中文字幕| 天天摸夜夜添狠狠添婷婷| 久久免费精品视频| 风间由美一区二区av101| 欧美一级爱爱视频| 国产成人久久精品77777最新版本| 中文字幕av播放| 日韩欧美自拍偷拍| 国产乱码在线| 久久伊人资源站| 日精品一区二区| 国产一级淫片久久久片a级| 欧美丝袜自拍制服另类| 99精品老司机免费视频| 国产欧美精品一区二区三区-老狼| 日韩av自拍| 亚洲免费成人在线视频| 亚洲激情av在线| 色噜噜在线播放| 欧洲日韩成人av| 欧美亚洲激情| 999热精品视频| 亚洲成人一区二区在线观看| 天天躁日日躁狠狠躁喷水| 热久久美女精品天天吊色| 精品一区二区三区中文字幕老牛| 九九九在线观看视频| 综合中文字幕亚洲| 亚洲成熟女性毛茸茸| 97高清免费视频| 欧美系列电影免费观看| 亚洲精品在线视频播放| 亚洲综合一区二区三区| 青青视频在线观| 国产欧美日韩中文| 欧美午夜免费影院| 久久精品成人av| 欧美一区二区三区免费大片 | 欧美a级在线| 老熟妇精品一区二区三区| 欧美主播一区二区三区| 国产区在线观看| 久久综合色一本| 久久97超碰国产精品超碰| 久草视频精品在线| 国产亚洲精品综合一区91| 看亚洲a级一级毛片| 9久久9毛片又大又硬又粗| 亚洲国产高清不卡| 亚洲奶汁xxxx哺乳期| 国产精彩精品视频| 国产精品久久| 级毛片内射视频| 精品播放一区二区| 人人精品久久| 777久久久精品一区二区三区| 中文字幕一区二区三区精华液| 色丁香婷婷综合久久| 成人伊人精品色xxxx视频| 亚洲一区日韩| 久久久久久久国产视频| 中文字幕av一区二区| 任我爽精品视频在线播放| 亚洲黄色片免费|