精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

小紅書&上交多模態大模型新基準,Gemini 1.5 Pro準確率僅48%

人工智能 新聞
通過對視覺信息、音頻信息以及視頻幀采樣密度的研究,為提升MLLMs在真實世界場景中的理解能力提供了重要的參考方向。

多模態大模型理解真實世界的水平到底如何?

有新基準來衡量了。

就在最近,小紅書和上海交通大學聯合提出WorldSense,一個全新的基準測試,用來評估多模態大模型(MLLMs)的多模態真實場景理解能力。

基于WorldSense,團隊對各種先進的MLLMs進行了廣泛評估,結果發現:

開源的視頻-音頻模型在該基準上的準確率僅約25%,幾乎等同于隨機猜測;即使是表現最好的專有模型 Gemini 1.5 Pro,準確率也只有48%,遠不能滿足可靠的真實世界應用需求。

下面具體來看。

WorldSense介紹

想象一下,當你開車時,不僅要依靠眼睛觀察道路標志、交通信號燈和障礙物,還要用耳朵聽其他車輛的喇叭聲、后方傳來的警笛聲,甚至通過手對方向盤的觸感、車輛行駛時的震動來做出實時決策,確保安全駕駛。

這就是人類在真實場景中自然的多模態信息整合能力。

而現在的多模態大模型,在處理這些復雜的真實世界場景時,表現究竟如何呢?

WorldSense的誕生,正是為了填補現有評估體系的關鍵空白。

與以往那些存在諸多局限性的基準測試不同,它具備三大核心亮點,為多模態大模型的評估開辟了新的道路。

全模態協同,深度融合感知

在WorldSense的設計中,音頻和視頻緊密耦合,每個問題都需要模型充分挖掘音頻和視頻中的線索,將兩者信息有機結合,才能找到正確答案。

比如,在上圖第一個例子中,有個人手里拿著水果。如果僅依靠視覺信息,我們可能只能看到他拿著東西這個動作,但很難確定他具體在做什么,是展示水果的顏色、大小,還是在進行其他操作;而僅憑借音頻,我們甚至都難以判斷他手中拿的是什么水果。

只有將視覺與音頻信息協同起來,模型才能準確理解場景,給出正確答案。這種設計嚴格考驗模型同時處理多種感官輸入、進行精準理解的能力。

最新的開源視頻音頻多模態大模型僅僅獲得了25%左右的準確率,而表現最好的Gemini 1.5 Pro也只有48%的準確率,并且在缺失一個模態的情況下性能下降約15%左右。

這進一步說明了全模態協同在真實世界感知的重要性和WorldSense中多模態信息的強耦合,也揭示了現有多模態大模型的局限性。

視頻與任務多樣性,全方位場景覆蓋

據介紹,WorldSense涵蓋了1662個視聽同步視頻,系統地分為8個主要領域和67個細粒度子類別,覆蓋了豐富的真實世界場景。

同時,它還包含3172個多選問答對,橫跨26種不同的認知任務,從基礎的物體識別、聲音辨別,到復雜的因果推理、抽象概念理解,全方位評估MLLMs的多模態理解能力。

高質量標注,可靠性的基石

為了保證評估的可靠性,所有的問答對都是由80位專家手動標注

而且,標注過程并非一蹴而就,而是經過多輪嚴格的人工審核,從語言表達的清晰度、邏輯的連貫性,到答案的準確性和唯一性,都進行了反復考量。

不僅如此,還借助自動MLLM驗證技術,進一步確保標注質量。

經過這樣雙重保障的標注過程,確保問題和答案的準確性和高質量。

實驗

如前所述,研究團隊基于WorldSense對各種先進的MLLMs進行了廣泛評估,結果令人深思。

開源的視頻 - 音頻模型在該基準上的準確率僅約25%,幾乎等同于隨機猜測;即使是表現最好的專有模型Gemini 1.5 Pro,準確率也只有48%,遠不能滿足可靠的真實世界應用需求。

這表明當前的模型在理解真實世界場景方面還面臨巨大挑戰,同時也凸顯了全模態協同理解的重要性。

為進一步深入剖析這些模型的性能短板,研究人員開展了細粒度分析,從不同音頻類型和任務類別兩個關鍵維度入手,挖掘模型在實際應用中的具體問題。

這一分析為我們深入洞察現有模型的局限性提供了關鍵視角。

最終結果如下:

1、音頻相關任務表現欠佳:模型在音頻識別、計數等任務上表現差,顯著落后于其他任務類型。這是由于音頻信號復雜,現有模型架構和訓練方法難以有效解析利用其中的頻率、音色等信息。

2、情感相關任務挑戰巨大:這類任務需整合面部表情、語氣語調、語音內容等多模態線索,模型表現較差,暗示其訓練數據缺乏情感樣本,且架構算法難以融合多模態信息進行判斷。

3、不同音頻類型下表現各異:以Gemini 1.5 Pro為例,其處理事件相關問題的準確率低于語音或音樂任務,其他模型也存在類似情況。這凸顯現有模型缺乏對各種音頻類型通用、穩定的理解能力。

鑒于上述評估中揭示的多模態大模型(MLLMs)在性能上的巨大差距,研究團隊深入探究了提升MLLMs性能的潛在方法,具體涵蓋視覺信息、音頻信息以及視頻幀等方面的研究。

視覺信息的影響

研究人員通過設置不同的輸入配置,探究視覺信息對模型性能的影響,這些配置包括僅音頻輸入、音頻結合視頻字幕輸入以及音頻結合視頻幀輸入。

從實驗結果來看,視覺信息通常能提升模型性能。以Gemini 1.5 Pro為例,其僅音頻輸入時準確率為34.6%,而添加視頻幀輸入后,準確率提升至48.0%。

然而,不同模型受視覺信息的影響存在差異。像UnifiedIO2系列模型,在結合視頻字幕輸入時,性能提升效果并不穩定,甚至出現了性能下降的情況。

這一現象表明,一方面,視覺信息若能被模型恰當整合,對增強多模態理解至關重要;另一方面,當前模型在有效利用視覺信息方面的能力仍然有限,可能是因為模型在處理視覺特征與其他模態信息融合時存在困難,或者是在提取視覺關鍵信息上還不夠高效。

音頻信息的作用

在音頻信息的研究上,團隊設置了三種輸入配置進行實驗,分別是僅視頻輸入、視頻結合字幕輸入以及視頻結合原始音頻輸入。

實驗結果呈現出有趣的規律

對于Gemini 1.5 Pro和OneLLM等模型,添加字幕能提高準確率,而添加原始音頻后,準確率提升更為顯著,這充分說明字幕和原始音頻中的聲學特征(如語氣、情感、環境聲音等)都為多模態理解提供了有價值的信息,且原始音頻包含了字幕無法捕捉的重要線索,對多模態理解意義重大。

但不同模型對音頻信息的處理能力也有所不同。UnifiedIO2 在整合字幕或音頻時,性能出現了下降,尤其是字幕輸入導致準確率明顯降低,這反映出該模型在多模態處理方面存在困難,可能無法有效融合音頻和視覺等多模態信息。

而Video - LLaMA2雖然在添加兩種模態信息時性能都有所提升,但對字幕的依賴更強,在處理原始音頻時表現相對較弱,這表明它更擅長處理文本形式的音頻信息,而在解析復雜聲學信息上能力不足。

此外,研究人員還對僅視頻輸入的 MLLMs 提供轉錄字幕進行評估,發現幾乎所有模型在添加字幕后性能都顯著提升,不過在音樂相關問題上,由于字幕無法有效捕捉旋律、節奏和和聲等固有聲學特征,性能提升并不明顯。

這進一步證明了原始音頻在多模態理解中的獨特價值,同時也表明當前模型在整合聲學和文本信息以實現全面場景理解方面存在較大的提升空間。

視頻幀采樣密度的效果

研究團隊還研究了視頻幀的時間采樣密度對模型性能的影響,通過改變僅視頻輸入的 MLLMs 的輸入幀數來進行實驗。

結果顯示,大多數模型在增加幀密度后,性能有顯著提升

這是因為更高的幀密度能夠讓模型更好地捕捉視頻中細粒度的時間動態變化和微妙的視覺改變,從而提升對視頻內容的理解。

例如,在一些包含快速動作或微小細節變化的視頻中,增加幀密度能讓模型獲取更多關鍵信息,進而做出更準確的判斷。但也有例外,如 LLaMA - 3.2 在增加幀密度時,性能并未提升。

這可能與該模型自身的架構特點或訓練方式有關,導致它無法有效利用增加的幀信息,這也為后續研究如何優化模型以更好地利用視頻幀信息提供了思考方向。

小結一下,通過對視覺信息、音頻信息以及視頻幀采樣密度的研究,為提升MLLMs在真實世界場景中的理解能力提供了重要的參考方向。

未來的研究可以基于這些發現,進一步優化模型架構和訓練方法,以增強模型對多模態信息的處理能力,縮小與人類真實世界理解能力之間的差距。

論文鏈接:
https://arxiv.org/abs/2502.04326
項目主頁:
https://jaaackhongggg.github.io/WorldSense/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-03 08:22:00

模型評估視頻

2024-06-12 11:50:23

2025-05-26 08:33:00

2023-10-23 10:02:00

模型技術

2024-01-05 08:44:52

2025-08-07 16:24:19

小紅書開源dots.vlm1

2025-05-07 10:09:08

2023-10-26 08:40:15

模型隱私推理

2024-12-13 07:30:40

2023-11-08 08:38:43

2025-08-07 02:00:00

2025-01-08 08:21:16

2025-05-21 08:47:00

2025-05-06 15:32:23

模型AI測試

2025-05-21 13:56:37

模型圖像AI

2025-07-07 13:50:56

AI編程算法

2025-11-05 08:51:33

2024-09-25 16:08:52

2025-04-15 12:14:10

點贊
收藏

51CTO技術棧公眾號

av中文字幕免费在线观看| 国产又粗又猛又爽又黄的视频四季 | 日韩伦理精品| 久久久夜色精品亚洲| 国产美女被下药99| 国产一级一片免费播放| 精品久久对白| 欧洲精品在线观看| 成人免费看片'免费看| 男女视频在线观看| 国产原创一区二区| 77777亚洲午夜久久多人| 成人一级片免费看| 豆花视频一区二区| 欧美日韩综合不卡| 国产在线播放观看| 91啦中文在线| 久久综合狠狠综合久久综合88| 九九热这里只有精品6| www.色多多| 精品一区二区三区在线观看视频| 亚洲国产成人午夜在线一区| 91在线播放国产| 激情视频网站在线观看| 无码一区二区三区视频| 精品小视频在线| 波多野结衣中文字幕在线播放| 91最新在线视频| 国产亚洲一二三区| 国产精品日韩一区二区| 中文在线观看免费高清| 国产欧美二区| 欧美高清激情视频| 爱爱视频免费在线观看| 菠萝蜜一区二区| 国产午夜精品全部视频在线播放| 男女视频一区二区三区| 成人性生交大片免费看网站| 中文字幕第一页久久| 欧美精品人人做人人爱视频| 欧美一区二区在线观看视频| 国内精品国产三级国产a久久| 久久国产精品久久精品| 久久久久亚洲AV成人无在| 性人久久久久| 亚洲成色777777在线观看影院 | 亚洲高清网站| 欧美成人精品激情在线观看| 影音先锋男人资源在线观看| 精品欧美激情在线观看| 亚洲欧洲成视频免费观看| 亚洲精品乱码久久久久久蜜桃图片| 日韩av一卡| 亚洲高清免费一级二级三级| 精品人妻少妇一区二区| 国产羞羞视频在线播放| 亚洲一卡二卡三卡四卡五卡| www婷婷av久久久影片| 日韩精品分区| 亚洲成人动漫av| 中文字幕无码精品亚洲35| 日本高清成人vr专区| 一区二区三区四区在线| 少妇久久久久久被弄到高潮| 蜜乳av一区| 午夜精品福利一区二区蜜股av| 色一情一乱一伦一区二区三区丨| av免费在线观看不卡| 国产一区二区三区精品视频| 亚洲一区二区三区毛片 | 色嗨嗨av一区二区三区| 人妻熟妇乱又伦精品视频| 丁香六月综合| 欧美午夜影院一区| 五月六月丁香婷婷| 97人人澡人人爽91综合色| 精品日韩在线观看| 五级黄高潮片90分钟视频| 国产精品欧美在线观看| 日韩中文字幕在线| 久久综合激情网| 久久精品亚洲| 亚洲www永久成人夜色| 亚洲爱情岛论坛永久| 99久久99精品久久久久久| 五月天亚洲综合情| av网站网址在线观看| 午夜欧美在线一二页| 人妻有码中文字幕| 亚洲一区有码| 亚洲国产精品久久久久久| 91精品人妻一区二区三区蜜桃欧美| 国产一区丝袜| 在线观看日韩www视频免费| 国产免费一区二区三区四区| 欧美日韩成人| 国产97在线视频| 国产高清免费av| 久久久久综合网| 四虎精品欧美一区二区免费| 中文字幕21页在线看| 欧美精品色综合| 小毛片在线观看| 欧美韩日高清| 欧美孕妇与黑人孕交| 国产女人高潮时对白| www激情久久| 欧美少妇在线观看| av在线一区不卡| 精品免费日韩av| 99自拍偷拍视频| 国产美女一区| 91精品天堂| 日本在线免费网| 狠狠躁夜夜躁人人躁婷婷91| 女人扒开腿免费视频app| jvid福利在线一区二区| 亚洲91av视频| 国产三级自拍视频| 中文字幕不卡三区| 国产日韩一区二区在线| 日韩中文字幕| 久久精品国产久精国产思思| 亚洲天堂视频网站| 成人免费高清视频在线观看| 异国色恋浪漫潭| 精品欧美一区二区三区在线观看 | 国产精品亚洲a| 午夜精品在线| 久久综合久久88| 中文字幕免费观看视频| 久久综合久久综合亚洲| 男女激情免费视频| 午夜视频在线观看精品中文| 精品国产欧美一区二区五十路| 麻豆网址在线观看| 日韩av一区二区三区四区| 精品国产乱码久久久久久蜜柚| 黄色网址在线播放| 五月婷婷激情综合网| 波多野结衣中文字幕在线播放| 国产精东传媒成人av电影| 久久亚洲春色中文字幕| 亚洲系列第一页| 亚洲国产精品v| 国产真人无码作爱视频免费| 免费看日本一区二区| 91av视频在线免费观看| 午夜av免费观看| 亚洲午夜视频在线| 99久久久无码国产精品性波多| 久久99国产成人小视频| 91精品国产色综合| 亚洲色欧美另类| 日韩欧美高清在线视频| 成人免费看aa片| 鲁大师影院一区二区三区| 久久大片网站| 韩国精品一区| 亚洲欧美国产视频| 日本一区二区三区久久| 中文字幕中文字幕中文字幕亚洲无线| 青青在线免费观看| 欧美大胆a级| 欧美亚洲成人网| 国产片在线观看| 欧美性猛交xxxx黑人交| 天堂网av2018| 国产一区二区美女| 丰满少妇久久久| 免费看成人吃奶视频在线| 国产精品福利观看| 国产网友自拍视频导航网站在线观看| 天天综合网 天天综合色| 97香蕉碰碰人妻国产欧美 | 粉嫩aⅴ一区二区三区四区五区| 国产日韩欧美一区二区| 欧美777四色影视在线| 91成人国产精品| 99成人在线观看| 懂色av一区二区三区蜜臀 | 九九在线视频| 欧美日韩美女一区二区| 激情综合五月网| 91碰在线视频| 久久黄色片网站| 国语精品一区| 日韩hmxxxx| 日韩精品一级| 欧美亚洲在线播放| 免费在线看a| 亚洲福利视频在线| 欧美成人一区二区视频| 一区二区三区四区在线播放 | 国产黄色片免费看| 国产女人18水真多18精品一级做| 精品久久一二三| 成人毛片免费看| 国产超碰91| 日韩制服诱惑| 97在线免费观看视频| 日本在线看片免费人成视1000| 91国偷自产一区二区三区成为亚洲经典 | 国产精品久久久久久久天堂第1集 国产精品久久久久久久免费大片 国产精品久久久久久久久婷婷 | 欧美成人手机在线| 神马久久久久| 日韩一区二区三区视频在线| 在线观看免费国产视频| 日韩一区欧美小说| 30一40一50老女人毛片| 国产福利一区二区三区视频| www日韩视频| 国产视频亚洲| 国产在线视频在线| 久久国产成人精品| 欧美极品一区二区| 国产精品自在线拍| 91在线视频成人| 日韩在线免费| 91a在线视频| 色女人在线视频| 久久亚洲精品毛片| jizz在线观看中文| 日韩大片免费观看视频播放| 国产黄色一级大片| 在线播放中文一区| 在线视频精品免费| 欧美性猛交xxxx免费看久久久| 美女被到爽高潮视频| 夫妻av一区二区| 女人高潮一级片| 国产一区二区三区成人欧美日韩在线观看 | 欧美日韩dvd| 日韩在线观看电影完整版高清免费悬疑悬疑| 国产精品黄视频| 中日韩脚交footjobhd| 欧美激情免费观看| 亚洲小说区图片| 欧美不卡视频一区发布| 超碰超碰在线| 久久久国产视频91| 精品51国产黑色丝袜高跟鞋| 中文字幕日韩综合av| 国产视频在线看| 日韩激情第一页| 手机av在线免费观看| 亚洲电影成人av99爱色| 人妻少妇精品无码专区| 精品国产sm最大网站免费看| 亚洲精品97久久中文字幕无码| 色欲综合视频天天天| 在线免费观看毛片| 五月激情综合婷婷| 欧美福利视频一区二区| 亚洲国产精品久久人人爱| 国产午夜福利精品| 精品久久久香蕉免费精品视频| 娇小11一12╳yⅹ╳毛片| 国产精品精品国产色婷婷| 网爆门在线观看| 亚洲精品国久久99热| 免费一级a毛片夜夜看| 亚洲国产你懂的| 免费在线不卡视频| 日韩欧美国产激情| 中文字幕乱码在线观看| 欧美人妇做爰xxxⅹ性高电影| 精品少妇theporn| 亚洲综合色区另类av| 国产成人愉拍精品久久| 色视频一区二区| 一区二区美女视频| 日韩视频一区二区| 婷婷综合激情网| 夜夜嗨av一区二区三区四区| 日本高清中文字幕在线| 色综合天天综合网国产成人网| 尤物网在线观看| www.亚洲一区| 91黄页在线观看| 国产精品福利观看| 亚洲超碰在线观看| 欧美人xxxxx| 99精品美女| 成年人午夜免费视频| 强制捆绑调教一区二区| 日本黄色三级网站| 久久这里都是精品| 国产尤物在线播放| 欧美午夜片在线免费观看| 伊人网综合在线| 精品动漫一区二区三区在线观看| 国产乱淫a∨片免费视频| 欧美精品一级二级| 嫩草影院一区二区| 自拍偷拍亚洲区| 91美女主播在线视频| 国产精品一区二区久久久久| 一本色道69色精品综合久久| 欧美色图亚洲自拍| 欧美日韩ab| 亚洲免费一级视频| 99久久综合狠狠综合久久| 国产白丝一区二区三区| 亚洲va国产天堂va久久en| 亚洲天堂国产精品| 日韩成人激情在线| av网站免费在线观看| 国产精品久久久久77777| 国产精品巨作av| 亚洲欧洲国产日韩精品| 一区二区高清| 无套白嫩进入乌克兰美女| 久久久久久久久久久电影| 国产亚洲精品久久久久久无几年桃| 香港成人在线视频| 97人妻精品一区二区三区视频| 欧美日韩一区高清| 在线观看xxx| 精品中文字幕乱| 国产成人福利夜色影视| 国产日韩二区| 亚洲欧美伊人| 欧美特级aaa| 久久久777精品电影网影网| 日韩三级av在线| 精品国产凹凸成av人导航| a级影片在线观看| 国产主播欧美精品| av中字幕久久| 国内自拍视频网| 久久色中文字幕| 久久久久久久久影院| 欧美精品一区二区不卡| 亚洲国产精品精华素| 成人综合网网址| 亚洲精品一区二区在线看| 国产视频手机在线播放| 国产日韩欧美a| 激情五月婷婷网| 亚洲欧美中文日韩在线| 电影一区二区三| 欧美日韩无遮挡| 久久精品观看| 亚洲AV无码国产成人久久| 欧美日韩亚洲视频| 日韩有码电影| 欧美最顶级的aⅴ艳星| 最新国产一区| 亚洲人成无码www久久久| 国产三级精品三级| 中文字幕人妻精品一区| 中文字幕av一区中文字幕天堂| 日本中文字幕中出在线| 91久久在线观看| 91成人国产| xxxx视频在线观看| 亚洲综合久久av| 天堂成人在线视频| 欧美一区第一页| 少妇精品久久久一区二区| 国产一线二线三线在线观看| 国产精品妹子av| 97免费观看视频| 欧美精品www| 欧美成人午夜77777| 激情五月婷婷久久| 最新日韩av在线| 欧美特黄一级视频| 91sa在线看| 成人高清av| 手机在线观看日韩av| 午夜精品久久久久久久久| 黄色网址在线播放| 91在线观看欧美日韩| 亚洲人体偷拍| 中文字幕免费在线看线人动作大片| 午夜国产精品影院在线观看| 日本一区视频| 成人免费看片视频| 一本色道88久久加勒比精品| 一道本在线观看| 91精品国产福利在线观看| 国产探花视频在线观看| 久久国产精品-国产精品| 青青国产91久久久久久| 欧美高清视频一区二区三区| 日韩成人小视频| 看片一区二区| 成年人看的毛片| 国产精品网友自拍| 亚洲精品国产一区二| 国产精品爱久久久久久久| 欧美精品午夜| 久久精品国产亚洲AV熟女| 欧美一区二区日韩一区二区| 在线视频超级| 日本久久久网站| 国产欧美综合色| 天堂在线资源网|