精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI集體“聽不懂”!MMAR基準(zhǔn)測試揭示音頻大模型巨大短板

人工智能 新聞
這一全新基準(zhǔn)測試MMAR來自上海交通大學(xué)、 南洋理工大學(xué)、倫敦瑪麗皇后大學(xué)、字節(jié)跳動、2077AI開源基金會等研究機構(gòu)。

用AI來整理會議內(nèi)容,已經(jīng)是人類的常規(guī)操作。

不過,你猜怎么著?面對1000道多步驟音頻推理題時,30款A(yù)I模型竟然幾乎全軍覆沒,很多開源模型表現(xiàn)甚至接近瞎猜。

就連表現(xiàn)最好的開源模型Qwen-2.5-Omni,準(zhǔn)確率也只有56.7%;而閉源選手Gemini 2.0 Flash則以65.6%的成績一騎絕塵,遙遙領(lǐng)先全場。

這一全新基準(zhǔn)測試MMAR來自上海交通大學(xué)、 南洋理工大學(xué)、倫敦瑪麗皇后大學(xué)、字節(jié)跳動、2077AI開源基金會等研究機構(gòu)。

圖片

MMAR 是什么?它有多難?

MMAR全稱是:A Challenging Benchmark for Deep Reasoning in Speech, Audio, Music, and Their Mix。

簡單來說,它是一個包含1000個高質(zhì)量問題的音頻理解評估基準(zhǔn),每個問題都要求模型具備多步驟的深度推理能力。

我們先來看個例子:

問題是:理發(fā)師能否聽懂英文?

在這段音頻中,被理發(fā)的人用英語反復(fù)強調(diào)自己想要的理發(fā)效果,另一個人將其翻譯成中文來幫助他強調(diào),這說明理發(fā)師不能聽懂英文,需要旁人翻譯為中文。這個問題考察音頻大模型對于多說話人交互和復(fù)雜語義的理解和推理能力,屬實不易。

而這樣的例子有整整1000題,由標(biāo)注者們頭腦風(fēng)暴并精心標(biāo)注,還通過了嚴(yán)格的審核程序。其他的例子包括:

  • “根據(jù)聲音,判斷哪次尺子伸出桌子外的長度更長?”
  • “根據(jù)石頭落井的回聲,判斷井深度?”
  • “這三段音樂的作曲家的親子關(guān)系?”
  • “有幾個人在學(xué)說中文?”
    圖片

△MMAR基準(zhǔn)測試中的例子

這些問題覆蓋了四個層級的推理能力:

層級

簡單解釋

信號層(Signal)

聲音的基本屬性,比如頻率、波形、節(jié)奏等

感知層(Perception)

識別聲音種類、來源、方向等

語義層(Semantic)

理解音頻內(nèi)容所表達(dá)的意義

文化層(Cultural)

結(jié)合文化背景、常識、風(fēng)格等進(jìn)行深層次解讀

而且,每個任務(wù)都需要多步推理,其中一些任務(wù)甚至需要極富挑戰(zhàn)性的感知技能和領(lǐng)域特定知識,音頻包含真實場景的語音、音樂、環(huán)境事件聲音和他們的混合,相當(dāng)?shù)挠须y度。

圖片

△MMAR音頻數(shù)據(jù)的語音、音樂、環(huán)境事件聲音和他們混合的類別分布

圖片

△MMAR的推理層級和任務(wù)類別分布

測試結(jié)果:AI 在“聽”方面到底怎么樣?

研究團隊一口氣測試了30款音頻相關(guān)模型,包括 LALMs(大型音頻語言模型)、LARMs(大型音頻推理模型)、OLMs(全能型多模態(tài)模型)等等。結(jié)果讓人有點哭笑不得:

  • 開源模型中,最強的是Qwen-2.5-Omni(7B),但平均準(zhǔn)確率也僅為56.7%,這說明MMAR的難度遠(yuǎn)超預(yù)期;
  • 而閉源模型Gemini 2.0 Flash直接飆到了65.6%,甩開其他選手一大截;
  • 更夸張的是:大部分開源模型的表現(xiàn),幾乎跟瞎猜差不多

這說明了什么?

說明當(dāng)前大多數(shù)開源模型,在面對復(fù)雜音頻推理任務(wù)時,還遠(yuǎn)遠(yuǎn)沒達(dá)到實用水平。

圖片

△泊松二項分布展示了隨機猜測下準(zhǔn)確率的P值

更令人驚訝的是,在音樂相關(guān)的任務(wù)中,幾乎所有模型都“掉了鏈子”。這說明當(dāng)前模型在識別旋律、節(jié)奏結(jié)構(gòu)、作曲風(fēng)格等深層次音頻信息方面仍存在巨大挑戰(zhàn)。

圖片

△五類模型在MMAR基準(zhǔn)上的結(jié)果

其次,具有顯式推理能力的模型始終優(yōu)于不具備顯式推理能力的模型。例如,Audio-Reasoner的表現(xiàn)優(yōu)于Qwen2-Audio和Qwen2-Audio-Instruct,而音頻摘要+ DeepSeek-R1 的表現(xiàn)優(yōu)于音頻摘要+ DeepSeek-V3。

圖片

△MMAR基準(zhǔn)上的性能比較:使用噪聲替換音頻作為輸入的影響

研究團隊還做了一個“靈魂拷問”實驗——把輸入音頻換成噪聲。

結(jié)果發(fā)現(xiàn),模型性能都大幅下降,證明它們確實在“聽”音頻,而不是靠文本先驗瞎猜。不過,Qwen-2.5-Omni在噪聲輸入下依然略高于隨機猜測 ,暴露出潛在的語言先驗偏差問題。

此外,研究人員測試了多種級聯(lián)模型組合(如音頻摘要+LLM推理)。

結(jié)果顯示,更換更強的音頻理解模型或推理模型都能帶來性能提升,說明感知能力和推理能力是相輔相成的。

總體來看,當(dāng)前大多數(shù)開源模型在面對MMAR這樣的深度音頻推理任務(wù)時,表現(xiàn)仍然不盡人意。

AI 到底哪里“聽不懂”?

為了搞清楚模型失敗的原因,研究人員對提供思維鏈的Audio-Reasoner模型的錯誤進(jìn)行了分類,發(fā)現(xiàn)主要有以下幾類:

錯誤類型

占比

舉例說明

感知錯誤(Perceptual Errors)

37%

分不清是鋼琴還是吉他、聽不出是雨聲還是鼓聲

推理錯誤(Reasoning Errors)

20%

推理鏈條斷裂、邏輯跳躍失誤

知識錯誤(Knowledge Gaps)

9%

缺乏對某種音樂流派或文化背景的理解

其他錯誤(Others)

34%

包括生成崩潰、指令誤解、最終答案與推理結(jié)果不一致等

也就是說,現(xiàn)在的 AI 不僅“耳朵不好使”,“腦子也不太靈光”。

總結(jié)與展望

通過MMAR的測試可得以下幾個關(guān)鍵結(jié)論:

  1. 當(dāng)前開源音頻大模型在音頻推理上表現(xiàn)不佳,亟需數(shù)據(jù)與算法協(xié)同創(chuàng)新;
  2. 模型是否具備推理能力,直接影響性能表現(xiàn);
  3. 閉源模型能力遠(yuǎn)遠(yuǎn)超過開源模型,開源社區(qū)需努力追趕;
  4. 近期的音視頻全模態(tài)大模型的音頻能力高于之前的音頻大模型。

在這個開創(chuàng)性項目中,各參與機構(gòu)發(fā)揮了獨特的優(yōu)勢和作用。來自香港科技大學(xué)和倫敦瑪麗皇后大學(xué)的音樂科技工作者對專業(yè)的音樂題目進(jìn)行收集和標(biāo)注;2077AI的研究員提供了數(shù)據(jù)處理與標(biāo)注平臺銜接的重要保障。此外,整數(shù)智能數(shù)據(jù)工程平臺提供了專業(yè)的支持,平臺的多輪審核機制和協(xié)同標(biāo)注功能為數(shù)據(jù)質(zhì)量提供了強有力的保障。

研究人員希望,隨著更多研究者加入這一領(lǐng)域,人們在未來會看到真正“聽得懂”的AI:不僅能聽清你在說什么,還能聽出你在想什么。

文章: https://arxiv.org/abs/2505.13032

代碼(GitHub):https://github.com/ddlBoJack/

MMAR數(shù)據(jù)集(HuggingFace):https://huggingface.co/datasets/BoJack/MMAR

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-04-01 08:00:00

AI模型

2025-04-14 00:10:00

人工智能AIAI 模型

2025-10-28 09:16:38

2025-05-26 08:33:00

2025-05-21 08:47:00

2025-05-23 08:47:00

2025-05-28 10:31:13

2025-10-15 09:08:27

AI大模型智能體

2025-05-30 03:10:00

AISeePhys多模態(tài)短板

2023-11-07 07:00:37

2023-01-20 17:53:37

云原生K8sRancher

2024-04-08 13:29:52

2025-10-20 09:12:00

2023-10-28 13:29:27

2025-07-17 10:47:33

2023-07-05 09:57:11

2013-05-07 09:47:30

測試MySQLMySQL測試

2024-04-15 13:51:03

模型LLMLLMs

2025-10-15 14:02:29

AI模型自動駕駛
點贊
收藏

51CTO技術(shù)棧公眾號

日韩精品免费观看| 中文字幕 久热精品 视频在线| 免费91在线视频| 荫蒂被男人添免费视频| 日产精品一区| 亚洲视频免费在线观看| 精品国产乱码久久久久| 中文字幕 国产精品| 亚洲乱码精品| 亚洲免费影视第一页| 一个色综合久久| 欧美调教sm| 亚洲免费在线观看视频| 久久草.com| 91丨九色丨丰满| 一区二区三区国产盗摄| 久久久99久久精品女同性| 精品国产人妻一区二区三区| 91国产一区| 色偷偷久久人人79超碰人人澡| 日韩不卡一二区| 久香视频在线观看| 国产大陆精品国产| 国产精品偷伦一区二区| 国产99久久久| 伊人久久综合| 欧美大尺度激情区在线播放| 欧美多人猛交狂配| 超碰97久久| 欧美精品久久99| 在线观看高清免费视频| 国产拍在线视频| 亚洲综合激情另类小说区| 亚洲精品日韩在线观看| 久久久久久久久亚洲精品| 丁香亚洲综合激情啪啪综合| 91人成网站www| 中文字幕无码乱码人妻日韩精品| 91久久中文| 久久91亚洲精品中文字幕奶水| 国产又粗又长免费视频| 久久99久久人婷婷精品综合| 日韩大片在线观看视频| av免费观看不卡| 亚洲精品一二三**| 在线播放视频一区| 亚洲欧美视频二区| 成人精品一区二区三区电影| 91福利在线看| 91av俱乐部| 一区二区视频免费完整版观看| 欧美日韩精品在线| 亚洲 高清 成人 动漫| 成年人国产在线观看| 亚洲在线视频一区| 欧美日韩视频免费| 成人影音在线| 狠狠干狠狠久久| 777米奇影视第四色| 日韩高清中文字幕一区二区| 色婷婷激情综合| 狠狠热免费视频| 国产一区高清| 91麻豆精品国产自产在线 | 日韩福利在线视频| 成人久久电影| 久久激情视频久久| 一区视频免费观看| 亚洲承认在线| 欧美综合第一页| 国产亚洲久一区二区| 蜜臀av在线播放一区二区三区| 成人黄色av网站| 性网爆门事件集合av| av不卡免费在线观看| 久久国产精品高清| a黄色在线观看| 亚洲人成精品久久久久久| 国内少妇毛片视频| 在线观看v片| 欧美人妖巨大在线| 久久久久中文字幕亚洲精品| 亚洲成在人线免费观看| 日韩一区二区在线视频| 久久久久久久久久久97| 午夜在线a亚洲v天堂网2018| 91精品久久久久久久久中文字幕 | 日本少妇bbwbbw精品| 国产美女一区| 国产精品影院在线观看| www.中文字幕| 久久精品视频免费| 欧美少妇一区二区三区| 色黄视频在线观看| 欧美精品亚洲一区二区在线播放| 少妇熟女视频一区二区三区| 国产91精品对白在线播放| 久久精品国产免费观看| 午夜影院在线看| 久久精品免费观看| 国产中文一区二区| 国产在线观看av| 欧美日韩亚洲一区二区三区| 婷婷免费在线观看| 牛牛影视久久网| yellow中文字幕久久| 国产午夜视频在线| 极品少妇xxxx偷拍精品少妇| 九9re精品视频在线观看re6| 国产人成网在线播放va免费| 欧美特黄级在线| 国产吃瓜黑料一区二区| 久久国产小视频| 欧美亚洲在线播放| 六月婷婷综合网| 亚洲桃色在线一区| 成人免费观看毛片| 国产精品xxx在线观看| 日韩视频永久免费观看| 日韩免费av网站| www.日本不卡| 蜜桃视频一区二区在线观看| 韩国精品视频在线观看| 亚洲欧美在线一区| 精品国产乱码一区二区| 国产成人综合视频| 青少年xxxxx性开放hg| 国产精品字幕| 日韩久久免费电影| 日韩欧美视频在线免费观看| 国产一区二区三区综合| 亚洲一卡二卡三卡| 日本精品网站| 亚洲天堂av在线免费| 在线免费黄色av| 99久久精品99国产精品 | 久久久久久一区二区| 国产伦精品一区| 精灵使的剑舞无删减版在线观看| 制服丝袜亚洲播放| 日本美女黄色一级片| 免费成人你懂的| 特级西西444www大精品视频| 日韩一区二区三区在线免费观看 | 日b视频在线观看| 激情成人综合| 国产一区二区三区四区五区在线| 日本动漫理论片在线观看网站| 欧美一区二区三区四区视频| 熟女av一区二区| 国产一区二区女| 成年丰满熟妇午夜免费视频| 日韩精品免费视频一区二区三区 | 日本欧美色综合网站免费| 妞干网免费在线视频| 亚洲精品456在线播放狼人| 日本在线视频免费| 91片在线免费观看| 粗暴91大变态调教| 99九九热只有国产精品| 成人国产在线激情| 欧美激情成人动漫| 亚洲国产高清自拍| 国产亚洲欧美在线精品| 国产情人综合久久777777| 国产成人黄色网址| 永久亚洲成a人片777777| 成人一区二区在线| 高端美女服务在线视频播放| 亚洲视频777| 91麻豆视频在线观看| 亚洲黄网站在线观看| 国产精品成人99一区无码 | 亚洲国产综合人成综合网站| 波多野结衣有码| 天堂影院一区二区| 国产一区一区三区| 久久久久97| 日韩美女视频免费在线观看| 蜜桃视频网站在线观看| 精品日韩一区二区| 老熟妇仑乱一区二区av| 亚洲欧洲日韩女同| 91av在线免费| 久久精品999| www.日本在线播放| 日韩欧美字幕| 国产私拍一区| 高清亚洲高清| 97成人超碰免| 久久bbxx| 国产午夜精品久久久| 国产日产亚洲系列最新| 日韩欧美在线第一页| 国产黄色片在线免费观看| 久久久久国产精品免费免费搜索| 色婷婷综合在线观看| 久久一区激情| 青草网在线观看| 成人羞羞网站入口免费| 国产精品区一区二区三在线播放 | 青青草国产精品97视觉盛宴| www.成年人视频| 日韩理论片av| 乱一区二区三区在线播放| 色婷婷成人网| 日韩av电影手机在线| 色呦呦久久久| 精品国产一区av| 国内精品一区视频| 亚洲精品国产精品国自产在线 | www国产精品com| 偷拍自拍在线| 亚洲成人精品av| 亚洲视频在线免费播放| 色综合视频在线观看| 久草资源在线视频| 国产精品久久夜| 日本高清www| 99久久精品国产麻豆演员表| 性生交大片免费看l| 久久99精品国产.久久久久久| 欧美成人xxxxx| 一区三区视频| www.18av.com| 综合av在线| 国产免费色视频| 久久一区二区三区电影| 色就是色欧美| 国产在线日韩精品| 欧美日韩在线一区二区三区| 欧美日韩大片免费观看| 国产欧美一区二区视频| 日韩欧美中文在线观看| 91亚洲精品久久久| 亚洲欧美专区| 成人性生交大片免费看小说| 久久麻豆视频| 国产美女精品免费电影| 亚洲一区二区av| 国产日本欧美一区二区三区在线| 亚洲www啪成人一区二区| 国产999视频| 欧美暴力调教| 国产免费观看久久黄| 国产一区高清| 92国产精品视频| 麻豆精品一区| 成人情视频高清免费观看电影| aaa国产精品视频| 国产私拍一区| 国产videos久久| 五月天丁香综合久久国产 | 97超碰人人草| 制服视频三区第一页精品| av网站在线免费看| 日韩欧美中文一区二区| 亚洲卡一卡二卡三| 亚洲福利在线看| 色综合久久网女同蕾丝边| 国产亚洲精品va在线观看| 超碰免费在线观看| 久久久www成人免费精品| av香蕉成人| 久久久亚洲精选| 中文字幕这里只有精品| 国产精品高精视频免费| 欧美黄页在线免费观看| 97人人香蕉| 亚洲另类春色校园小说| 亚洲国产欧美日韩| 自拍偷拍欧美| 成人免费观看视频在线观看| 人人爽香蕉精品| 亚洲熟女一区二区三区| 久久看人人爽人人| 99久久久无码国产精品不卡| 悠悠色在线精品| 伊人手机在线视频| 欧美日韩成人综合在线一区二区 | 亚洲欧美激情四射在线日| 五月婷婷在线视频| 欧美成人精品激情在线观看| 擼擼色在线看观看免费| 国产欧美一区二区三区久久| 7m精品国产导航在线| 日韩高清在线播放| 欧美久久九九| 免费看黄色一级大片| 国产成人在线视频播放| 国产国语性生话播放| 亚洲欧美综合色| 青青国产在线观看| 欧美欧美午夜aⅴ在线观看| 开心激情综合网| 日韩三级成人av网| 在线观看爽视频| 亚洲自拍偷拍一区| 欧美在线电影| 欧美日韩国产精品激情在线播放| 精品影院一区二区久久久| 大黑人交xxx极品hd| 亚洲人一二三区| 亚洲高清视频免费观看| 亚洲大胆人体av| www免费视频观看在线| 国产精品久久久久7777婷婷| 国产精品白丝一区二区三区| 咪咪色在线视频| 久久免费国产| 亚洲一区二区三区四区五区六区| 亚洲三级电影全部在线观看高清| 日本视频免费观看| 亚洲国产成人精品女人久久久 | aa成人免费视频| 日韩视频在线观看| 亚洲成熟丰满熟妇高潮xxxxx| 国产99久久精品| 日韩欧美国产成人精品免费| 欧美亚洲动漫另类| 免费在线性爱视频| 51ⅴ精品国产91久久久久久| 999久久精品| av动漫在线免费观看| 极品少妇xxxx精品少妇| 日韩精品电影一区二区三区| 色综合视频在线观看| 天天av综合网| 91精品国产91久久久久久| 中文字幕久久精品一区二区 | 伊人久久综合| 亚洲熟女一区二区三区| 亚洲激情综合网| 国产av无码专区亚洲av麻豆| 中文字幕久热精品在线视频 | aⅴ色国产欧美| 污污免费在线观看| 亚洲国产精品久久不卡毛片| 性网爆门事件集合av| 欧美激情一区二区三区高清视频| 国产精品国产三级在线观看| 欧美一级免费在线观看| 九一久久久久久| 日韩成人短视频| 8x8x8国产精品| 1024在线播放| 高清不卡日本v二区在线| 狠狠干综合网| 免费黄色三级网站| 午夜精品福利一区二区三区蜜桃| 日本免费一区视频| 91av在线播放视频| 性人久久久久| 黄色国产小视频| 国产精品色婷婷久久58| 国产精品久久久久久久一区二区| 久久福利视频导航| 66精品视频在线观看| 久无码久无码av无码| 99久久精品国产精品久久| 国产免费一级视频| 日韩在线视频线视频免费网站| 欧美日韩破处视频| 成人黄色片免费| 91啪亚洲精品| 中文字幕人妻互换av久久 | 欧洲一区精品| 日韩亚洲欧美精品| 国产一区二区三区四区五区美女| 麻豆一区产品精品蜜桃的特点| 精品卡一卡二卡三卡四在线| 美女网站在线看| 色999五月色| 国产精品中文字幕一区二区三区| 国产精品成人国产乱| 亚洲人成电影网站| 高清不卡一区| 国产极品尤物在线| 国产欧美日韩三区| www.亚洲欧美| 国产精品久久久久7777婷婷| 欧美在线免费一级片| 魔女鞋交玉足榨精调教| 欧美日韩1234| 人狥杂交一区欧美二区| 中文有码久久| 99久久er热在这里只有精品15| 中日韩av在线| 午夜精品一区二区三区在线视 | 亚洲老女人视频免费| 国产女同无遮挡互慰高潮91| 天天做天天摸天天爽国产一区| 77导航福利在线| 精品国产_亚洲人成在线| 蜜桃久久精品一区二区| 国产无码精品在线播放| xxx欧美精品| 精品国产一区二区三区av片| av漫画在线观看| 欧美精品乱人伦久久久久久|