精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

遷移DeepSeek-R1同款算法,小米讓7B模型登頂音頻理解推斷MMAU榜單

人工智能 新聞
MMAU是一個(gè)由一萬(wàn)條涵蓋語(yǔ)音、環(huán)境聲和音樂(lè)的音頻樣本構(gòu)成的評(píng)測(cè)基準(zhǔn),難度非常高,人類專家的成績(jī)?yōu)?2.2%。

7B小模型+3.8萬(wàn)條訓(xùn)練數(shù)據(jù),就能讓音頻理解和推斷評(píng)測(cè)基準(zhǔn)MMAU榜單王座易主?

受到DeepSeek-R1中強(qiáng)化學(xué)習(xí)算法的啟發(fā),小米大模型團(tuán)隊(duì)對(duì)阿里的Qwen2-Audio-7B模型進(jìn)行了微調(diào)。

結(jié)果模型在MMAU上的準(zhǔn)確率從49.2%提升到了64.5%(漲幅31%),比以前霸榜的GPT-4o還高出近10個(gè)百分點(diǎn)。

MMAU是一個(gè)由一萬(wàn)條涵蓋語(yǔ)音、環(huán)境聲和音樂(lè)的音頻樣本構(gòu)成的評(píng)測(cè)基準(zhǔn),難度非常高,人類專家的成績(jī)?yōu)?2.2%。

圖片

來(lái)自阿里的Qwen2-Audio-7B模型在此評(píng)測(cè)集上的準(zhǔn)確率為49.2%,經(jīng)小米大模型團(tuán)隊(duì)用清華大學(xué)發(fā)布的AVQA數(shù)據(jù)集,使用SFT微調(diào)后提升到了51.8%。

這樣的提升并不明顯,而當(dāng)小米團(tuán)隊(duì)選擇改用DeepSeek-R1的GRPO算法時(shí),發(fā)現(xiàn)獲得了巨大的性能提升,一舉達(dá)到了MMAU的新SOTA。

目前,小米大模型團(tuán)隊(duì)已經(jīng)把訓(xùn)練代碼、模型參數(shù)開源,并提供了技術(shù)報(bào)告、在線Demo。

圖片

7B小模型拿下MMAU榜單SOTA

如前所述,小米大模型團(tuán)隊(duì)通過(guò)SFT,使用清華AVQA數(shù)據(jù)集對(duì)選擇了來(lái)自阿里的Qwen2-Audio-7B進(jìn)行了微調(diào),成績(jī)提升了2.6個(gè)百分點(diǎn)。

直到DeepSeek-R1的發(fā)布,為小米在該項(xiàng)任務(wù)上的研究帶來(lái)了啟發(fā)。

DeepSeek-R1的Group Relative Policy Optimization(GRPO)方法,讓模型僅通過(guò)”試錯(cuò)-獎(jiǎng)勵(lì)”機(jī)制就能使自主進(jìn)化,涌現(xiàn)出類似人類的反思、多步驗(yàn)證等推理能力。

在同一時(shí)間,卡內(nèi)基梅隆大學(xué)發(fā)布的預(yù)印本論文(arxiv:2503.01067),通過(guò)精巧的實(shí)驗(yàn)得出了一個(gè)有趣的論斷:

當(dāng)任務(wù)存在明顯的生成-驗(yàn)證差距(Generation-Verification Gap),即任務(wù)生成結(jié)果的難度遠(yuǎn)大于驗(yàn)證結(jié)果正確性的難度時(shí),強(qiáng)化學(xué)習(xí)比起有監(jiān)督微調(diào)具有獨(dú)特優(yōu)勢(shì)

而AQA任務(wù),恰好是完美的生成-驗(yàn)證差距顯著的任務(wù)。

離線微調(diào)方法,如SFT,有點(diǎn)像背題庫(kù),你只能根據(jù)已有的題目和答案訓(xùn)練,但遇到新題可能不會(huì)做;

而強(qiáng)化學(xué)習(xí)方法,如GRPO,像老師在要求你多想幾個(gè)答案,然后老師告訴你哪一個(gè)答案好,讓你主動(dòng)思考,激發(fā)出自身的能力,而不是被“填鴨式”教學(xué)。

當(dāng)然,如果訓(xùn)練量足夠,比如有學(xué)生愿意花很多年的時(shí)間來(lái)死記硬背題庫(kù),也許最終也能達(dá)到不錯(cuò)的效果,但效率太低,浪費(fèi)太多時(shí)間。

而主動(dòng)思考,更容易快速地達(dá)到舉一反三的效果。強(qiáng)化學(xué)習(xí)的實(shí)時(shí)反饋可能會(huì)幫助模型更快鎖定高質(zhì)量答案的分布區(qū)域,而離線方法需要遍歷整個(gè)可能性空間,效率要低得多。

基于上述洞察,小米嘗試將DeepSeek-R1的GRPO算法遷移到Qwen2-Audio-7B模型上

令人驚喜的是,在僅使用AVQA的3.8萬(wàn)條訓(xùn)練樣本的情況下,強(qiáng)化學(xué)習(xí)微調(diào)后的模型在MMAU評(píng)測(cè)集上實(shí)現(xiàn)了64.5%的準(zhǔn)確率,這一成績(jī)比目前榜單上第一名的商業(yè)閉源模型GPT-4o有近10個(gè)百分點(diǎn)的優(yōu)勢(shì)。

有趣的是,如果在訓(xùn)練中強(qiáng)制要求模型輸出包含thinking標(biāo)簽的推理過(guò)程時(shí),準(zhǔn)確率反而下降至61.1%。這說(shuō)明顯式的思維鏈結(jié)果輸出可能并不利于模型的訓(xùn)練

小米大模型團(tuán)隊(duì)的實(shí)驗(yàn)揭示了幾個(gè)和傳統(tǒng)認(rèn)知不同的結(jié)論:

  • 關(guān)于微調(diào)方法:強(qiáng)化學(xué)習(xí)在3.8萬(wàn)條數(shù)據(jù)集上的表現(xiàn),顯著超過(guò)監(jiān)督學(xué)習(xí)在57萬(wàn)條數(shù)據(jù)集上的結(jié)果;
  • 關(guān)于參數(shù)規(guī)模:相比千億級(jí)模型,7B參數(shù)的模型通過(guò)強(qiáng)化學(xué)習(xí)也可展現(xiàn)強(qiáng)推理能力;
  • 關(guān)于隱式推理:顯式思維鏈輸出反而成為性能瓶頸。

盡管當(dāng)前準(zhǔn)確率已突破64%,但距離人類專家82%的水平仍有差距。

小米大模型團(tuán)隊(duì)表示,在當(dāng)前的實(shí)驗(yàn)中,強(qiáng)化學(xué)習(xí)策略還是比較粗糙,訓(xùn)練過(guò)程對(duì)思維鏈的引導(dǎo)并不充分,我們會(huì)在后續(xù)做進(jìn)一步探索。

此次實(shí)驗(yàn)驗(yàn)證了強(qiáng)化學(xué)習(xí)在音頻理解和判斷領(lǐng)域的獨(dú)特價(jià)值,也為后續(xù)研究打開了一扇新的大門。

小米團(tuán)隊(duì)期待,當(dāng)機(jī)器不僅能“聽見”聲音,還能“聽懂”聲音背后的因果邏輯時(shí),真正的智能聽覺時(shí)代將會(huì)來(lái)臨。

人類專家準(zhǔn)確率82.23%

MMAU(Massive Multi-Task Audio Understanding and Reasoning)評(píng)測(cè)集由美國(guó)馬里蘭大學(xué)和Adobe的研究人員于去年聯(lián)合提出,是音頻理解和推斷能力的量化標(biāo)尺

它通過(guò)一萬(wàn)條涵蓋語(yǔ)音、環(huán)境聲和音樂(lè)的音頻樣本,結(jié)合人類專家標(biāo)注的問(wèn)答對(duì),測(cè)試模型在27種技能,如跨場(chǎng)景推理、專業(yè)知識(shí)等應(yīng)用上的表現(xiàn),期望模型達(dá)到接近人類專家的邏輯分析水平。

  • 面對(duì)一段汽車行駛中的座艙錄音,AI 能否判斷出汽車是否存在潛在的故障?
  • 在交響樂(lè)演出現(xiàn)場(chǎng),AI 能否推測(cè)出作曲家創(chuàng)造這首音樂(lè)時(shí)的心情?
  • 在早高峰地鐵站混亂的腳步聲潮中,AI 能否預(yù)判閘機(jī)口可能發(fā)生的沖撞風(fēng)險(xiǎn)?

圖片

在大模型時(shí)代,人們已經(jīng)不滿足于機(jī)器僅僅識(shí)別說(shuō)話的內(nèi)容、聲音的種類,更期望機(jī)器具備復(fù)雜的理解和判斷能力,MMAU衡量的就是這種能力。

這是一個(gè)很難的評(píng)測(cè)集,作為基準(zhǔn)上限,人類專家在MMAU上的準(zhǔn)確率為82.23%

目前MMAU官網(wǎng)榜單上表現(xiàn)最好的模型是GPT-4o,準(zhǔn)確率為57.3%。緊隨其后的是谷歌的Gemini 2.0 Flash,準(zhǔn)確率為55.6%。

訓(xùn)練代碼:https://github.com/xiaomi-research/r1-aqa

模型參數(shù):https://huggingface.co/mispeech/r1-aqa

技術(shù)報(bào)告:https://arxiv.org/abs/2503.11197交互Demo:http://120.48.108.147:7860/

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-03-27 10:28:32

2025-03-10 08:30:00

AI模型訓(xùn)練

2025-06-25 08:54:03

模型訓(xùn)練AI

2025-02-19 08:00:00

2024-07-15 08:58:00

2025-04-03 06:30:00

2024-08-13 15:40:00

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-06-12 09:48:27

2024-07-18 12:53:13

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-02-25 10:03:20

2025-04-29 09:06:00

2024-04-02 09:17:50

AI數(shù)據(jù)開源

2025-06-17 09:09:00

2025-03-05 03:00:00

DeepSeek大模型調(diào)優(yōu)

2025-03-06 17:29:21

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

久久男女视频| 少妇高潮一区二区三区99| 精品日韩视频| 欧美极品少妇xxxxⅹ高跟鞋| 国产欧美最新羞羞视频在线观看| 国产一二三四区在线| 欧洲亚洲精品久久久久| 亚洲午夜久久久久久久久电影院| 九九热久久66| 国产一区二区三区中文字幕| 亚洲调教视频在线观看| 亚洲四色影视在线观看| 奇米777在线视频| 麻豆mv在线看| 亚洲人成7777| 欧美日韩一区在线播放| 国产偷拍一区二区| 久久精品人人| 欧美激情a在线| 日本黄区免费视频观看| 日本一道高清一区二区三区| 欧美精品在线一区二区三区| 男人日女人bb视频| 草莓福利社区在线| 97精品超碰一区二区三区| 国产日韩在线一区| 一级片免费在线播放| 午夜久久tv| 亚洲最新在线视频| 免费日本黄色网址| av在线国产精品| 日本精品一级二级| 青青草视频在线免费播放| 麻豆传媒视频在线观看免费| 久久久久一区二区三区四区| 国产精品免费在线 | 黄色亚洲在线| 女厕嘘嘘一区二区在线播放| 国产欧美日韩精品一区| 成人欧美一区二区三区视频xxx| aaa人片在线| 欧美一区不卡| 中文字幕无线精品亚洲乱码一区 | 午夜精品免费观看| 最新亚洲激情| 欧美黑人性视频| 粉嫩av性色av蜜臀av网站| 凹凸成人精品亚洲精品密奴| 亚洲精品视频二区| 日韩精品视频一区二区| 1313精品午夜理伦电影| 欧美一区二区精品| 手机在线视频一区| 电影中文字幕一区二区| 欧美日韩dvd在线观看| 日av中文字幕| 日本精品在线中文字幕| 色综合天天视频在线观看 | 青青草97国产精品免费观看无弹窗版| 国产91精品高潮白浆喷水| 久草资源在线视频| 狠狠88综合久久久久综合网| 欧美黄色www| 精品在线视频观看| 亚洲高清资源| 久久青草福利网站| 韩国av中文字幕| 久久国产66| 国产激情视频一区| 亚洲精品无码久久久久| 免播放器亚洲一区| 成人免费淫片视频软件| 国产chinasex对白videos麻豆| 国产精品自拍在线| 国产精品福利视频| 神马精品久久| 国产精品热久久久久夜色精品三区| 亚洲视频在线二区| 久久久久亚洲精品成人网小说| 久久久久久日产精品| 亚洲激情自拍图| 99久久免费看精品国产一区| 久久99精品国产自在现线| 亚洲国产女人aaa毛片在线| 国产乱了高清露脸对白| 在线观看亚洲黄色| 午夜精品毛片| 欧美成人免费全部观看天天性色| 青娱乐国产在线| 亚洲日韩成人| 国产精品久久久久999| 一区二区三区亚洲视频| 成人三级在线视频| 秋霞久久久久久一区二区| 777电影在线观看| 亚洲激情网站免费观看| 人妻有码中文字幕| 婷婷激情成人| 亚洲精品www久久久久久广东| 亚洲理论片在线观看| 亚洲精品网址| 97超碰蝌蚪网人人做人人爽| 在线观看国产精品入口男同| 丰满岳乱妇一区二区三区| 欧美亚洲爱爱另类综合| 91蜜桃在线视频| 色综合一个色综合亚洲| 亚洲一二三av| 视频国产一区| 欧美激情啊啊啊| 久久精品视频2| 国产成人无遮挡在线视频| 欧美人xxxxx| 午夜影院免费在线| 在线视频观看一区| 黄色国产在线视频| 国产精品国产三级国产在线观看| 欧美一级片一区| www.黄色国产| 国产精品三级av在线播放| 国产免费黄色av| 中文字幕一区二区三区中文字幕 | 手机av在线网站| 国产精品午夜一区二区三区| 久久久最新网址| 国产一区二区在线视频观看| 国产亚洲成年网址在线观看| 91九色丨porny丨国产jk| 亚洲精品大全| 亚洲视频精品在线| 97人人澡人人爽人人模亚洲| 国产福利91精品一区二区三区| 日韩一二三区不卡在线视频| 亚洲人体视频| 亚洲第一区在线观看| 欧美国产日韩在线观看成人| 麻豆91在线观看| 欧美一区2区三区4区公司二百| wwww在线观看免费视频| 日韩一区二区中文字幕| 肉色超薄丝袜脚交69xx图片| 日本vs亚洲vs韩国一区三区二区 | 欧美一区2区| 日本中文字幕成人| 香蕉视频成人在线| 亚洲成av人在线观看| 亚洲熟女乱综合一区二区| 久久综合成人| 国产美女久久精品| yourporn在线观看视频| 久久久久国产免费免费| 经典三级在线一区| 久久三级视频| 欧美在线综合| 欧美videos中文字幕| 妖精视频在线观看免费| 丝袜美腿一区二区三区| 就去色蜜桃综合| 国产伦子伦对白在线播放观看| 精品国产三级a在线观看| 久久午夜无码鲁丝片| 国产成人8x视频一区二区| 亚洲色图都市激情| 亚洲精品不卡在线观看| 欧美日韩第一页| 亚洲国产精品久久久久久久| 亚洲一区在线观看视频| 亚洲少妇一区二区三区| 亚洲五月婷婷| 久久精品国产理论片免费| 亚洲欧洲美洲av| 一区二区三区高清国产| 在线免费观看日韩视频| 亚洲男人电影天堂| 欧美一级大片免费看| 在线日韩电影| 日本视频一区在线观看| 日韩国产91| 九九热精品视频| 五月婷婷丁香花| 91福利资源站| 久久久久久久久久网站| 北岛玲一区二区三区四区| 午夜肉伦伦影院| 秋霞欧美视频| 成人免费视频网站| 涩涩视频在线免费看| 中文字幕av日韩| 精品久久久无码中文字幕| 婷婷开心激情综合| 在线看片中文字幕| 国产精品一区二区视频| a√天堂在线观看| 久久综合av| 国内精品二区| 日韩深夜福利网站| 久久免费国产视频| a天堂中文在线| 日韩免费视频线观看| 欧美a视频在线观看| 亚洲视频免费在线| 亚洲最大的黄色网| 激情欧美一区二区| 免费看日本毛片| 欧美电影《睫毛膏》| 国产原创精品| 国产成人午夜性a一级毛片| 欧美激情国产精品| 国产youjizz在线| 精品999久久久| 一区二区三区午夜| 福利一区福利二区微拍刺激| 日韩欧美综合视频| 久久综合精品国产一区二区三区| 午夜福利123| 日韩精品一级二级| 国产真人做爰毛片视频直播| 欧美freesextv| 精品视频一区二区三区四区| 精品成人18| 国产精品欧美激情| 国产乱码午夜在线视频| 九九热最新视频//这里只有精品| 麻豆app在线观看| 精品国产区一区| 国产精品久久久久久免费免熟| 在线观看日韩av先锋影音电影院| 国产一级视频在线| 中文字幕制服丝袜一区二区三区| 中文字幕一区二区三区人妻电影| 国产成人精品一区二区三区四区| 色91精品久久久久久久久| 久久高清一区| 337p粉嫩大胆噜噜噜鲁| 伊人成年综合电影网| 91九色国产ts另类人妖| 欧美亚洲国产精品久久| 日本成人三级电影网站| 色综合www| 国产一区二区三区无遮挡| 日韩在线成人| 91精品久久久久久久久中文字幕| 久久久人成影片一区二区三区在哪下载 | 国产成人黄色片| 欧美日韩一卡| 亚洲区成人777777精品| 1024精品久久久久久久久| 亚洲精品一区二区三区四区五区 | 亚洲精品成a人在线观看| 国产成人三级一区二区在线观看一| 欧美日韩在线精品一区二区三区激情| 免费污污视频在线观看| 色综合天天综合| 亚洲大片免费观看| 色婷婷综合久久久中文字幕| 无码人妻久久一区二区三区 | 成人久久久久久久久| 国产亚洲午夜| 欧美亚洲一二三区| 亚洲综合二区| 免费大片在线观看| 热久久免费视频| 校园春色 亚洲色图| 免费人成黄页网站在线一区二区| 免费看污污网站| 麻豆精品国产91久久久久久| 亚洲国产成人va在线观看麻豆| 麻豆精品一二三| 中文字幕色网站| 国产凹凸在线观看一区二区| 亚洲少妇一区二区三区| 99国产欧美另类久久久精品| wwwwxxxx国产| 中文字幕一区二区视频| 黄色一级视频免费| 国内综合精品午夜久久资源| 国产精品久久久久久久av大片| 成人免费福利| 91视频免费网站| av在线亚洲色图| 精品久久久久久乱码天堂| 亚洲尤物av| 日韩三级在线播放| 欧美精品麻豆| 久久久噜噜噜www成人网| 欧美a级一区二区| 无套内谢丰满少妇中文字幕 | 欧美三区美女| 六月丁香激情网| 麻豆成人免费电影| 高清中文字幕mv的电影| 国产日韩一级二级三级| 极品久久久久久| 黑人巨大精品欧美一区二区免费 | 日韩欧美成人一区二区| 手机福利在线| 裸体女人亚洲精品一区| 国产激情在线播放| 国产精品国产三级国产专播精品人 | 第一社区sis001原创亚洲| 国产激情在线看| 老司机亚洲精品| 亚洲最大视频网| 欧美国产一区在线| 国产在线一区视频| 欧美日韩三级一区| 五月天丁香视频| 欧美不卡视频一区发布| 日韩电影大全网站| 91视频网页| 成人中文在线| 国产深夜男女无套内射| 国内精品伊人久久久久av影院| 亚洲国产精品自拍视频| 《视频一区视频二区| 精品人妻一区二区三区免费看| 欧美一级在线免费| 国产区高清在线| 97精品一区二区三区| 国产一区二区av在线| 午夜精品区一区二区三| 夜夜精品视频| 国产裸体视频网站| 国产精品久久三| 日韩电影在线观看一区二区| 精品国免费一区二区三区| 国产剧情在线| 国产精品视频xxxx| 中文字幕av一区二区三区人| 欧美乱大交xxxxx潮喷l头像| 国产福利一区二区三区在线视频| 国精产品久拍自产在线网站| 一本久久精品一区二区| 日韩在线免费看| 国内免费精品永久在线视频| 天堂va在线高清一区| 亚洲综合五月天| 日本va欧美va精品| 性欧美一区二区| 色综合色综合色综合| 亚洲欧洲精品视频| 性色av一区二区咪爱| 8x国产一区二区三区精品推荐| 亚洲日本欧美在线| 免费成人美女在线观看.| 中文字幕黄色网址| 欧美亚洲一区二区三区四区| 国产片在线观看| 国产精品成人观看视频国产奇米| 久久不见久久见国语| av免费中文字幕| 国产视频不卡一区| 波多野结衣黄色网址| 国产一区二区三区日韩欧美| 草民电影神马电影一区二区| 午夜视频久久久| 另类小说欧美激情| 国产探花在线视频| 337p亚洲精品色噜噜噜| 宅男在线观看免费高清网站| 不卡一卡2卡3卡4卡精品在| 欧美片第1页综合| 亚洲一区二区三区四区av| 无吗不卡中文字幕| 四虎精品一区二区三区| 欧美在线观看视频| 欧美日韩中文一区二区| xxxx一级片| 亚洲色图在线看| 亚洲女人18毛片水真多| 国产91精品久久久久久| 精品国产1区| 亚洲精品成人在线播放| 亚洲一卡二卡三卡四卡| 天天干视频在线| 情事1991在线| 影音先锋在线播放| 91沈先生播放一区二区| 最新国产乱人伦偷精品免费网站| 日韩精品卡通动漫网站| 欧美性猛交xxxxxxxx| av在线免费网站| 国产一区二区三区无遮挡| 日韩一区欧美二区| 日本妇女毛茸茸| 精品无人区太爽高潮在线播放 | 欧美福利在线| 捆绑凌虐一区二区三区| 在线观看成人小视频| a篇片在线观看网站| 九九九热999| 精品在线免费视频| 日本一级一片免费视频| 在线日韩中文字幕| 福利片一区二区| 自拍偷拍 国产| 综合久久久久久| 日本中文字幕一区二区有码在线 | 欧美在线一级| www.黄色网址.com|