精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

秒殺同行!Kimi開源全新音頻基礎模型,橫掃十多項基準測試,總體性能第一

人工智能 新聞
Kimi-Audio 總體性能排名第一,幾乎沒有明顯短板。

kimi 又發布了新的開源項目 —— 一個全新的通用音頻基礎模型 Kimi-Audio,支持語音識別、音頻理解、音頻轉文本、語音對話等多種任務,在十多個音頻基準測試中實現了最先進的 (SOTA) 性能。

結果顯示,Kimi-Audio 總體性能排名第一,幾乎沒有明顯短板。

例如在 LibriSpeech ASR 測試上,Kimi-Audio 的 WER 僅 1.28%,顯著優于其他模型。VocalSound 測試上,Kimi 達 94.85%,接近滿分 。MMAU 任務中,Kimi-Audio 摘得兩項最高分;VoiceBench 設計評測對話助手的語音理解能力,Kimi-Audio 在所有子任務中得分最高,包括一項滿分。

研發人員開發了評估工具包,可在多個基準任務上對音頻 LLM 進行公平、全面評估 ,五款音頻模型(Kimi-Audio、Qwen2-Audio、Baichuan-Audio、StepAudio、Qwen2.5-Omni)在各類音頻基準測試中的表現對比。紫線(Kimi-Audio)基本覆蓋最外層,表明其綜合表現最佳。 

目前,模型代碼、模型檢查點以及評估工具包已經在 Github 上開源。

項目鏈接:https://github.com/MoonshotAI/Kimi-Audio

新穎的架構設計

為實現 SOTA 級別的通用音頻建模, Kimi-Audio 采用了集成式架構設計,包括三個核心組件 —— 音頻分詞器(Audio Tokenizer)、音頻大模型(Audio LLM)、音頻去分詞器(Audio Detokenizer)。

這一架構使 Kimi-Audio 能夠在單一模型框架下,流暢地處理從語音識別、理解到語音對話等多種音頻語言任務。

Kimi-Audio 由三個主要組件組成:音頻分詞器(Audio Tokenizer)、音頻大模型(Audio LLM)、音頻去分詞器(Audio Detokenizer)。

具體而言,音頻分詞器(Audio Tokenizer)負責將輸入音頻轉化為通過矢量量化(vector quantization)得到的離散語義 token,幀率為 12.5Hz。同時,音頻分詞器還提取連續的聲學向量,以增強感知能力。

這種結合方式使模型既具有語義上的壓縮表示,又保留了豐富的聲學細節,從而為多種音頻任務提供了堅實的表示基礎。

音頻大模型(Audio LLM)是系統的核心,負責生成語義 token 以及文本 token,以提升生成能力。其架構基于共享 Transformer 層,能夠處理多模態輸入,并在后期分支為專門用于文本和音頻生成的兩個并行輸出頭。

音頻去分詞器(Audio Detokenizer)使用流匹配(flow matching)方法,將音頻大模型預測出的離散語義 token 轉化為連貫的音頻波形,生成高質量、具有表現力的語音。

數據建構與訓練方法

除了新穎的模型架構,構建 SOTA 模型的核心工作還包括數據建構和訓練方法。

為實現 SOTA 級別的通用音頻建模,Kimi-Audio 在預訓練階段使用了約 1300 萬小時覆蓋多語言、音樂、環境聲等多種場景的音頻數據,并搭建了一條自動處理 “流水線” 生成高質量長音頻 - 文本對。

預訓練后,模型進行了監督微調(SFT),數據涵蓋音頻理解、語音對話和音頻轉文本聊天三大類任務,進一步提升了指令跟隨和音頻生成能力。

image.png

Kimi-Audio 預訓練數據處理流程的直觀展示。簡單來說,就是把原始音頻一步步凈化、切分、整理,變成干凈、有結構、有標注的訓練數據。

在訓練方法上,為實現強大的音頻理解與生成能力,同時保持模型的知識容量與智能水平,研發人員以預訓練語言模型為初始化,設計了三個類別的預訓練任務:

僅文本和僅音頻預訓練,用于分別學習兩個模態的知識;音頻到文本的映射,促進模態轉換能力;音頻文本交錯訓練,進一步彌合模態間的鴻溝。

在監督微調階段,他們設計了一套訓練配方,以提升訓練效率與任務泛化能力。

考慮到下游任務的多樣性,研究者沒有設置特殊的任務切換操作,而是為每個任務使用自然語言作為指令;對于指令,他們構建了音頻和文本版本(即音頻由 Kimi-TTS 在零樣本方式下基于文本生成),并在訓練期間隨機選擇一種;為了增強遵循指令能力的魯棒性,他們使用大語言模型為 ASR 任務構建了 200 條指令,為其他任務構建了 30 條指令,并為每個訓練樣本隨機選擇一條。他們構建了大約 30 萬小時的數據用于監督式微調。

如表 1 和表 2 所示,他們基于全面的消融實驗,在每個數據源上對 Kimi-Audio 進行了 2-4 個訓練周期的微調,使用 AdamW 優化器,學習率從 1e?? 到 1e?? 進行余弦衰減,使用 10% 的 token 進行學習率預熱。

image.png

image.png

此外,他們還分三個階段訓練音頻解碼器。首先,使用預訓練數據中的大約 100 萬小時的音頻,對流匹配模型和聲碼器進行預訓練,以學習具有多樣化音色、語調和質量的音頻。其次,采用分塊微調策略,在相同的預訓練數據上將動態塊大小調整為 0.5 秒到 3 秒 。最后,在 Kimi-Audio 說話者提供的高質量單聲道錄音數據上進行微調。

評估結果

研究者基于評估工具包,詳細評估了 Kimi-Audio 在一系列音頻處理任務中的表現,包括自動語音識別(ASR)、音頻理解、音頻轉文本聊天和語音對話。他們使用已建立的基準測試和內部測試集,將 Kimi-Audio 與其他音頻基礎模型(Qwen2-Audio 、Baichuan-Audio、Step-Audio、GLM4-Voice 和 Qwen2.5-Omini )進行了比較。

自動語音識別

研究者對 Kimi-Audio 的自動語音識別(ASR)能力進行了評估,涵蓋了多種語言和聲學條件的多樣化數據集。如表 4 所示,Kimi-Audio 在這些數據集上持續展現出比以往模型更優越的性能。他們報告了這些數據集上的詞錯誤率(WER),其中較低的值表示更好的性能。

image.png

值得注意的是,Kimi-Audio 在廣泛使用的 LibriSpeech 基準測試中取得了最佳結果,在 test-clean 上達到了 1.28 的錯誤率,在 test-other 上達到了 2.42,顯著超越了像 Qwen2-Audio-base 和 Qwen2.5-Omni 這樣的模型。在普通話 ASR 基準測試中,Kimi-Audio 在 AISHELL-1(0.60)和 AISHELL-2 ios(2.56)上創下了最先進的結果。此外,它在具有挑戰性的 WenetSpeech 數據集上表現出色,在 test-meeting 和 test-net 上均取得了最低的錯誤率。最后,研究者在內部的 Kimi-ASR 測試集上的評估確認了該模型的魯棒性。這些結果表明,Kimi-Audio 在不同領域和語言中均具有強大的 ASR 能力。

音頻理解

除了語音識別外,研究者還評估了 Kimi-Audio 理解包括音樂、聲音事件和語音在內的各種音頻信號的能力。表 5 總結了在各種音頻理解基準測試上的性能,通常較高的分數表示更好的性能。

image.png

在 MMAU 基準測試中,Kimi-Audio 在聲音類別(73.27)和語音類別(60.66)上展現出卓越的理解能力。同樣,在 MELD 語音情感理解任務上,它也以 59.13 的得分超越了其他模型。Kimi-Audio 在涉及非語音聲音分類(VocalSound 和 Nonspeech7k )以及聲學場景分類(TUT2017 和 CochlScene)的任務中也處于領先地位。這些結果突顯了 Kimi-Audio 在解讀復雜聲學信息方面的高級能力,超越了簡單的語音識別范疇。

音頻到文本聊天

研究者使用 OpenAudioBench 和 VoiceBench 基準測試 評估了 Kimi-Audio 基于音頻輸入進行文本對話的能力。這些基準測試評估了諸如指令遵循、問答和推理等各個方面。性能指標因基準測試而異,較高的分數表示更好的對話能力。結果如表 6 所示。

image.png

在 OpenAudioBench 上,Kimi-Audio 在多個子任務上實現了最先進的性能,包括 AlpacaEval、Llama Questions 和 TriviaQA,并在 Reasoning QA 和 Web Questions 上取得了極具競爭力的性能。VoiceBench 評估進一步證實了 Kimi-Audio 的優勢。它在 AlpacaEval(4.46)、CommonEval(3.97)、SD-QA(63.12)、MMSU(62.17)、OpenBookQA(83.52)、Advbench(100.00)和 IFEval(61.10)上均持續超越所有對比模型。Kimi-Audio 在這些全面的基準測試中的整體表現證明了其在基于音頻的對話和復雜推理任務中的卓越能力。

語音對話

最后,他們基于多維度的主觀評估,評估了 Kimi-Audio 的端到端語音對話能力。如表 7 所示,Kimi-Audio 與 GPT-4o 和 GLM-4-Voice 等模型在人類評分(1-5 分量表,分數越高越好)的基礎上進行了比較。

image.png

除去 GPT-4o,Kimi-Audio 在情感控制、同理心和速度控制方面均取得了最高分。盡管 GLM-4-Voice 在口音控制方面表現略佳,但 Kimi-Audio 的整體平均得分仍高達 3.90,超過了 Step-Audio-chat(3.33)、GPT-4o-mini(3.45)和 GLM-4-Voice(3.65),并與 GPT-4o(4.06)僅存在微小差距。總體而言,評估結果表明,Kimi-Audio 在生成富有表現力和可控性的語音方面表現出色。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2010-03-12 18:16:07

Python編程語言

2024-04-08 13:29:52

2010-10-18 09:56:33

服務器基準測試SDSPEC

2023-07-31 09:13:13

ValidatorGolang

2025-06-10 09:10:00

2025-01-06 06:10:00

開源.NEThttps://mp

2016-09-23 16:36:25

LinuxPCPhoronix

2009-12-10 09:24:06

SunX64AMD

2024-03-06 18:09:06

Linux性能工具

2022-12-06 14:11:32

開源模型

2023-06-06 07:03:02

2025-04-28 14:10:22

2021-07-17 15:25:05

PHP 8.1基準測試開發

2024-04-11 08:22:32

AgentQuest語言模型

2023-09-13 14:45:14

性能測試開發

2021-09-09 12:28:50

Sentry Web性能監控

2024-03-28 14:26:51

人工智能

2025-04-29 08:14:14

2023-09-28 08:01:06

MySQL事務失效
點贊
收藏

51CTO技術棧公眾號

国产精品美女免费视频| 91天天综合| 免费福利视频一区| 国产亚洲综合色| 午夜精品三级视频福利| 天堂av2020| 91在线看视频| 秋霞一区二区三区| 国产精品成人在线观看| 热99精品里视频精品| 亚洲美女精品视频| 91精品久久| 日韩欧美中文| 欧美亚洲动漫精品| 日韩美女一区| 波多野结衣电车痴汉| 性欧美lx╳lx╳| 狠狠躁夜夜躁人人爽超碰91| 精品国产一区二区三| 国产精品99精品| 大奶一区二区三区| 婷婷成人激情在线网| 国产精品日韩一区二区 | 无码人妻丰满熟妇精品区| 五月亚洲婷婷| 欧美日韩免费不卡视频一区二区三区 | 免费看一级大黄情大片| 狠狠躁夜夜躁av无码中文幕| 欧美精品三级| 精品国产伦一区二区三区观看方式 | 国产日韩欧美中文在线播放| 中文字幕精品亚洲| 成人免费91| 一区二区高清视频在线观看| 国产精品一区二区三区精品| 中文字幕视频一区二区| 97色伦图片97综合影院| 国产99亚洲| 日韩成人一级大片| 在线观看日韩www视频免费| 男人搞女人网站| 91在线看片| 国产一区二区三区四| 欧美成人激情在线| 国产+高潮+白浆+无码| 欧美18av| 亚洲欧美影音先锋| 国产伦精品一区二区三区视频黑人 | h视频在线免费| 日本一不卡视频| 久久在线观看视频| 国产白袜脚足j棉袜在线观看| 第四色日韩影片| 91麻豆国产在线观看| 国产精品人成电影| 日韩xxx视频| 欧美激情综合色综合啪啪| 日韩有码在线视频| 老司机免费视频| 精品视频在线你懂得| 欧美在线小视频| 国产91沈先生在线播放| 青青久在线视频| 国产自产v一区二区三区c| 国产精品一区二区三区久久| 国产无遮挡aaa片爽爽| 欧美日韩三区| 97精品在线观看| 在线观看日韩中文字幕| 天天综合一区| 亚洲片av在线| 久久久九九九热| 91久久国产综合久久91猫猫| 亚洲精品ww久久久久久p站| 久久综合婷婷综合| 成人h动漫精品一区二区无码 | 亚洲视频免费看| 精品一区二区三区自拍图片区| 色噜噜在线播放| 狠狠色丁香婷婷综合久久片| 日韩美女福利视频| 久久精品美女视频| 99国产精品视频免费观看一公开 | 亚洲国产一区二区三区在线| 风流老熟女一区二区三区| 成人毛片在线观看| 91日韩在线播放| wwwwww在线观看| 激情文学综合插| 成人av免费在线看| 国产一区二区三区黄片| 日韩中文字幕麻豆| 成人午夜激情网| 久久这里只有精品9| 国产精品99久久久久| 国产精品自拍偷拍视频| 亚洲av综合色区无码一二三区| 蜜乳av一区二区三区| 日本伊人精品一区二区三区介绍| 男操女视频网站| 国产成人综合亚洲91猫咪| 久久亚洲综合网| 成人直播在线| 国产精品久久久久久久久动漫| 麻豆映画在线观看| 国产成人l区| 欧美性xxxxxxxxx| 大j8黑人w巨大888a片| 日韩一区精品| 欧美系列亚洲系列| 国产人妖在线观看| 91午夜精品| 精品成人a区在线观看| 精品人妻无码一区二区三区换脸| 欧美影院天天5g天天爽| 日韩在线视频中文字幕| 久久国产高清视频| 欧美激情电影| 136fldh精品导航福利| 国产精品久久久久久久久久久久久久久久久| 日韩高清在线不卡| 久久精品二区| 国产一二三在线观看| 国产女人aaa级久久久级| 日韩精品久久一区| av男人的天堂在线观看| 欧美日韩免费区域视频在线观看| 天天干天天色天天干| 亚洲婷婷丁香| 国产性猛交xxxx免费看久久| 五月天婷婷丁香网| 国产精品一二| 国产精品亚洲аv天堂网| 亚洲 欧美 自拍偷拍| 国产片一区二区三区| 黄色一级片在线看| 自拍偷拍欧美视频| 精品成人佐山爱一区二区| 午夜少妇久久久久久久久| 亚洲国产日本| 欧美在线视频一二三| 亚洲黄色在线播放| 樱桃国产成人精品视频| 在线视频观看一区二区| 97视频精品| 91精品在线观| 精品51国产黑色丝袜高跟鞋| 亚洲一区二区偷拍精品| 国产极品美女高潮无套久久久| 久久av影院| 精品国产亚洲一区二区三区在线观看 | 亚洲国产一区二区三区网站| 亚洲精品电影网| 亚洲黄色网址大全| 日韩av网站免费在线| 日本在线观看一区二区| 亚洲精品粉嫩美女一区| 日韩无一区二区| 欧美图片第一页| 欧美福利视频| 国产精品激情av电影在线观看| 国产chinasex对白videos麻豆| 99国产一区二区三精品乱码| 亚洲欧洲久久| 婷婷久久免费视频| 亚洲免费视频观看| 久草国产在线视频| 喷白浆一区二区| 在线观看精品视频| 成人性生交大片免费观看网站| 日韩精品在线影院| 免费在线视频观看| 不卡一区二区在线| 国产一二三四区在线观看| 亚洲性视频在线| 91av视频在线播放| 超碰国产在线观看| 欧美一区中文字幕| 在线观看亚洲大片短视频| 国产乱码精品| 亚洲一区二区四区| 欧美日韩123区| 最新国产成人av网站网址麻豆| 国产又粗又黄又爽的视频| 亚洲一区中文日韩| 国产手机在线观看| 国产一区二区三区观看| 国产精品12345| 日本欧美国产| 日韩av三级在线观看| 青青影院在线观看| 欧美色网一区二区| 精品无码在线观看| 蜜桃av综合| 久久福利电影| yiren22亚洲综合| 久久久久国产视频| 亚洲av无码乱码在线观看性色| 性做久久久久久免费观看| 亚洲精品一二三四| 欧美成人高清| 欧美一区二区在线| 欧美亚洲大片| 欧美激情中文字幕在线| 爱爱爱免费视频在线观看| 精品国产乱码久久| 国产一区二区波多野结衣| 欧美视频13p| 久久久久久久久久综合| 国产精品亚洲成人| 乱熟女高潮一区二区在线| 久久久久亚洲精品中文字幕| 欧美成人免费大片| 成黄免费在线| 日韩精品中文字幕久久臀| 国产人妖在线播放| 尤物av一区二区| 免费一级特黄3大片视频| www.亚洲在线| 国产最新免费视频| 国产尤物久久久| 国产一区二区精品免费| 三妻四妾的电影电视剧在线观看| 日韩精品www| av手机天堂网| 欧美日韩精品在线| 国产精品99精品无码视| 亚洲激情图片小说视频| 少妇高潮在线观看| 久久精品欧美日韩| 国产精品无码午夜福利| 日本在线观看不卡视频| 国产成人精品视频免费看| 伊人影院久久| 日韩精品最新在线观看| 全国精品免费看| 国产在线精品一区| 国产劲爆久久| 国产乱码精品一区二区三区卡| 日韩中文字幕无砖| 51国偷自产一区二区三区的来源 | 日韩av片专区| 欧美日韩成人| 欧美精品一区二区性色a+v| 国产厕拍一区| 国产福利一区二区三区在线观看| 在线亚洲人成| 热99在线视频| 蜜桃视频成人m3u8| 国产精品美女在线观看| 国产91欧美| 91免费观看网站| 日本一区二区三区播放| 成人毛片网站| 日韩av中文字幕一区| 蜜桃传媒视频第一区入口在线看| 亚洲精品进入| 神马影院我不卡| 国产香蕉精品| 久久综合九九| 精品日韩毛片| 国产在线精品一区| 自拍视频一区| 亚洲日本一区二区三区在线不卡 | www国产成人免费观看视频 深夜成人网| 性农村xxxxx小树林| 99视频在线观看一区三区| 成人网站免费观看| 国产精品自拍av| 亚洲av无码一区东京热久久| av在线不卡免费看| 人妻aⅴ无码一区二区三区| 中文字幕在线不卡| 九九热精品免费视频| 黄色91在线观看| 高潮无码精品色欲av午夜福利| 欧美日韩mp4| 亚洲男人第一天堂| 亚洲人成电影网站色| 黄色av电影在线观看| 国模吧一区二区| 超碰porn在线| 91国产精品视频在线| 成人av色网站| 国产精品成人一区二区三区 | 国产黄人亚洲片| 国产精品第七页| 国产精品一区三区| 自拍视频一区二区| 国产精品乱人伦一区二区| 国产在线观看无码免费视频| 国产喷白浆一区二区三区| 免费无码毛片一区二区app| 一本到三区不卡视频| 少妇一级淫片免费放中国| 亚洲一区在线观看视频| 欧美精品韩国精品| 日韩欧美极品在线观看| 一级黄色录像大片| 日韩av在线一区二区| 精品美女在线观看视频在线观看 | 久久久综合九色合综国产精品| 久久国产劲爆∧v内射| 国产亚洲欧美日韩日本| a级片在线观看免费| 欧洲精品在线观看| 日本韩国免费观看| 亚洲高清在线观看| 国产综合在线播放| 中文字幕欧美专区| 日本电影在线观看网站| 欧美一区二区色| 午夜精品成人av| 国产chinese精品一区二区| 成人久久久久| 国产日韩一区二区在线| 国产福利不卡视频| 秋霞欧美一区二区三区视频免费| 一本色道久久综合亚洲精品按摩| 性一交一乱一透一a级| 日韩中文字幕国产精品| 日韩电影免费观看高清完整版| 国产高清精品一区二区| 亚洲成人日韩| 国产九色porny| 亚洲免费影院| 黄色片视频在线| 国产精品亚洲视频| 三级黄色录像视频| 欧美性一区二区| 精品视频一二三| 日韩免费视频在线观看| 日韩欧美美女在线观看| 成人性免费视频| 成人激情文学综合网| 精品无码久久久久| 精品国产一区二区三区久久影院| 大地资源网3页在线观看| 成人免费午夜电影| 91精品高清| 美女流白浆视频| 亚洲一区二区欧美| 风流老熟女一区二区三区| 久久乐国产精品| 老司机aⅴ在线精品导航| 水蜜桃色314在线观看| 蜜臀va亚洲va欧美va天堂| 亚洲精品国产91| 欧美午夜精品电影| 在线观看麻豆| 91老司机在线| 欧美视频久久| xxxwww国产| 欧美性感美女h网站在线观看免费| 五月婷婷在线观看视频| 日本一区二区在线免费播放| 精品久久网站| 欧美一级小视频| 亚洲黄色片在线观看| 高h放荡受浪受bl| 欧美在线视频免费| 欧美日韩伦理| 中文字幕在线视频一区二区三区| 亚洲精品免费在线观看| 久久久久久少妇| 亚洲无线码在线一区观看| 欧美日韩五码| 超碰97免费观看| 日精品一区二区| 日本猛少妇色xxxxx免费网站| 欧美情侣在线播放| 欧美v亚洲v| 91亚洲va在线va天堂va国 | 国产一级成人av| 欧美 日韩精品| 成人福利视频在线看| 国产微拍精品一区| 中文字幕欧美亚洲| 超碰97久久| 国产自偷自偷免费一区 | 91精品国产免费久久综合| 黑人另类精品××××性爽| 美日韩免费视频| 久久电影网站中文字幕| 国产亚洲精品熟女国产成人| 欧美精品v国产精品v日韩精品| 国产在线视频资源| 91久久在线观看| 99精品国产99久久久久久福利| 男女做爰猛烈刺激| 日韩一二三区不卡| 欧美极度另类| av动漫在线播放| 国产网站一区二区| 亚洲精品一区二区口爆| 国产精品女主播| 亚洲黄色天堂| 国产成人综合在线视频| 91精品国产综合久久精品图片| 国产极品在线观看|