精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

首個(gè)全面梳理語(yǔ)音大模型發(fā)展脈絡(luò)的權(quán)威綜述,入選ACL 2025主會(huì)

人工智能 新聞
本論文深入剖析了 SpeechLM 的技術(shù)架構(gòu),發(fā)現(xiàn)其由三個(gè)關(guān)鍵組件構(gòu)成:語(yǔ)音分詞器、語(yǔ)言模型和聲碼器。

本文第一作者:崔文謙,香港中文大學(xué)博士生,致力于語(yǔ)音大模型,多模態(tài)大模型,AI音樂(lè)生成等方向的研究。

由香港中文大學(xué)團(tuán)隊(duì)撰寫(xiě)的語(yǔ)音語(yǔ)言模型綜述論文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主會(huì)議接收!這是該領(lǐng)域首個(gè)全面系統(tǒng)的綜述,為語(yǔ)音 AI 的未來(lái)發(fā)展指明了方向。

圖片

  • ArXiv鏈接:https://arxiv.org/abs/2410.03751
  • GitHub鏈接:https://github.com/dreamtheater123/Awesome-SpeechLM-Survey

圖片

為什么語(yǔ)音大模型是 AI 的下一個(gè)風(fēng)口?

想象一下,如果 AI 能夠像人類一樣自然地進(jìn)行語(yǔ)音對(duì)話,不再需要傳統(tǒng)的「語(yǔ)音轉(zhuǎn)文字(ASR)- 文本大模型處理(LLM)- 文字轉(zhuǎn)語(yǔ)音(TTS)」的繁瑣流程,而是直接理解和生成語(yǔ)音,那將是怎樣的體驗(yàn)?這就是語(yǔ)音大模型(語(yǔ)音語(yǔ)言模型,SpeechLM)要解決的核心問(wèn)題。

傳統(tǒng)的語(yǔ)音交互系統(tǒng)存在三大痛點(diǎn):信息丟失、延遲嚴(yán)重、錯(cuò)誤累積。當(dāng)語(yǔ)音轉(zhuǎn)換為文字時(shí),音調(diào)、語(yǔ)氣、情感等副語(yǔ)言信息完全丟失;多個(gè)模塊串聯(lián)導(dǎo)致響應(yīng)延遲明顯;每個(gè)環(huán)節(jié)的錯(cuò)誤會(huì)層層累積,最終影響整體效果。

SpeechLM 的出現(xiàn)徹底改變了這一局面。它能夠端到端地處理語(yǔ)音,既保留了語(yǔ)音中的豐富信息,又大幅降低了延遲,為真正自然的人機(jī)語(yǔ)音交互鋪平了道路。

圖片

技術(shù)架構(gòu):三大核心組件構(gòu)建語(yǔ)音智能

本論文深入剖析了 SpeechLM 的技術(shù)架構(gòu),發(fā)現(xiàn)其由三個(gè)關(guān)鍵組件構(gòu)成:語(yǔ)音分詞器、語(yǔ)言模型和聲碼器。

圖片

  • 語(yǔ)音分詞器(Speech Tokenizer)負(fù)責(zé)將連續(xù)的音頻信號(hào)轉(zhuǎn)換為離散或連續(xù)的 token 表示。根據(jù)建模目標(biāo)的不同,可以分為語(yǔ)義理解型、聲學(xué)生成型和混合型三類。語(yǔ)義理解型專注于提取語(yǔ)音的語(yǔ)義內(nèi)容,聲學(xué)生成型則重點(diǎn)保留音頻的聲學(xué)特征,而混合型試圖兼顧兩者的優(yōu)勢(shì)。
  • 語(yǔ)言模型(Language Model)是整個(gè)系統(tǒng)的核心,主要采用基于 Transformer 的自回歸架構(gòu)。通過(guò)擴(kuò)展詞匯表實(shí)現(xiàn)同時(shí)處理文本和語(yǔ)音 token,實(shí)現(xiàn)真正的多模態(tài)建模能力。
  • 聲碼器(Token-to-wav Synthesizer,Vocoder)則將語(yǔ)言模型生成的 token 轉(zhuǎn)換回可聽(tīng)的音頻波形,完成從抽象表示到具體語(yǔ)音的最后一步轉(zhuǎn)換。

訓(xùn)練策略:從預(yù)訓(xùn)練到指令微調(diào)的完整流程

訓(xùn)練一個(gè)高質(zhì)量的 SpeechLM 需要精心設(shè)計(jì)的訓(xùn)練策略。我們的綜述詳細(xì)梳理了當(dāng)前主流的訓(xùn)練方法,包括三個(gè)關(guān)鍵階段。

預(yù)訓(xùn)練階段是基礎(chǔ),可以選擇冷啟動(dòng)或繼續(xù)預(yù)訓(xùn)練兩種方式。冷啟動(dòng)從零開(kāi)始訓(xùn)練,而繼續(xù)預(yù)訓(xùn)練則基于已有的文本語(yǔ)言模型進(jìn)行適配,后者通常能獲得更好的效果。關(guān)鍵在于如何有效對(duì)齊文本和語(yǔ)音的表示空間,使模型能夠充分利用兩種模態(tài)的共同信息與互補(bǔ)信息。

指令微調(diào)階段讓模型學(xué)會(huì)遵循各種指令執(zhí)行不同任務(wù)。研究者們通過(guò)構(gòu)建大規(guī)模的指令跟隨數(shù)據(jù)集,讓 SpeechLM 具備了處理多樣化語(yǔ)音任務(wù)的能力。

后對(duì)齊階段則通過(guò)人類反饋強(qiáng)化學(xué)習(xí)等技術(shù),進(jìn)一步優(yōu)化模型的輸出質(zhì)量和安全性,確保生成的語(yǔ)音既自然又符合人類偏好。

交互范式:實(shí)現(xiàn)真正自然的語(yǔ)音對(duì)話

語(yǔ)音交互的未來(lái)不僅在于理解和生成,更在于如何實(shí)現(xiàn)真正自然的對(duì)話體驗(yàn)。傳統(tǒng)的語(yǔ)音交互采用「你說(shuō)完我再說(shuō)」的模式,但真實(shí)對(duì)話中人們經(jīng)常會(huì)打斷對(duì)方或同時(shí)說(shuō)話。為了讓 AI 具備這種自然對(duì)話能力,研究者們正在開(kāi)發(fā)具有實(shí)時(shí)交互能力的 SpeechLM。

關(guān)鍵突破在于全雙工建模技術(shù),它包括兩個(gè)核心特性:用戶中斷能力,即模型可以被用戶打斷并適當(dāng)響應(yīng);同時(shí)響應(yīng)能力,即模型能夠在處理輸入的同時(shí)生成輸出。通過(guò)流式處理和全雙工架構(gòu),SpeechLM 能夠支持真正的雙向同時(shí)通信,讓人機(jī)交互變得更加自然流暢。

應(yīng)用場(chǎng)景:重新定義人機(jī)交互的邊界

SpeechLM 的應(yīng)用潛力遠(yuǎn)超我們的想象。在語(yǔ)義相關(guān)應(yīng)用方面,它能夠進(jìn)行自然的語(yǔ)音對(duì)話、語(yǔ)音翻譯、自動(dòng)語(yǔ)音識(shí)別、關(guān)鍵詞檢測(cè)等任務(wù)。更重要的是,這些任務(wù)都可以在統(tǒng)一的框架下完成,無(wú)需針對(duì)每個(gè)任務(wù)訓(xùn)練專門的模型。

在說(shuō)話人相關(guān)應(yīng)用中,SpeechLM 展現(xiàn)出了強(qiáng)大的說(shuō)話人識(shí)別、驗(yàn)證和分離能力,甚至可以根據(jù)指令生成特定音色的語(yǔ)音。這為個(gè)性化語(yǔ)音助手和多人對(duì)話系統(tǒng)開(kāi)辟了新的可能性。

最令人興奮的是副語(yǔ)言學(xué)應(yīng)用,SpeechLM 能夠理解和生成帶有特定情感、語(yǔ)調(diào)和風(fēng)格的語(yǔ)音。它不僅能識(shí)別說(shuō)話者的情緒狀態(tài),還能根據(jù)指令生成相應(yīng)情感色彩的語(yǔ)音回應(yīng),讓人機(jī)交互變得更加生動(dòng)自然。

評(píng)估體系:多維度衡量模型性能

如何科學(xué)評(píng)估 SpeechLM 的性能是一個(gè)重要課題。我們的論文系統(tǒng)梳理了當(dāng)前的評(píng)估方法,包括自動(dòng)評(píng)估和人工評(píng)估兩大類。

自動(dòng)評(píng)估涵蓋了表示質(zhì)量、語(yǔ)言學(xué)能力、副語(yǔ)言學(xué)特征、生成質(zhì)量和多樣性、實(shí)時(shí)交互能力以及下游任務(wù)性能等多個(gè)維度。每個(gè)維度都有相應(yīng)的指標(biāo)和基準(zhǔn)測(cè)試,為模型比較提供了客觀標(biāo)準(zhǔn)。

人工評(píng)估則主要通過(guò)平均意見(jiàn)分?jǐn)?shù)(MOS)等主觀指標(biāo),從人類感知的角度評(píng)估語(yǔ)音的自然度、韻律質(zhì)量和音色相似度等特征。

圖片

挑戰(zhàn)與未來(lái):通往通用語(yǔ)音智能的道路

盡管 SpeechLM 取得了顯著進(jìn)展,但仍面臨諸多挑戰(zhàn)。組件選擇的最優(yōu)化、端到端訓(xùn)練、實(shí)時(shí)語(yǔ)音生成、安全風(fēng)險(xiǎn)防控以及稀有語(yǔ)言支持等問(wèn)題都需要進(jìn)一步研究。

特別值得關(guān)注的是安全性問(wèn)題。SpeechLM 可能生成有害內(nèi)容或泄露隱私信息,如何建立有效的安全防護(hù)機(jī)制是當(dāng)務(wù)之急。同時(shí),如何讓 SpeechLM 更好地服務(wù)于資源稀缺的語(yǔ)言和方言,也是推動(dòng)技術(shù)普惠的重要方向。

結(jié)語(yǔ):開(kāi)啟語(yǔ)音 AI 的新紀(jì)元

這篇即將在 ACL 2025 主會(huì)議上發(fā)表的綜述論文,不僅是對(duì) SpeechLM 領(lǐng)域的全面梳理,更是對(duì)未來(lái)發(fā)展方向的深入思考。我們相信,隨著技術(shù)的不斷進(jìn)步,SpeechLM 將徹底改變?nèi)藱C(jī)交互的方式,開(kāi)啟語(yǔ)音 AI 的新紀(jì)元。

讓我們一起期待這個(gè)激動(dòng)人心的未來(lái),在那里,AI 不僅能聽(tīng)懂我們說(shuō)什么,更能理解我們?cè)趺凑f(shuō),并以同樣自然的方式與我們對(duì)話。這不僅是技術(shù)的突破,更是人類與 AI 關(guān)系的根本性變革。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-08-06 09:10:10

2025-06-05 11:49:21

AI模型數(shù)據(jù)

2023-11-05 10:04:47

2024-12-16 07:30:00

2024-06-19 16:11:22

2023-02-28 13:09:53

訓(xùn)練模型

2024-06-03 08:30:00

2024-03-22 15:08:47

CLIP機(jī)器學(xué)習(xí)人工智能

2025-04-27 09:07:00

模型安全AI

2024-05-14 09:13:31

點(diǎn)云深度學(xué)習(xí)

2025-06-06 06:00:00

2025-04-16 02:30:00

2024-05-27 11:43:47

2016-12-23 14:43:37

2025-04-22 09:22:00

模型檢測(cè)AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩porn| 毛片视频免费播放| 麻豆福利在线观看| 成人av电影在线播放| 久久久最新网址| 黄免费在线观看| 成人在线分类| 精品国产精品自拍| 一级二级三级欧美| 亚洲乱码在线观看| 日韩精彩视频在线观看| 久久精品亚洲94久久精品| 秘密基地免费观看完整版中文| 校园春色亚洲| 亚洲欧美二区三区| 日本欧美色综合网站免费| 91欧美日韩麻豆精品| 日韩视频中文| 久久在线免费视频| 国产肥白大熟妇bbbb视频| 久久伊人精品| 欧美手机在线视频| 亚欧无线一线二线三线区别| 激情福利在线| 成人av在线看| 91免费观看网站| 激情视频网站在线观看| 欧美激情aⅴ一区二区三区| 亚洲欧洲一区二区三区久久| 日本中文字幕有码| 日韩免费在线电影| 色婷婷国产精品| 日韩网站在线免费观看| 免费在线观看av| 欧美经典一区二区三区| 国产精品视频入口| 国产高清视频免费| 激情国产一区二区| 国产精品视频久久久| 青青草免费观看视频| 黄色精品网站| 久久91亚洲精品中文字幕| 美国一级黄色录像| 久久99视频| 精品亚洲男同gayvideo网站| 丰满少妇xbxb毛片日本| 视频一区中文字幕精品| 7777精品久久久大香线蕉| 密臀av一区二区三区| 欧美办公室脚交xxxx| 一区二区在线看| 国产又粗又硬又长| 老司机99精品99| 亚洲欧洲美洲综合色网| 亚洲一区二区三区色| 国产视频网址在线| 中文字幕av一区二区三区高| 日本一区二区在线视频| 大片免费播放在线视频| 国产免费成人在线视频| 图片区小说区区亚洲五月| 四虎精品一区二区三区| 99久久精品国产导航| 精品视频一区二区| 欧美视频综合| 日本一区二区三区在线不卡| 亚洲不卡1区| 精品176二区| 亚洲乱码国产乱码精品精98午夜| 激情图片qvod| 大香伊人中文字幕精品| 午夜免费久久看| 欧美日韩在线中文| 国产一区一一区高清不卡| 在线精品国精品国产尤物884a | 亚洲女优在线| 日本国产一区二区三区| 欧美激情一区二区三区免费观看 | 五月天久久777| 久久综合久久美利坚合众国| 动漫性做爰视频| 激情欧美丁香| 国产91亚洲精品| 亚洲最大成人av| 粉嫩av亚洲一区二区图片| 韩国成人av| 成人性爱视频在线观看| 亚洲免费色视频| 欧美日韩在线中文| 国产中文欧美日韩在线| 日韩精品免费综合视频在线播放| 精品无码人妻一区二区免费蜜桃| 91高清一区| 韩国v欧美v日本v亚洲| www.com亚洲| 韩国一区二区三区| 久久国产精品-国产精品| 不卡在线视频| 亚洲午夜激情av| 久久午夜夜伦鲁鲁一区二区| 日韩一区二区三区精品视频第3页| 日韩电影大片中文字幕| 天天色天天综合| 国产精品美女久久久| 国产精品一香蕉国产线看观看 | 国产成人综合精品三级| 久久一区二区三区av| 久cao在线| 一本大道综合伊人精品热热| 中文字幕剧情在线观看| 亚洲激情77| 欧美日韩xxxxx| 18国产免费视频| 99re这里只有精品首页| 亚洲国产精品影视| 三级成人在线| 亚洲精品97久久| 国产a免费视频| 免费精品99久久国产综合精品| 国产传媒欧美日韩| 好吊日视频在线观看| 色悠悠久久综合| 亚洲午夜久久久久久久久| 久久视频精品| 国产高清视频一区三区| 免费观看黄色av| 亚洲女同女同女同女同女同69| 国产h视频在线播放| 一区二区三区四区高清视频| 日韩视频中文字幕| 少妇又紧又色又爽又刺激视频| 26uuu另类欧美| 丝袜人妻一区二区三区| 久久99成人| 久久精品中文字幕| 一本大道伊人av久久综合| 国产午夜精品久久久久久久 | 在线成人av观看| 亚洲国产精品成人av| 青青操视频在线播放| 麻豆精品久久精品色综合| 日韩高清专区| 国产精品高清乱码在线观看| 亚洲免费成人av电影| 欧美福利视频一区二区| 99视频在线观看一区三区| www.国产二区| av男人一区| 韩国三级日本三级少妇99| 成人小说亚洲一区二区三区 | 九九精品免费视频| 97国产一区二区| 免费看的黄色大片| 羞羞色国产精品网站| 911国产网站尤物在线观看| 日本wwwxxxx| 欧美日韩免费区域视频在线观看| 奇米777第四色| 国产精品久久国产愉拍| 免费毛片一区二区三区久久久| 国产精品xx| 亚洲男人第一av网站| 亚洲 欧美 中文字幕| 国产偷国产偷精品高清尤物| www亚洲成人| 99久久99视频只有精品| 成人免费在线视频网址| 羞羞视频在线观看不卡| 精品久久久三级丝袜| 日韩av在线播放观看| 91香蕉视频污| 免费看黄色一级大片| 久久要要av| 97超级碰碰| 狼人综合视频| 中文字幕精品一区久久久久| 国产日产亚洲系列最新| 亚洲一区二区三区四区在线免费观看 | 亚洲男人天堂九九视频| 日韩乱码一区二区三区| 综合久久国产九一剧情麻豆| 久久久久中文字幕亚洲精品| 香蕉久久夜色精品| 一本一本a久久| 成人香蕉社区| 国产精品久久久久77777| 黄在线免费看| 亚洲老头同性xxxxx| 亚洲午夜激情视频| 亚洲大片精品永久免费| 一色道久久88加勒比一| 国产尤物一区二区| 无码人妻丰满熟妇区96| 亚洲精品2区| 久久久精品动漫| 在线播放成人| 日本久久久久久久久| 2021国产在线| 亚洲系列中文字幕| 亚洲高清在线观看视频| 色狠狠av一区二区三区| 精品99在线观看| 国产欧美日产一区| 中文字幕无人区二| 日本一不卡视频| 欧美亚洲日本一区二区三区| 久久免费精品视频在这里| 精品国产乱码久久久久久久软件| 色综合久久久| 欧洲成人免费aa| 青春草在线免费视频| 中文字幕日韩精品在线| 五月婷婷丁香六月| 欧美一区二区三区视频免费 | 九九色在线视频| 中文字幕在线观看亚洲| 色中色在线视频| 日韩精品一区二区在线观看| 伊人网免费视频| 欧美天堂在线观看| 国产一级大片在线观看| 亚洲欧洲日韩综合一区二区| 人妻一区二区视频| 91麻豆免费看| 欧美精品欧美极品欧美激情| 国产成人精品三级| 99re6在线观看| 秋霞影院一区二区| 88av.com| 久久国产主播| 久久国产亚洲精品无码| 国产精品s色| 日本美女爱爱视频| 亚洲经典一区| 色哟哟免费网站| 欧美三级视频| 中文字幕乱码免费| 欧美在线三级| 白白操在线视频| 欧美福利一区| 国产一级黄色录像片| 天天做天天爱天天爽综合网| 亚洲精品一区二区三区樱花| 精品久久视频| 午夜精品美女久久久久av福利| 你懂的一区二区三区| 久久久久久国产精品mv| 欧美男人操女人视频| 精品久久久久久一区| 免费看久久久| 欧美日韩精品久久久免费观看| 亚洲va久久久噜噜噜久久| 精品免费国产| 国产精品嫩草影院在线看| 久久久久久久免费| 韩日一区二区三区| 亚洲国产一区二区在线| 四虎8848精品成人免费网站| 伊人av成人| 午夜国产一区| 久久视频这里有精品| 一本色道久久综合亚洲精品不卡 | 日韩av不卡在线播放| 日韩一区二区三区免费播放| 最新欧美日韩亚洲| 欧美日韩福利| 国产91在线免费| 日本怡春院一区二区| 亚洲高清视频免费| 成人av电影在线| 少妇人妻好深好紧精品无码| 国产精品白丝在线| 久久久99精品| 色国产综合视频| 97人妻人人澡人人爽人人精品| 日韩欧美一区二区久久婷婷| 日韩专区第一页| 亚洲人成网站免费播放| 老司机午夜在线视频| 97超碰蝌蚪网人人做人人爽| 91tv亚洲精品香蕉国产一区| 3d动漫精品啪啪一区二区三区免费| 成人三级毛片| 亚洲国产成人不卡| 国产精品va| 最近免费中文字幕中文高清百度| 极品少妇xxxx精品少妇偷拍| 色综合久久五月| 国产欧美精品日韩区二区麻豆天美| 91人妻一区二区三区蜜臀| 欧美日韩激情小视频| 91国内精品视频| 日韩av网站电影| 国产盗摄在线观看| 国产91|九色| 久久久久毛片免费观看| 欧美亚洲爱爱另类综合| 欧美成人首页| 尤蜜粉嫩av国产一区二区三区| 国产v综合v亚洲欧| 亚洲精品国产精品国自产网站| 一区二区在线电影| 免费黄色一级大片| 亚洲精品wwwww| av网站在线看| 国产精品久久久久久久久久久不卡| 51精品国产| 杨幂一区欧美专区| 噜噜噜躁狠狠躁狠狠精品视频| 69久久精品无码一区二区| 国产无人区一区二区三区| 国产第一页第二页| 欧美一区二区私人影院日本| 国产网站在线播放| 欧美在线激情视频| 国产精品x8x8一区二区| 潘金莲一级淫片aaaaa免费看| 三级一区在线视频先锋| 成人区人妻精品一区二| 亚洲欧美经典视频| 艳妇乳肉豪妇荡乳av| 亚洲色图av在线| 日本在线高清| 国产亚洲欧美另类一区二区三区| 影音先锋日韩精品| 成人综合久久网| 国产精品青草久久| 91丨九色丨海角社区| 亚洲国产一区二区三区在线观看| 黄色av电影在线观看| 国产免费观看久久黄| 国产欧美久久一区二区三区| 国产成人无码精品久久久性色| 国产白丝精品91爽爽久久 | 色综合久久六月婷婷中文字幕| 丁香花免费高清完整在线播放| 欧美激情精品久久久久| 日本免费精品| 日本国产中文字幕| 国产精品亚洲成人| 欧美人与禽zozzo禽性配| 欧美一区二区三区在线观看视频| 日本在线免费中文字幕| 国产精品香蕉av| 欧美激情偷拍自拍| 欧洲美女亚洲激情| 亚洲色图视频免费播放| 国产精品国产av| 久久亚洲精品国产亚洲老地址| 9999精品免费视频| 中文字幕日韩精品无码内射| 国产美女视频一区| 久久久久久久久久久久久久免费看 | 日韩伦理一区| 国产三级精品三级在线| 亚洲视频在线一区观看| 国产高清免费av| 久久久久久久一区二区| 日本成人a网站| 不要播放器的av网站| 国产精品日韩成人| 国产绳艺sm调教室论坛| 欧美激情欧美激情| 欧美1区2区3区4区| 国产真人无码作爱视频免费| 中文字幕欧美激情一区| 国产精品无码专区av免费播放| 九九热这里只有在线精品视| 国产厕拍一区| 成人久久久久久久久| 国产精品丝袜在线| 精品国产免费无码久久久| 97国产在线观看| 精品国产一区二区三区四区| 久久久久久久久久一区| 一区二区三区.www| 加勒比一区二区三区在线| 国产中文欧美精品| 伊人久久成人| 调教驯服丰满美艳麻麻在线视频| 91精品国产乱码| 人成在线免费网站| 一区二区在线观看网站| eeuss影院一区二区三区| 自拍偷拍色综合| 欧美激情啊啊啊| 怕怕欧美视频免费大全| 亚洲理论中文字幕| 日韩欧美第一页| 怡红院红怡院欧美aⅴ怡春院| 麻豆久久久9性大片| 韩国三级电影一区二区| 国产精品久久久久久99| 久久精品成人欧美大片| 天海翼亚洲一区二区三区| 超碰人人草人人| 欧美性xxxx极品hd满灌| a在线免费观看| 午夜精品亚洲一区二区三区嫩草 | 精品人妻中文无码av在线|