精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Prompt解鎖語音語言模型生成能力,SpeechGen實現語音翻譯、修補多項任務

人工智能 新聞
本文提出了一個名為 SpeechGen 的統一框架,該框架可用于任意的 speech LM 及各類語音生成任務,具有很好的潛力。

圖片

  • 論文鏈接:https://arxiv.org/pdf/2306.02207.pdf
  • Demo 頁面:https://ga642381.github.io/SpeechPrompt/speechgen.html
  • Code: https://github.com/ga642381/SpeechGen

引言與動機

大型語言模型(LLMs)在人工智能生成內容(AIGC)方面引起了相當大的關注,特別是隨著 ChatGPT 的出現。

然而,如何用大型語言模型處理連續語音仍然是一個未解決的挑戰,這一挑戰阻礙了大型語言模型在語音生成方面的應用。因為語音信號包含豐富的信息,如說話者和情感,超越了純文本數據,基于語音的語言模型 (speech language model (speech LM)) 不斷涌現。

雖然與基于文本的語言模型相比,語音語言模型仍處于早期階段,但由于語音數據中蘊含著比文本更豐富的信息,它們具備巨大的潛力,令人充滿期待。

研究人員正積極探索提示 (prompt) 范式的潛力,以發揮預訓練語言模型的能力。這種提示通過微調少量參數,引導預訓練語言模型做特定的下游任務。這種技術因其高效和有效而在 NLP 領域備受青睞。在語音處理領域,SpeechPrompt 展示出了在參數效率方面的顯著改進,并在各種語音分類任務中取得了競爭性的表現。

然而,提示能否幫助語音語言模型完成生成任務仍是未解之謎。在本文中,我們提出一個創新的統一框架:SpeechGen,旨在激發語音語言模型進行生成任務的潛力。如下圖所示,將一段語音、一個特定的提示 (prompt) 喂給 speech LM 作為輸入,speech LM 就能做特定的任務。比如將紅色的 prompt 當作輸入,speech LM 就能做 speech translation 的任務。

圖片

我們提出的框架具有以下優點:

1. 無文本 (Textless):我們的框架以及其所依賴的語音語言模型獨立于文字數據,擁有無可估量的價值。畢竟,獲取標記文本與語音配對的過程耗時繁瑣,而且在某些語言中甚至無法找到合適的文本。無需文字的特性使得我們的強大語音生成能力得以覆蓋各種語言需求,讓全人類受益匪淺。

2. 多功能性 (Versatility):我們開發的框架通用性極高,能應用于各種各樣的語音生成任務。論文中實驗使用語音翻譯、語音修復、語音連續當作例子。  

3. 簡易性 (Easy to follow):我們提出的框架為各類語音生成任務提供了通用解決方案,讓設計下游模型和損失函數變得輕而易舉。

4. 可遷移性 (Transferability):我們的框架不僅容易適應未來更先進的語音語言模型,還蘊藏著巨大的潛力,讓效率和效果得到進一步提升。尤其令人振奮的是,隨著先進語音語言模型即將問世,我們的框架將迎來更為強大的發展。  

5. 經濟性 (Affordability):我們的框架經過精心的設計,只需訓練少量參數,而不是整個龐大的語言模型。這極大地減輕了計算負擔,并允許在 GTX 2080 GPU 上執行訓練過程。大學的實驗室也能負擔得起這樣的運算開銷。

SpeechGen介紹


圖片

我們的研究方法在于構建一個全新的框架 SpeechGen,該框架主要利用語音語言模型(Spoken Language Models, SLMs)進行各種下游語音生成任務的微調。在訓練過程中,SLMs 的參數保持不變,我們的方法側重于學習任務特定的提示(Prompt)向量。SLMs 通過同時對提示向量和輸入單元進行條件設置,有效地生成特定語音生成任務所需的輸出。然后,這些離散單元輸出被輸入到基于單元的語音合成器中,生成對應的波形。

我們的 SpeechGen 框架由三個元素組成:語音編碼器、SLM 和語音解碼器(Speech Decoder)。

首先,語音編碼器將波形作為輸入,并將其轉換為由有限詞匯表導出的單位序列。為了縮短序列長度,會移除重復的連續單位以生成壓縮的單位序列。然后,SLM 作為單位序列的語言模型,通過預測前一單位和單位序列的后續單位來優化可能性。我們對 SLM 進行提示調整,以引導其根據任務生成適當的單位。最后,SLM 生成的標記由語音解碼器處理,將其轉換回波形。在我們的提示調整策略中,提示向量會在輸入序列的開始處插入,這將引導 SLMs 在生成過程中的方向。具體插入的提示數量,則取決于 SLMs 的架構。在序列到序列的模型中,編碼器輸入和解碼器輸入都會加入提示,但在只有編碼器或只有解碼器的架構中,只會在輸入序列前面添加一個提示。

在序列到序列的 SLMs(如 mBART)中,我們采用了自我監督學習模型(如 HuBERT)來處理輸入和目標語音。這樣做可以為輸入生成離散單元,并為目標生成對應的離散單元。我們在編碼器和解碼器輸入的前面都添加了提示向量,以構造輸入序列。此外,我們還通過替換注意力機制中的關鍵值對,以進一步增強提示的指導能力。

在模型訓練中,我們以交叉熵損失作為所有生成任務的目標函數,通過比較模型的預測結果和目標離散單元標簽來計算損失。在這個過程中,提示向量是模型中唯一需要訓練的參數,而 SLMs 的參數在訓練過程中保持不變,這確保了模型行為的一致性。我們通過插入提示向量,引導 SLMs 從輸入中提取任務特定信息,并提高產生符合特定語音生成任務的輸出的可能性。這種方法允許我們微調并調整 SLMs 的行為,而無需修改其基礎參數。

總的來說,我們的研究方法基于一種全新的框架 SpeechGen,通過訓練提示向量,引導模型的生成過程,并使其能有效地產生符合特定語音生成任務的輸出。

實驗

我們的框架可以用于任意的 speech LM 及各類生成任務,具有很好的潛力。在我們的實驗中,由于 VALL-E 和 AudioLM 不是開源的,我們選擇使用 Unit mBART 作為 speech LM 進行案例研究。我們用語音翻譯 (speech translation)、語音修復 (speech inpainting)、語音連續 (speech continuation) 當作例子,來展示我們框架的能力。這三個任務的示意圖如下圖所示。所有的任務都是語音輸入,語音輸出,無需文本幫助。

圖片

語音翻譯

我們在訓練語音翻譯 (speech translation) 時,用的是西班牙文轉英文的任務。我們給模型輸入西班牙語的語音,希望模型產生英文的語音,整個過程無需文本幫助。以下是幾個語音翻譯的例子,我們會展示正確答案 (ground truth) 與模型的預測 (model prediction)。這些演示示例表明模型的預測捕捉到了正確答案的核心含義。

圖片

語音修補

在我們進行語音修補 (speech inpainting) 的實驗中,我們特別選取超過 2.5 秒的音頻片段作為后續處理的目標語音,并通過隨機選擇過程挑選出一段時長介于 0.8 至 1.2 秒的語音片段。然后我們對選出的片段進行掩碼,模擬語音修補任務中缺失或受損的部分。我們使用詞錯誤率 (WER) 和字符錯誤率 (CER) 作為評估受損片段修復程度的指標。

對 SpeechGen 生成的輸出與受損語音進行比較分析,我們的模型可以顯著重建口語詞匯,將 WER 從 41.68% 降低到 28.61%,將 CER 從 25.10% 降低到 10.75%,如下表所示。這意味著我們提出的方法能夠顯著提高語音重建的能力,最終促進語音輸出的準確性和可理解性。

圖片

下圖是一個展示樣例,上面的子圖是受損的語音,下面的子圖是 SpeechGen 產生的語音,可以看到,SpeechGen 很好地修復了受損的語音。

圖片

語音連續

我們將通過 LJSpeech 展示語音連續任務的實際應用。在訓練提示(prompt)期間,我們的策略是讓模型只看到片段的 seed segment,這個 seed segment 占據了語音總長度的部分比例,我們將其稱為條件比率(condition ratio, r),并讓模型繼續生成后續的語音。

以下是一些實例,黑色的文字代表種子片段(seed segment),紅色的文字則是 SpeechGen 生成的句子(這里的文字首先經過語音識別得到結果。在訓練和推理過程中,模型完全進行的是語音到語音的任務,且完全不接收任何文字信息)。不同的條件比率使 SpeechGen 能夠生成不同長度的語句以實現連貫性,并完成一句完整的話。從質量角度看,生成的句子與種子片段在語法上基本一致,并且語義相關。雖然,生成的語音仍然無法完美地傳達一個完整的意思。我們預期這個問題將在未來更強大的語音模型中得到解決。

不足與未來方向

語音語言模型和語音生成正處于蓬勃發展的階段,而我們的框架則提供了一種巧妙地利用強大語言模型進行語音生成的可能性。然而,這個框架仍有一些尚待完善之處,也有許多值得我們深入研究的問題。

1. 與基于文本的語言模型相比,語音語言模型目前還處于發展的初級階段。雖然我們提出的提示框架能激發語音語言模型做語音生成任務,但并不能達到卓越的性能。不過,隨著語音語言模型的不斷進步,比如從 GSLM 到 Unit mBART 的大轉身,提示的表現有了明顯的提升。特別是以前對 GSLM 具有挑戰性的任務,現在在 Unit mBART 下表現出更好的性能。我們預計未來會出現更多先進的語音語言模型嶄露頭角。

2. 超越內容信息:當前的語音語言模型并不能完全捕捉到說話者和情感信息,這給當前的語音提示框架在有效處理這些信息方面帶來了挑戰。為了克服這個限制,我們引入即插即用模塊,專門為框架注入說話者和情感信息。展望未來,我們預計未來的語音語言模型將整合和利用這些內容之外的信息,以提高性能并更好地處理語音生成任務中的說話者和情感相關方面。

3. 提示生成的可能性:對于提示生成,我們有著靈活多變的選擇,可以集成各種類型的指示,包括文本和圖像指示。想象一下,我們可以訓練一個神經網絡,讓它用圖像或文本作為輸入,而不是像本文中那樣使用訓練好的 embedding 當作提示。這個訓練好的網絡將成為提示生成器,為框架增添了多樣性。這樣的方式會讓提示生成變得更加有趣、更加豐富多彩。

結論

本文我們探索了使用提示來解鎖語音語言模型在各種生成任務中的性能。我們提出了一個名為 SpeechGen 的統一框架,該框架僅有約 10M 的可訓練參數。我們所提出的框架具有幾大特性,包括無需文本、多功能性、高效性、可轉移性和可負擔性。為了展示 SpeechGen 框架的能力,我們以 Unit mBART 為案例進行研究,并在三個不同的語音生成任務上進行實驗:語音翻譯、語音修復和語音延續。 

當這篇論文提交到 arXiv 時,Google 提出了一種更先進的語音語言模型 ——SPECTRON,它為我們展示了語音語言模型在建模說話人和情感等信息的可能性。這無疑是一個令人興奮的消息,隨著先進語音語言模型的不斷提出,我們的統一框架具有巨大的潛力。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-06-19 13:30:09

語音AI

2021-12-24 10:34:11

鴻蒙HarmonyOS應用

2025-07-02 09:46:30

2023-08-29 13:54:00

AI技術

2024-05-17 16:02:00

2012-07-25 13:23:32

ibmdw

2017-09-14 14:43:07

NLP入門模型

2013-10-31 11:19:09

微軟語音翻譯手語翻譯

2011-05-31 16:38:47

Android 實現語音

2022-10-21 09:29:37

2023-07-18 09:00:00

ChatGPT文本轉語音

2023-05-25 16:24:13

2017-03-20 10:14:03

語音識別匹配算法模型

2022-11-14 21:34:17

2023-08-22 14:18:49

點贊
收藏

51CTO技術棧公眾號

精品福利在线导航| 国产精品三级在线观看| 国模精品系列视频| 50一60岁老妇女毛片| 国产精品一区hongkong| 99久久精品国产观看| 69av在线视频| 亚洲黄色小说视频| 欧美成人精品三级网站| 久久综合99re88久久爱| 国产成人综合亚洲| 在线观看亚洲网站| 国产乱人伦丫前精品视频| 精品久久中文字幕久久av| 欧美午夜精品理论片a级大开眼界| 正在播放亚洲精品| 中国精品18videos性欧美| 精品国产一区二区三区忘忧草| 阿v天堂2017| 东凛在线观看| 久久精品99久久久| 欧美激情第1页| 成年人在线免费看片| 国产精品久久久久久av公交车| 亚洲国产欧美在线| 精品国产乱码久久久久久蜜柚| 日本免费精品视频| 亚洲精品99| 亚洲精品大尺度| 日本高清久久久| 黄色片网站在线观看| 99在线精品免费| 国产视频观看一区| 天天操天天干视频| 中文字幕一区二区三区欧美日韩| 亚洲国产精品一区二区久| 日本人视频jizz页码69| av中文字幕在线观看第一页| 国产精品免费网站在线观看| 国产日韩二区| 国产99久久九九精品无码免费| 视频一区欧美精品| 久久久久久亚洲精品| 人妻一区二区视频| 巨人精品**| 91精品国产高清一区二区三区| 国产免费成人在线| 黄色美女视频在线观看| 国产欧美一区二区在线| 精品国产综合区久久久久久| 国产视频一区二区三区四区五区| 美女爽到呻吟久久久久| 久久精品电影一区二区| 美女被到爽高潮视频| 久久男人av| 欧美变态口味重另类| 国产乱码一区二区三区四区| 97人澡人人添人人爽欧美| 专区另类欧美日韩| 日本欧洲国产一区二区| 四虎影视在线观看2413| 成人黄页毛片网站| 91传媒免费看| 国产精品毛片久久久久久久av| 热久久久久久久| 91精品国产91久久| 日韩大片免费在线观看| 在线国产欧美| 久久久久久久久久久av| 国精产品视频一二二区| 成人中文视频| 国产亚洲欧美aaaa| 好吊视频在线观看| 国产99久久久国产精品成人免费| 日韩av影片在线观看| av2014天堂网| 亚洲男人都懂第一日本| 亚洲欧美另类国产| 亚洲性猛交xxxx乱大交| 国产日产精品_国产精品毛片| 亚洲美女av电影| 尤物视频最新网址| 成人情趣视频| 久久精品久久久久久| 看免费黄色录像| 欧美一区成人| 欧美激情综合色综合啪啪五月| a级黄色片免费看| 欧美xxx在线观看| 欧美日韩成人网| 不卡的免费av| 男人天堂欧美日韩| 国产精品亚发布| 国产一区二区三区视频免费观看| 国产乱码精品一区二区三区av | 精品国产麻豆免费人成网站| 色悠悠在线视频| 欧美人与牛zoz0性行为| 中文字幕亚洲欧美日韩2019| 国产尤物在线播放| 女生裸体视频一区二区三区| 97视频在线观看视频免费视频 | 亚洲免费成人| 国产99在线|中文| 97精品人妻一区二区三区香蕉| 粉嫩av一区二区三区粉嫩| 美女黄毛**国产精品啪啪| 三区四区电影在线观看| 一区二区三区中文字幕精品精品 | 欧美成人精品欧美一级乱| 国产人妖一区| 精品电影一区二区三区| 亚洲国产欧美视频| 99久久夜色精品国产亚洲狼 | 欧美精品欧美精品| av在线电影网| 亚洲国产人成综合网站| 手机在线看福利| silk一区二区三区精品视频| 国产亚洲一级高清| 国产在线视频卡一卡二| 日本在线播放一区二区三区| 亚洲直播在线一区| 久久久久久女乱国产| 亚洲最新视频在线播放| 一本久道综合色婷婷五月| 国产精品色婷婷在线观看| 亚洲精品一区二区网址| 国产女人18水真多毛片18精品| 国产亚洲欧洲| 成人在线观看av| 不卡在线视频| 欧美日韩性视频| 中文字幕天天干| 亚洲人成网www| 欧美高清自拍一区| 黄色在线免费观看| 国产91精品一区二区麻豆亚洲| 少妇精品久久久久久久久久| av资源新版天堂在线| 4438亚洲最大| www.99热| 久久久久久一区二区| 91在线观看欧美日韩| 国产在线观看黄| 亚洲va欧美va人人爽午夜| 亚洲第一中文av| 欧美亚洲色图校园春色| 欧美日韩成人网| 在线观看一区| 黄色污在线观看| 国产三级小视频| 26uuu久久天堂性欧美| 日本一本草久p| 成人精品国产| 国产亚洲xxx| 全部毛片永久免费看| 国产高清久久久久| 日本特级黄色大片| 免费一级欧美在线观看视频| 亚洲人成毛片在线播放| 成人午夜视频精品一区| thepron国产精品| 久艹在线免费观看| 中文字幕一区二区三区中文字幕| 久久久精品国产亚洲| 亚洲最大成人av| 久久久精品影视| 成人在线激情网| 国产精品羞羞答答在线观看| 91成人在线播放| 四虎电影院在线观看| 精品国产福利视频| 中文在线永久免费观看| 夜夜嗨网站十八久久| 国内精品视频在线播放| 欧美激情成人动漫| 亚洲爱爱爱爱爱| 天海翼一区二区| 成人免费视频一区| 成人免费毛片在线观看| 欧美日韩导航| 欧美亚洲第一页| 国产在线观看精品一区| 欧美日韩国产中文| 国产精品酒店视频| 国内成人精品2018免费看| 免费观看国产视频在线| 我要色综合中文字幕| 国内偷自视频区视频综合| av免费在线观看不卡| 亚洲影院理伦片| 亚洲精品乱码久久| 国产精品永久| 亚洲精品在线免费看| 国产一区二区三区国产精品| 久久久久久久一区二区| 国产 日韩 欧美 精品| 狠狠久久五月精品中文字幕| 夫妇露脸对白88av| 国产成人久久精品77777最新版本| 国产日韩av网站| 制服丝袜日韩| 成人午夜在线视频一区| 91www在线| 中文字幕亚洲激情| 国产又粗又猛又黄又爽无遮挡| 亚洲在线中文字幕| 中国毛片在线观看| 国产乱子伦一区二区三区国色天香| 亚洲人精品午夜射精日韩| 欧美日韩麻豆| 成人写真视频福利网| 黄视频免费在线看| 日韩亚洲欧美成人| 男人天堂一区二区| 在线免费视频一区二区| 青青草激情视频| 国产亚洲精品7777| 黑森林av导航| 麻豆91在线播放| 97av中文字幕| 精品久久久久中文字幕小说| 99久久免费国| 91福利精品在线观看| 性亚洲最疯狂xxxx高清| 成人看片免费| 日韩在线观看免费高清完整版| 男女网站在线观看| 日韩精品视频观看| 东京干手机福利视频| 欧美一级理论片| 国产精品一区二区三区在线免费观看| 色婷婷激情综合| 天堂网中文字幕| 色综合久久久久综合体桃花网| 日韩xxx高潮hd| 亚洲大尺度视频在线观看| 久久精品视频免费在线观看| 亚洲精品国产成人久久av盗摄| 国产第一页浮力| 亚洲欧美日韩中文字幕一区二区三区 | 免费黄色国产视频| 中文字幕精品一区| 影音先锋男人在线| 国产三区在线成人av| 一级性生活大片| 久久综合久久综合久久综合| 添女人荫蒂视频| 久久亚洲精品国产精品紫薇| 日批视频免费看| 北条麻妃一区二区三区| 成年人小视频在线观看| 91在线视频观看| 日本少妇高潮喷水xxxxxxx| 国产日本欧美一区二区| 精品手机在线视频| 国产精品成人免费在线| 麻豆明星ai换脸视频| 夜夜嗨av一区二区三区网页| 国产无套粉嫩白浆内谢| 精品久久久一区二区| 中文字幕在线看人| 欧美色手机在线观看| 99在线精品视频免费观看20| 日韩精品一区二区在线| 人妻精品一区二区三区| 亚洲女人被黑人巨大进入al| 草草影院在线观看| 久久亚洲精品一区| 久久99亚洲网美利坚合众国| 97视频在线观看成人| yw.尤物在线精品视频| 成人免费直播live| 老司机精品在线| 午夜久久资源| 欧美精品自拍| 国产真实乱子伦| 久久66热re国产| 熟妇高潮一区二区| 国产亚洲综合在线| 久久高清内射无套| 性久久久久久久久久久久| 免费黄色片视频| 日韩一本二本av| 女人偷人在线视频| 久久久av电影| 亚洲精品动漫| 亚洲一区二区三区视频播放| 久久91精品| 丰满人妻一区二区三区53号| 亚洲欧美日本视频在线观看| 青青草久久伊人| 99视频精品在线| 青花影视在线观看免费高清| 欧美日韩在线另类| 国产视频一区二区三区四区五区 | 素人av在线| 97视频免费看| 国产精品高清一区二区| 麻豆成人小视频| 欧美精品三区| 中文字幕第80页| caoporn国产精品| 一级片一级片一级片| 一本久久精品一区二区| 草草视频在线播放| 日韩专区在线观看| 免费福利视频一区二区三区| 成人资源视频网站免费| 日韩毛片视频| 亚洲中文字幕久久精品无码喷水| 国产98色在线|日韩| 国产成人av免费在线观看| 色网站国产精品| 欧美 日韩 国产 精品| 久久精品视频免费播放| 日韩三区在线| 六月婷婷久久| 亚洲国产黄色| 中文字幕1区2区| 18成人在线视频| 久久久久久av无码免费看大片| 国产婷婷成人久久av免费高清| 欧美xxxx视频| 91久色国产| 五月天久久网站| 亚洲欧美日韩精品一区| 日本一区二区免费在线| 日日摸天天添天天添破| 亚洲精品www| av免费不卡国产观看| 国产精品视频500部| 国产精品v日韩精品v欧美精品网站 | 免费在线黄色网| 91精品久久久久久久久99蜜臂| 91caoporn在线| 国产精品女主播视频| 不卡日本视频| 亚州精品一二三区| 中文字幕免费不卡在线| 超碰在线免费97| 中文字幕亚洲一区二区三区五十路| 日本免费久久| 日韩av免费电影| 日本不卡的三区四区五区| 国产一区二区三区精品在线| 色94色欧美sute亚洲线路一ni | 中文字幕一区二区在线观看| 最新在线中文字幕| 一区国产精品视频| 国产亚洲人成a在线v网站| 亚洲精品一区二区三区蜜桃久| 日本中文字幕一区| 亚洲视频重口味| 欧美一区2区视频在线观看| 最新日本在线观看| 国产精品久久九九| 亚洲精品资源| 天堂久久精品忘忧草| 欧美性大战久久久久久久蜜臀| 在线播放毛片| 97人人模人人爽人人少妇| 在线成人h网| 性高潮久久久久久久| 欧美中文字幕不卡| 理论片午午伦夜理片在线播放| 91香蕉电影院| 亚洲精品影院在线观看| 国产精品免费无码| 欧美高清视频www夜色资源网| 污污的网站在线看| 精品日韩美女| 美女网站在线免费欧美精品| 日韩欧美123区| 亚洲免费一在线| 国产精品美女久久久久人| 国内精品在线观看视频| 欧美国产丝袜视频| 国产富婆一级全黄大片| 欧美在线激情视频| 99re6这里只有精品| 中文字幕久久久久久久| 欧美日韩综合视频| 免费在线午夜视频| 国内一区在线| 精品综合久久久久久8888| 精品亚洲永久免费| 在线观看精品自拍私拍| 中文字幕一区日韩精品| mm1313亚洲国产精品无码试看| 亚洲欧美另类久久久精品| 亚洲色图狠狠干| 91精品国产自产在线老师啪| 亚洲作爱视频| 美女福利视频在线观看| 亚洲色图15p| 精品少妇一区| 在线视频日韩欧美| 色999日韩国产欧美一区二区|