精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

首個通用語音翻譯系統!Meta重磅開源SeamlessM4T:支持100種語言多模態翻譯,附47萬小時訓練數據

人工智能 新聞
最近,Meta AI和加州大學伯克利聯合發布了一個大規模的多語言、多模態機器翻譯系統SeamlessM4T,只用一個模型實現支持100種語言的語音到語音翻譯、語音到文本翻譯、文本到語音翻譯、文本到文本翻譯和自動語音識別。

基于文本的翻譯系統已經取得了非常大的進步,從最早的查詞匹配、語法規則,再到神經翻譯系統、Transformer預訓練等,翻譯結果越來越精準,支持的互譯語言數量也超過了200種。

但與之相對的「語音到語音翻譯」模型仍然進展緩慢,目前主要依賴多個子系統級聯,先對輸入音頻轉換到文本,再逐步得到翻譯結果。

最近,Meta AI和加州大學伯克利聯合發布了一個大規模的多語言、多模態機器翻譯系統SeamlessM4T,只用一個模型實現支持100種語言的語音到語音翻譯、語音到文本翻譯、文本到語音翻譯、文本到文本翻譯和自動語音識別。

Blog post: https://bit.ly/45z0e6s

Demo鏈接: https://seamless.metademolab.com

論文鏈接: https://ai.meta.com/research/publications/seamless-m4t/

開源鏈接: https://github.com/facebookresearch/seamless_communication

為了訓練模型的多項能力,研究人員先使用了100萬小時的開放語音音頻數據來學習w2v-BERT 2.0的自監督語音表征。

然后過濾并結合人工標注和偽標注數據,得到了一個自動對齊的語音翻譯多模態語料庫SeamlessAlign,總計40.6萬小時,也是第一個能同時將語音和文本翻譯成英語的多語言系統。

在Fleurs上,SeamlessM4T為多種目標語言的翻譯設定了新的標準,在直接語音到文本的翻譯方面,BLEU比以前的最高性能模型提高了20%;

與強級聯模型相比,SeamlessM4T在語音到文本方面將英譯質量提高了1.3 BLEU評分,在語音到語音方面提高了2.6 ASR-BLEU評分。

在CVSS上,與用于語音到語音翻譯的2階段級聯模型相比,SeamlessM4T-Large的性能強了58%

數據準備

語言識別(LID)

將原始的音頻數據按照語言進行分類后,可以提高音頻片段的對齊質量,提高下游翻譯系統的性能。

研究人員選擇ECAPA-TDNN開源架構作為基線模型,在VoxLingua107數據集上重新訓練30個epoch后,分類錯誤率為5.25%;相比之下,開源版模型VL107 HF的錯誤率為7%

在模型復現驗證完畢后,研究人員最終在8個GPU上訓練了40個epoch,總耗時172小時,累計使用1.7萬小時的語音數據,平均每種語言171小時,具體為1到600小時不等。

在100種SeamlessM4T語言以及79種VoxLingua107語言的實驗中,可以看到,對額外語言的訓練會略微降低通用語言集的整體性能,可以是因為引入了更多相似語言,比如祖魯語(zul)經常與尼亞雅語(nya)混淆,現代標準阿拉伯語(arb)與摩洛哥阿拉伯語(arry)和埃及阿拉伯語(arz)混淆等。

總體來說,新模型在17種語言的分類能力上平均性能提升14.6%,但有12種語言的分類能力下降(平均9.8%)。

除此之外,為了提高LID標簽的質量,研究人員還根據特定語言的可用數據量,估算了開發語料庫中每種語言正確和錯誤分類的LID分數高斯分布,設定過濾閾值,使得 p(correct|score) > p(incorrect|score)

在過濾掉8%的數據后,模型的F1指標又進一步提高了近3%

大規模收集原始音頻和文本

在文本預處理時,研究人員遵循NLLB團隊的策略,使用相同的數據源、清洗策略、過濾步驟等。

論文鏈接:https://arxiv.org/abs/2207.04672

在音頻預處理上,研究人員首先從公開的網絡數據抓取庫中獲取了400萬小時的原始音頻(其中約100萬小時為英語),然后以16KHz頻率進行重采樣,再使用定制的音頻事件檢測(AED)模型過濾掉非語音數據。

在音頻分割部分, 為了實現S2TT或S2ST挖掘,研究人員將音頻文件盡可能分割成小塊,使得每個塊內只包含一個獨立的句子。

但語音中的語義分割仍然是一個開放性問題,不同語言中的停頓都可能代表不同的含義,所以研究人員先采用語音活動檢測(VAD)模型將音頻文件分割成較短的片段,再在每個文件上使用語音LID模型,最后為每個片段創建了多個可能的重疊片段,并使用挖掘算法選擇最佳片段,過度分割的策略使得潛在分段數量增加了八倍。

語音挖掘

在挖掘過程中,研究人員先訓練了一個文本編碼器和語音編碼器,然后利用兩個編碼器將文本和語音模態的數據投影到聯合嵌入空間SONAR(Sentence-level multimOdal and laNguage-Agnostic Representations)中。

文本編碼器的訓練方法為,首先訓練文本嵌入空間,再利用師生訓練策略將其擴展到語音模態,初始文本SONAR空間采用了編碼器-解碼器架構,基于NLLB-1.3B模型,能夠翻譯200種語言。

研究人員使用平均池化(mean-pooling)將中間表示轉換為固定大小的向量,即解碼器只需關注一個向量,然后利用NLLB的所有 T2TT訓練數據對這一架構進行了微調。

在語音編碼器的訓練中,先通過預訓練 XLS-R 模型的 BOS 輸出,獲得了固定大小的語音表征,然后對該模型進行微調,以最大化該集合語音表征與相同語言(ASR 轉錄)或英語(語音翻譯)句子嵌入之間的余弦損失。

最后根據文本句子或其他語言的語音片段挖掘語音片段來生成S2TT和S2ST數據對以訓練SeamlessM4T模型。

研究人員進行了全局挖掘(global mining),即將一種語言的所有語音片段與另一種語言的所有語音片段進行比較,利用faiss庫對所有嵌入進行索引可以實現在GPU上高效的大規模相似度搜索。

SeamlessM4T模型架構

研究人員設計SeamlessM4T的目標之一是,通過構建一個更強大的直接X2T模型(用于將文本和語音翻譯成文本)來彌合大型多語言和多模態設置中S2TT的直接和級聯模型之間的差距,將強大的語音表示學習模型與大規模多語言T2TT模型相結合。

無監督語音預訓練

語音識別和翻譯任務的標注數據非常難獲得,對于低資源語言來說更是如此,所以研究人員對語音翻譯模型的訓練思路是先采用自監督學習進行預訓練后再用少量數據微調,可以在數據量不足的情況下提升模型的極限性能。

研究人員在Seamless M4T Large中采用w2v BERT 2.0預訓練語音編碼器的w2v BERT XL架構,具有24個Conformer層和大約600M的模型參數。

w2v BERT 2.0模型基于100萬小時的開放語音音頻數據進行訓練,覆蓋了超過143種語言。

w2v-BERT 2.0遵循w2v-BERT的設計思路,將對比學習和遮罩預測學習相結合,不過調整了其中兩個學習目標。

對比學習模塊用于學習Gumbel矢量量化(GVQ)詞表(codebook)和上下文表征,之后用遮罩預測學習在不同任務中細化上下文表征,而不是在遮罩位置對預測概率進行極化。

w2v-BERT 2.0沒有使用單一的GVQ詞表,而是用兩個GVQ碼本的乘積量化。

X2T:文本翻譯與轉錄

多任務UnitY框架的核心部分X2T是一個多編碼器序列模型,語音輸入用的是基于Conformer的編碼器,文本使用基于Transformer的編碼器。

X2T模型的訓練數據為S2TT,即包含一段源語言的音頻和目標語言的文本。

研究人員分兩個階段訓練X2T模型:

第一階段在標注英語ASR和英語S2TT數據進行有監督訓練,這一過程可以同時提升X-eng(某個語言到英語)及eng-X的翻譯性能。

在這一過程中,研究人員猜想,模型只關注一種目標語言,同時用多語言語音表征進行微調的話,可以避免從目標語言反向傳播回來的干擾信號。

在第二階段,將標注eng-X S2TT和非英語ASR數據添加到混合數據集中。

語音到語音翻譯(S2ST, Speech-to-Speech Translation)

S2ST問題的關鍵是使用自監督離散聲學單元來表示目標語音,從而將S2ST問題分解為語音到單元翻譯(S2UT)和單元到語音(U2S)轉換。

對于S2UT問題,使用UnitY作為two-pass解碼框架,首先生成文本,然后預測離散的聲學單元。

與基本UnitY模型相比,SemalessM4T中的UnitY對初始化的S2TT模型進行預訓練來聯合優化T2TT、S2TT和ASR的X2T模型;T2U模型更深,包含6個Transformer層;使用預訓練T2U模型而非從頭初始化。

預訓練X2T具有更強的語音編碼器和更高質量的first-pass文本解碼器,并且更大規模的預訓練T2U模型可以在不受干擾的情況下,更好地處理多語言單元生成。

在微調的最后階段,用預訓練X2T模型和預訓練T2U模型對多任務UnitY模型初始化后,使用總計12.1萬小時的X-ENG和ENG-X S2ST翻譯數據對T2U組件進行微調,確保模型對先前微調階段任務的性能保持不變。

SeamlessM4T模型

經過前面三個階段的訓練后,最終得到的SeamlessM4T-Large模型具有2.3B參數,在T2TT任務上針對95種與英語配對的語言進行了微調,在ASR任務上針對96種語言進行了微調,在S2TT任務上針對89種與英語配對的語言進行了微調。

為了提供不同尺寸的模型,研究人員遵循相同的步驟來訓練得到SeamlessM4T-Medium,參數量比SeamlessM4T-Large少57%,可以更方便地測試和微調以進行實驗分析和改進。

實驗評估

研究人員在四個有監督任務(T2TT、ASR、S2TT和S2ST)以及文本到語音翻譯的零樣本任務(T2ST,跨語言文本到語音合成)上評估了SeamlessM4T模型。

在S2ST和T2ST推理過程中,模型進行two-pass beam search解碼,寬度為5,先用文本解碼器找到最佳假設(best hypothesis),然后輸入到T2U中搜索最佳單位序列假設。

級聯方法對比

在SeamlessM4T和Whisper支持的語言集上,研究人員對比了Whisper ASR模型和NLLB T2TT模型的組合。

可以看到,SeamlessM4T-Large在x-eng方向上比參數小于3B的級聯模型高出2個BLEU評分,在eng-x方向上比參數小于3B的級聯模型高出0.5個BLEU評分。

當使用大型NLLB-3.3B T2TT模型(超40億參數量)的級聯模型時,也只在eng-X方向上優于SeamlessM4T-Large

在S2ST任務的對比中,SeamlessM4T-Large在Fleurs X-Eng方向上比2級級聯模型高出9個ASR-BLEU點,比3級級聯模型高出2.6個ASR BLEU評分。

在CVSS上,SeamlessM4T-Large比2級級聯模型高出14個ASR-BLEU評分;在Fleurs Eng-X方向上,SeamlessM4T-Large在32個X-Eng方向上的平均ASR-BLEU為21.5,比Whisper-Large-v2(用于ASR-BLEU的ASR模型)的WER高于100。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-08-23 11:15:20

2022-10-21 09:29:37

2020-10-21 15:24:42

阿里AI翻譯

2023-05-25 16:24:13

2023-12-03 08:57:54

開源模型

2023-08-28 00:33:48

開源語音識別

2021-08-09 10:03:03

數據開源語音

2024-03-25 12:30:18

AI訓練開源

2024-08-19 13:35:09

2021-10-12 16:29:16

微軟翻譯服務人工智能

2023-06-12 11:53:00

數據集指令

2013-06-07 10:41:22

微軟Bing Tansla

2020-06-04 09:22:46

谷歌AI翻譯

2023-02-28 12:38:22

谷歌數據集機器翻譯

2025-05-14 08:51:00

2022-07-07 12:38:58

PlatformsMetaNLLB-200

2023-09-20 08:37:33

語音翻譯同傳翻譯

2013-05-27 13:50:07

大數據

2010-03-09 19:27:42

Python翻譯腳本

2025-11-12 17:15:53

MetaAI模型
點贊
收藏

51CTO技術棧公眾號

欧美成人综合网站| 国产欧美va欧美不卡在线| 久久久久五月天| 一级特级黄色片| 欧美日韩大片| 亚洲美女视频在线观看| 狠狠色狠狠色综合人人| 精品国产青草久久久久96| 欧美激情aⅴ一区二区三区| 亚洲国产欧美日韩精品| 8x8x最新地址| 国产在线看片免费视频在线观看| 国产色爱av资源综合区| 9a蜜桃久久久久久免费| 老熟妇一区二区三区| 国产精品videosex极品| 国产小视频91| 黑人玩弄人妻一区二区三区| 国产一区二区三区四区五区3d | www.av欧美| 国产精品2区| 色婷婷精品久久二区二区蜜臀av| 亚洲高潮无码久久| 北岛玲日韩精品一区二区三区| 成人午夜私人影院| 成人免费看吃奶视频网站| 91国产丝袜播放在线| 中文字幕日韩一区二区不卡| 伊人成人开心激情综合网| 99热超碰在线| 亚洲精品午夜| 欧美一区二区三区四区久久 | 国产精品18p| 久久电影院7| 亚洲天堂开心观看| 99久久免费看精品国产一区| 亚洲精品视频一二三区| 51精品视频一区二区三区| 黄色三级视频在线| 2022成人影院| 红桃av永久久久| 国产精品69久久久| 五月婷婷视频在线观看| 中文字幕日韩一区二区| 日韩免费av一区二区三区| 欧美套图亚洲一区| 97久久人人超碰| 精品国产一区二区三| 免费a级片在线观看| 国产精品资源在线看| 成人免费看黄网站| av中文字幕播放| 国产一区二区三区黄视频 | 国产精品h片在线播放| 欧美特黄aaaaaa| 国产农村妇女毛片精品久久莱园子| 欧美疯狂xxxx大交乱88av| 老熟妇高潮一区二区三区| 国产精品国内免费一区二区三区| 色偷偷av一区二区三区| www.99re6| 91精品秘密在线观看| www欧美日韩| 一区二区在线观看免费视频| 中文字幕日韩一区二区不卡| 欧美老妇交乱视频| 国产无遮挡又黄又爽| 99热这里只有精品8| 91av在线网站| 一级片在线观看免费| 日韩高清在线电影| 国产美女久久精品| 国产人妻精品一区二区三区| 成人爽a毛片一区二区免费| 国产一区二区黄色| 国内精品在线视频| 亚洲欧洲无码一区二区三区| 欧美在线观看黄| 2001个疯子在线观看| 欧美日韩在线视频观看| 精品亚洲一区二区三区四区| 日韩高清在线观看一区二区| 日韩电影在线观看中文字幕| 美女av免费看| 国产一区视频在线观看免费| 2019中文字幕免费视频| 久久久999久久久| 国产在线不卡一区| 久久一区免费| 国产原创精品视频| 偷偷要91色婷婷| 97se亚洲国产综合自在线| 99在线视频首页| 精品亚洲综合| 亚洲激情校园春色| 无码精品国产一区二区三区免费| 亚洲人成网站在线在线观看| 精品国产免费人成在线观看| 国产又粗又黄又猛| 欧美日韩99| 国产成人在线一区| 亚洲第九十九页| 欧美激情资源网| 农民人伦一区二区三区| 精品亚洲a∨| 日韩精品视频免费| 极品颜值美女露脸啪啪| 午夜国产精品视频免费体验区| 色综合色综合久久综合频道88| 久久99国产综合精品免费| 国产专区欧美精品| 欧洲精品亚洲精品| 波多野结衣中文在线| 精品女厕一区二区三区| 超碰91在线播放| 欧美日韩在线播放视频| 97av在线视频| 国产激情久久久久久熟女老人av| 国产日产欧美一区二区视频| 精品无码国产一区二区三区av| 日韩毛片免费看| 亚洲人成在线播放| 国产精品99re| 国产激情视频一区二区三区欧美 | 亚洲激情专区| 亚洲综合日韩在线| 香蕉视频在线看| 在线看国产一区二区| 一区二区三区少妇| 亚洲三级视频| 波多野结衣成人在线| 精品国产白色丝袜高跟鞋| 91久久精品国产91性色tv| 亚洲一区二区在线免费| 今天的高清视频免费播放成人| 成人啪啪免费看| 在线免费观看的av网站| 在线观看免费成人| 公肉吊粗大爽色翁浪妇视频| 媚黑女一区二区| 久久久久se| a天堂资源在线| 精品国精品国产尤物美女| 国产乱国产乱老熟300| 国产专区欧美精品| 91精品一区二区三区四区| 成人精品视频在线观看| 久久精品视频在线| 国产理论视频在线观看| 亚洲另类在线一区| 台湾佬美性中文| 红桃视频国产一区| 国产精品香蕉视屏| 51av在线| 亚洲欧美在线一区二区| 国产视频1区2区| 日本一区二区不卡视频| 日韩av片网站| 88国产精品视频一区二区三区| 成人午夜小视频| 午夜羞羞小视频在线观看| 日韩美女视频在线| 日韩精品在线不卡| 91麻豆视频网站| av免费网站观看| 欧美h版在线| 97av影视网在线观看| 国产又色又爽又黄刺激在线视频| 亚洲国产精品中文| 精品国产乱子伦| 中文字幕一区二区三区视频| 1314成人网| 一区二区高清| 日韩免费三级| 日韩中文在线| 日本伊人精品一区二区三区介绍| a天堂中文在线88| 欧美精品v日韩精品v韩国精品v| 亚洲色婷婷一区二区三区| 成人激情视频网站| 久久久精品三级| 亚欧美无遮挡hd高清在线视频| 懂色av一区二区三区在线播放| 日韩欧美精品一区二区三区| www.xxxx精品| 亚洲欧美一区二区三| 欧美午夜免费电影| 九九视频免费看| 国产亚洲欧美激情| 欧美一级大片免费看| 老鸭窝亚洲一区二区三区| 黑人巨大国产9丨视频| 性人久久久久| 成人免费视频97| 都市激情亚洲一区| 欧美精品在线免费| 男人的天堂在线免费视频| 91精品蜜臀在线一区尤物| 欧美一二三区视频| 亚洲青青青在线视频| 欧美丰满少妇人妻精品| 精品一区二区免费看| 国产精品333| 亚洲情侣在线| 欧美在线视频一区二区三区| 日本在线一区二区三区| 国产精品小说在线| 一区二区三区电影大全| 久久综合国产精品台湾中文娱乐网| 天天干,夜夜操| 91精品国产91热久久久做人人| 国产嫩bbwbbw高潮| 亚洲国产综合91精品麻豆| 国产一区第一页| 久久久久国产免费免费| 91人人澡人人爽| 精品一二线国产| www.色就是色| 亚洲在线观看| 天堂…中文在线最新版在线| 中文字幕一区二区av| 一区二区三区的久久的视频| 亚洲香蕉视频| 精品欧美一区二区在线观看视频 | 精品无码久久久久国产| 日韩成人18| 亚洲精品免费网站| 麻豆久久久久| 国产精品极品美女在线观看免费| 美女高潮在线观看| 欧美黑人巨大xxx极品| 国产美女在线观看| xxav国产精品美女主播| av在线播放av| 在线日韩中文字幕| 福利片在线看| 国产一区二区日韩| 邻居大乳一区二区三区| 精品在线观看国产| 香蕉国产在线视频| 亚洲精品国产欧美| 天天操天天射天天| 亚洲激情自拍图| 五月天婷婷激情网| 日韩精品久久久久久久玫瑰园| 成人精品在线播放| 亚洲成人久久久| 日韩在线一区二区三区四区| 亚洲成人a**站| 天堂网www中文在线| 亚洲裸体xxxx| 欧美男男激情freegay| 亚洲美女激情视频| 国产有码在线| 色偷偷噜噜噜亚洲男人| 九七电影韩国女主播在线观看| 久久精品国产亚洲精品2020| 国产激情视频在线观看| 精品视频9999| 日韩欧美精品一区二区三区| 国产精品户外野外| 亚洲在线资源| 成人欧美一区二区三区视频xxx | 中文字幕久久一区| 亚洲国产精品日韩专区av有中文| 尤物一区二区三区| 亚洲成av人片一区二区密柚| av在线免费观看国产| 在线视频精品| 中文字幕天天干| 国产一区二区三区黄视频| 午夜男人的天堂| 久久精品亚洲乱码伦伦中文| av在线免费播放网址| 亚洲精品v日韩精品| 尤物视频在线观看国产| 在线免费亚洲电影| 国产乱淫a∨片免费观看| 欧美精品一区二区精品网| 国外av在线| 蜜月aⅴ免费一区二区三区 | 在线看的av网站| 欧美成人激情在线| 原纱央莉成人av片| 成人日韩av在线| 欧美日韩直播| 一区二区三区四区不卡| 亚洲国内欧美| 尤物国产在线观看| 成人av在线播放网站| 欧美丰满美乳xxⅹ高潮www| 亚洲九九爱视频| 成年人av网站| 日韩免费视频一区二区| 日本私人网站在线观看| 欧美老女人性视频| 精品无人乱码一区二区三区| 99久久无色码| 波多野结衣在线观看一区二区三区| 日韩精品一区二区在线视频| 免费日本视频一区| 国产xxxxxxxxx| 亚洲麻豆国产自偷在线| 男人天堂视频在线| 亚洲成年人在线| 老司机精品视频在线观看6| 欧美又大又硬又粗bbbbb| 精品国产亚洲一区二区三区在线| 蜜桃精品久久久久久久免费影院| 你懂的一区二区| 国产福利影院在线观看| 99久久精品一区| 国产一区二区播放| 欧美日韩aaaaa| 蜜桃视频在线观看网站| 久久久在线视频| 亚洲日日夜夜| 亚洲成人自拍视频| 久久激情一区| 黄色av网址在线观看| 一区二区三区中文字幕在线观看| 中文字幕第315页| 亚洲欧美日韩区| 色戒汤唯在线观看| 国产精品99久久久久久久| 欧美一区成人| www.se五月| 国产精品久久久久久久久免费相片 | 天天色图综合网| 亚洲国产成人精品一区二区三区| 日韩亚洲欧美成人| 免费一级欧美在线观看视频| 日本视频一区二区不卡| 久久国产66| 性欧美13一14内谢| 欧美性69xxxx肥| 色视频在线观看| 国产综合在线看| 成人资源在线| 国产xxxx振车| 国产凹凸在线观看一区二区| 日本老熟俱乐部h0930| 91精品国产一区二区| 黄色视屏免费在线观看| 91久久夜色精品国产网站| 一区二区三区四区电影| 在线免费观看av网| 自拍偷拍欧美激情| 精品国产av 无码一区二区三区 | 成人av在线不卡| 成人国产精选| 神马影院一区二区| 日本欧美一区二区三区| 亚洲图片另类小说| 欧美在线观看一二区| 99re在线视频| 成人久久久久久| 欧美日韩国产亚洲一区| 日本性生活一级片| 精品国产电影一区| 国产中文字幕在线播放| 国产欧美一区二区三区四区| 99久久夜色精品国产亚洲96 | 亚洲小视频在线观看| 国产精品高清乱码在线观看| 日韩精品另类天天更新| 久88久久88久久久| 国产乱国产乱老熟300| 亚洲国产精品va在看黑人| 国产日韩电影| 夜夜爽99久久国产综合精品女不卡 | 中文字幕亚洲一区二区va在线| 99在线无码精品入口| 国内精品一区二区三区| 九九精品久久| 日本黄色的视频| 午夜精品在线看| 国产午夜在线视频| 亚洲综合成人婷婷小说| 亚洲经典在线| 成年人看的免费视频| 日韩一区二区三区精品视频| 黄色在线免费观看网站| 亚洲欧洲精品在线| 成人高清在线视频| 丰满人妻一区二区三区四区| 欧美另类交人妖| 国产精品嫩模av在线| 男女污污视频网站| 狠狠操狠狠色综合网| 免费人成在线观看播放视频 | 清纯唯美亚洲综合一区| 永久av免费在线观看| 欧美性xxxx极品hd欧美风情| 国产黄大片在线观看画质优化| 国内一区二区三区在线视频| 久久综合综合久久综合| 国产精品久久久免费视频| 久久精品99无色码中文字幕 | 99综合久久|