精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

規模性能雙殺OpenAI,Meta語音達LLaMA級里程碑!開源MMS模型可識別1100+語言

人工智能 新聞
Meta的大規模多語言語音 (MMS) 項目將徹底改變語音技術,使用wav2vec 2.0的自監督學習,MMS將語音技術擴展到1100到4000種語言。

在語音方面,Meta又達到了另一個LLaMA級的里程碑。

今天,Meta推出了一個名為MMS的大規模多語言語音項目,它將徹底改變語音技術。

MMS支持1000多種語言,用圣經訓練,錯誤率僅為Whisper數據集的一半。

只憑一個模型,Meta就建起了一座巴別塔。

并且,Meta選擇將所有模型和代碼開源,希望為保護世界語種的多樣性做出貢獻。

圖片

在此之前的模型可以覆蓋大約100種語言,而這次,MMS直接把這個數字增加了10-40倍!

具體來說,Meta開放了1100多種語言的多語種語音識別/合成模型,以及4000多種語言的語音識別模型。

與OpenAI Whisper相比,多語言ASR模型支持11倍以上的語言,但在54種語言上的平均錯誤率還不到FLEURS的一半。

而且,將ASR擴展到如此多語言之后,只造成了非常小的性能下降。

論文地址:https://research.facebook.com/publications/scaling-speech-technology-to-1000-languages/

保護消失語種,MMS把語音識別增加40倍

讓機器具備識別和產生語音的能力,可以讓更多人獲得信息。

然而,為這些任務生成高質量的機器學習模型,就需要大量的標記數據,比如數千小時的音頻以及轉錄——對于大多數語言來說,這種數據根本就不存在。

現有的語音識別模型,只涵蓋了大約100種語言,在地球上的7000多種已知語言中,這只占很小一部分。令人擔憂的是,在我們有生之年,這些語言中有一半都面臨著消失的危險。

在Massively Multilingual Speech(MMS)項目中,研究者通過結合wav2vec 2.0(Meta在自監督學習方面的開創性工作)和一個新的數據集來克服了一些挑戰。

這個數據集提供了超過1100種語言的標記數據,和近4000種語言的未標記數據。

圖片

通過跨語言訓練,wav2vec 2.0學習了多種語言中使用的語音單元

其中一些語言,如Tatuyo語,只有幾百個使用者,而數據集中的大多數語言,以前根本就不存在語音技術。

而結果顯示,MMS模型的性能優于現有的模型,覆蓋語言的數量是現有模型的10倍。

Meta一向專注于多語言工作:在文本上,Meta的NLLB項目將多語言翻譯擴展到了200種語言,而MMS項目,則將語音技術擴展到更多語言。

圣經解決語音數據集難題

收集數千種語言的音頻數據并不是一件簡單的事情,這也是Meta的研究人員面臨的第一個挑戰。

要知道,現有的最大語音數據集最多也只涵蓋了100種語言。為了克服這個問題,研究人員轉向了宗教文本,如《圣經》。

這類文本已經被翻譯成許多不同的語言,被用于廣泛的研究,還有各種公開的錄音。

為此,Meta的研究者專門創建了一個超過1100種語言的《新約》閱讀數據集,平均每種語言提供32小時的數據。

再加上其他各種宗教讀物的無標簽錄音,研究者將可用的語言數量增加到了4000多種。

圖片

在MMS數據上訓練的自動語音識別模型,在FLEURS基準測試中,對男性和女性說話者具有相似的錯誤率

這些數據通常是由男性朗讀的,但模型對男性和女性的聲音表現得同樣好。

并且,雖然錄音的內容是宗教性的,但這并沒有使模型過度偏向于產生更多的宗教語言。

研究人員分析認為,這是因為他們使用了連接主義時間分類方法,與用于語音識別的大語言模型或序列對序列模型相比,它的約束性要大得多。

模型越大,越能打?

研究人員首先對數據進行了預處理,以提高數據的質量,并使其能被機器學習算法所利用。

為此,研究人員在100多種語言的現有數據上訓練了一個對齊模型,并將這個模型與一個高效的強制對齊算法一起使用,而該算法可以處理大約20分鐘或更長時間的錄音。

研究人員多次重復了這個過程,并根據模型的準確性進行了最后的交叉驗證過濾步驟,為的是去除潛在的錯誤對齊數據。

為了使其他研究人員能夠創建新的語音數據集,研究人員將對齊算法添加到了PyTorch中并發布了對齊模型。

目前,每種語言都有32小時的數據,但這并不足以訓練傳統的監督式語音識別模型。

這也就是為什么研究人員在wav2vec 2.0上訓練模型,這樣可以大大減少訓練一個模型所需的標注數據量。

具體來說,研究人員在超過1400種語言的約50萬小時的語音數據上訓練了自監督模型——這個量比過去多了近5倍。

然后針對特定的語音任務,如多語言語音識別或語言識別,研究人員再對模型進行微調即可。

為了更好地了解在大規模多語言語音數據上訓練的模型的表現,研究人員在現有的基準數據集上對它們進行了評估。

研究人員使用一個1B參數的wav2vec 2.0模型對超過1100種語言進行多語言語音識別模型的訓練。

隨著語言數量的增加,性能確實有所下降,但這種下降比較輕微——從61種語言到1107種語言,字符錯誤率只增加了約0.4%,但語言覆蓋率卻增加了18倍以上。

圖片

將每個系統支持的語言數量從61增加到1,107 時,使用MMS數據訓練的多語言識別系統的61種FLEURS語言的錯誤率。錯誤率越高表示性能越低

在與OpenAI的Whisper進行同類比較時,研究人員發現,在Massively Multilingual Speech數據上訓練的模型有將近一半的單詞錯誤率,但Massively Multilingual Speech涵蓋的語言是Whisper的11倍。

從數據中我們可以看出,與目前最好的語音模型相比,Meta的模型表現的真的非常不錯。

圖片

OpenAI Whisper與Massively Multilingual Speech在54種FLEURS語言上的單詞錯誤率對比

接下來,研究人員使用自己的以及現有的數據集,如FLEURS和CommonVoice,為超過4000種語言訓練了一個語言識別(LID)模型,并在FLEURS LID任務上對其進行了評估。

事實證明,哪怕支持了將近40倍的語言數量,性能依然很能打。

圖片

在現有工作的VoxLingua-107基準上的語言識別準確性,支持的語言剛剛超過100種,而MMS則支持超過4000種語言。

研究人員還為超過1100種語言建立了文本轉語音的系統。

大規模多語種語音數據有一個局限性,那就是對于許多語言來說,它包含的不同說話者數量相對較少,通常只有一個說話者。

然而,這個特點對于建立文本到語音系統來說是一個優勢,因此研究人員為超過1100種語言訓練了類似系統。

結果表明,這些系統產生的語音質量還算不錯。

未來屬于單一模型

Meta的研究人員對這個結果感到很滿意,但與所有新興的AI技術一樣,Meta目前的模型并不算完美。

比方說,語音到文本模型可能會誤寫選定的單詞或短語,可能會導致冒犯性的或者不準確的輸出結果。

同時,Meta認為,AI巨頭的合作對于負責任的AI技術的發展至關重要。

世界上的許多語言都有消失的危險,而目前語音識別和語音生成技術的局限性只會加速這一趨勢。

研究人員設想一個技術產生相反效果的世界,鼓勵人們保持其語言的活力,因為他們可以通過說自己喜歡的語言來獲取信息和使用技術。

大規模多語言語音項目是朝著這個方向邁出的重要一步。

在未來,研究人員希望進一步增加語言的覆蓋面,支持更多的語言,甚至還會想辦法搞定方言。要知道,方言對現有的語音技術來說可不簡單。

Meta的最終目標是讓人們能更容易地用自己喜歡的語言獲取信息、使用設備。

最后,Meta的研究人員還設想了這樣一個未來場景——靠一個單一的模型就可以解決所有語言的幾個語音任務。

目前雖然Meta為語音識別、語音合成和語言識別訓練了單獨的模型,但研究人員相信,在未來,只需一個模型就能完成所有這些任務,甚至不止。

責任編輯:張燕妮 來源: 新智元
相關推薦

2011-09-10 19:23:22

2011-09-09 13:42:16

2016-09-29 09:46:41

JavascriptWeb前端

2020-10-21 15:38:32

Facebook翻譯語言

2021-02-04 14:31:30

RISC-V架構GPU

2013-01-18 10:09:10

互聯網網絡發展撥號上網

2022-05-19 15:51:57

技術信息AI

2020-11-12 12:54:41

Linux基金會項目

2024-01-02 12:50:12

數據模型

2018-03-15 21:51:46

微軟翻譯機器

2017-08-01 10:15:56

數據分析大數據

2015-07-28 11:29:59

電商亞馬遜沃爾瑪

2015-12-21 16:12:06

紅帽CloudForms混合云

2023-06-23 14:15:09

Rust編程

2010-04-09 15:24:55

2013-10-09 13:25:40

Google

2013-10-10 12:28:56

Google開源代碼

2025-02-20 11:29:21

2016-09-01 08:07:02

Linux MinixUbuntu

2011-05-25 10:19:17

點贊
收藏

51CTO技術棧公眾號

日韩亚洲视频在线观看| 中文字幕一区二区三区电影| 欧美国产日本在线| 免费裸体美女网站| 性色av无码久久一区二区三区| 免费一二一二在线视频| 国产精品麻豆久久| 色综合欧美在线视频区| 国产精品加勒比| 91久久国产综合| 亚洲四虎影院| 久久久一区二区三区捆绑**| 久久人人爽人人爽人人片av高请 | 9色在线观看| 亚洲在线电影| 日韩成人在线免费观看| 国产夫妻自拍一区| 99热这里只有精品在线| 91精品一区国产高清在线gif| 欧美天天综合网| 日韩国产一区久久| 在线免费观看国产精品| 免费成人结看片| 色综合久久九月婷婷色综合| 熟女熟妇伦久久影院毛片一区二区| 中文字幕久久网| 色综合久久网| 欧美一区二区在线不卡| 久久久久久久久久久久久国产| 国产女同91疯狂高潮互磨| 视频在线不卡免费观看| 91精品婷婷国产综合久久性色| 在线看成人av电影| 99热这里是精品| 日本亚洲视频在线| 色偷偷av一区二区三区乱| 久久综合伊人77777麻豆最新章节| 国产女人在线观看| 免费一级欧美片在线观看| 精品久久国产精品| 欧美一级大片免费看| 黄页网站在线| 久久精品无码一区二区三区| 国产精品区一区| 国产色视频在线| 免费人成黄页网站在线一区二区 | 在线丝袜欧美日韩制服| 国产乱视频在线观看| 久久综合九色综合97婷婷女人| 日韩av成人在线| jizz日本在线播放| 精品视频91| 香蕉影视欧美成人| 欧美日韩精品不卡| 91成人国产综合久久精品| 欧美暴力喷水在线| 精品亚洲一区二区三区在线观看| 国产野外作爱视频播放| 亚洲丝袜精品| 久久精品欧美一区二区三区麻豆| 成人激情视频在线观看| 日本一区二区欧美| 成人羞羞动漫| 亚洲第一偷拍网| 亚洲成人福利在线观看| 原纱央莉成人av片| 亚洲日本在线a| 久久久99爱| 国产夫妻自拍av| 国产麻豆精品一区二区| 欧美亚洲国产日韩2020| 91ts人妖另类精品系列| 免费萌白酱国产一区二区三区| 欧美日韩一区三区四区| 成人免费aaa| 免费在线观看av| 久久综合色综合88| 日本免费高清不卡| 粉嫩av一区二区夜夜嗨| 日本视频免费一区| 91色琪琪电影亚洲精品久久| 日本高清不卡码| 日韩伦理一区| 欧美成人在线影院| 快灬快灬一下爽蜜桃在线观看| 国产精品白丝一区二区三区| 欧美日韩成人高清| 国产精品亚洲αv天堂无码| 欧美性爽视频| 亚洲少妇30p| 欧美亚洲黄色片| 欧美xxx网站| 福利一区福利二区微拍刺激| 2018中文字幕第一页| 中老年在线免费视频| 亚洲自拍偷拍麻豆| 一级全黄肉体裸体全过程| 黄色的视频在线观看| 婷婷六月综合亚洲| 亚洲视频导航| 人操人视频在线观看| 国产精品免费免费| 亚洲春色在线| 国产女主播在线直播| 亚洲精品成a人| 在线天堂一区av电影| 92久久精品| 午夜国产精品一区| 国产高清视频网站| 精品福利一区| 精品国产免费人成在线观看| 久久综合桃花网| 欧美黄色一级| 一区国产精品视频| 少妇太紧太爽又黄又硬又爽小说| 激情欧美日韩| 91国语精品自产拍在线观看性色 | 日韩欧美亚洲日产国产| 色在线视频网| 欧美日韩一区国产| 亚洲区免费视频| 国产一区日韩| 亚洲色图15p| 中文幕无线码中文字蜜桃| 久久久久午夜电影| 国产精品久久久久久中文字| 中文字幕+乱码+中文字幕明步| 懂色av噜噜一区二区三区av| 国产欧美一区二区视频| 婷婷婷国产在线视频| 久久影院午夜论| 久久男人资源站| 国模私拍一区二区国模曼安| 欧美视频中文在线看| 亚洲五月天综合| 伊人国产精品| 精品久久久久一区二区国产| www.自拍偷拍| 久久在线电影| 国产精品中文字幕在线| av网站在线免费看| 国产精品不卡在线| 18禁裸男晨勃露j毛免费观看 | 国产高清一区视频| 污视频在线免费| 国产人成亚洲第一网站在线播放| 亚洲精品无人区| 色豆豆成人网| 欧美一区二区人人喊爽| 三级黄色免费观看| 亚洲私人影院| 国产精品免费一区二区三区都可以| 天天操天天干天天插| 国产欧美精品一区二区三区四区 | 午夜老司机精品| 99热国产在线| 日韩欧美在线免费观看| 亚洲国产精品自拍视频| 日韩视频在线观看| 国产欧美日韩91| 免费在线看a| 7777精品伊人久久久大香线蕉经典版下载| 天天操天天摸天天舔| 奇米一区二区三区av| 亚洲乱码一区二区三区| 96视频在线观看欧美| 精品中文字幕视频| 亚洲av无码不卡| 成人在线视频一区| 黄页免费在线观看视频| 欧美视频在线视频精品| 欧美精品一区二区三区高清aⅴ| 麻豆亚洲av成人无码久久精品| 三级久久三级久久| 国产日韩欧美一区二区| 性欧美xxx69hd高清| 一区二区欧美激情| 亚洲综合免费视频| 久久影视一区二区| wwww.国产| 欧美久久影院| 91探花福利精品国产自产在线| 操你啦视频在线| 欧美性xxxxxx少妇| 久草视频手机在线| 成人免费毛片app| 十八禁视频网站在线观看| 欧美gayvideo| 国产视频99| 九七电影院97理论片久久tvb| 欧美日韩成人网| 韩国福利在线| 欧美日韩中文字幕| 久久久免费看片| 从欧美一区二区三区| 人妻丰满熟妇av无码区app| 影视一区二区| 亚洲a区在线视频| 五月婷婷在线观看| 在线观看亚洲a| 精品人伦一区二区三电影| 99伊人成综合| 国产麻豆日韩| 激情中国色综合| 98精品在线视频| 色老头视频在线观看| 亚洲加勒比久久88色综合| 国产精品.www| jiyouzz国产精品久久| 国产成人一区二区三区别| 国产精品嫩模av在线| 99久久精品免费看国产四区 | 亚洲精品一区二区三区蜜桃| 亚洲精品成人悠悠色影视| 亚洲黄色小说视频| 成人黄色a**站在线观看| 国产曰肥老太婆无遮挡| 日韩国产欧美| 麻豆久久久9性大片| xxxxxx欧美| 欧美激情videos| 毛片在线视频| 国产一区二区三区丝袜| 中文字字幕在线中文乱码| 午夜精品一区二区三区电影天堂| 小早川怜子一区二区的演员表| 久久久久久久久久久久久久久99| 亚洲天堂av网站| 中文在线一区| 奇米影视首页 狠狠色丁香婷婷久久综合 | 无码人妻丰满熟妇区毛片蜜桃精品| 日本中文一区二区三区| 各处沟厕大尺度偷拍女厕嘘嘘| 秋霞在线一区| 99porn视频在线| 成人动漫视频在线观看| 久久久久久尹人网香蕉| 青青青草网站免费视频在线观看| 亚洲第一区第二区| 亚洲女同志亚洲女同女播放| 制服丝袜激情欧洲亚洲| 一本到在线视频| 在线中文字幕不卡| 黄色一级视频免费看| 欧美性猛交xxxx乱大交3| 日韩欧美一级视频| 国产精品免费网站在线观看| 西西444www无码大胆| 久久久欧美精品sm网站| 最新中文字幕视频| www久久精品| 国产精欧美一区二区三区白种人| 黄色日韩在线| 欧美久久久久久久久久久久久久| 欧美福利一区| 亚洲理论电影在线观看| 亚洲精品孕妇| 午夜啪啪福利视频| 欧美综合精品| 乱色588欧美| 视频一区欧美| 亚洲国产欧美一区二区三区不卡| 欧美先锋资源| 日本免费在线视频观看| 欧美成人tv| 真人抽搐一进一出视频| 亚洲欧美日本国产专区一区| 日本人视频jizz页码69| 狠狠v欧美v日韩v亚洲ⅴ| 91猫先生在线| 老司机午夜精品视频在线观看| 轻点好疼好大好爽视频| 亚洲三级影院| 久久九九国产视频| 六月丁香综合在线视频| 日韩免费毛片视频| 免费观看久久久4p| 日韩欧美中文视频| 成人av在线一区二区| 亚洲精品国产熟女久久久| 国产精品萝li| 久久亚洲AV无码| 亚洲男人的天堂av| 性爱在线免费视频| 亚洲男同性恋视频| 国产无人区码熟妇毛片多| 欧美性猛交xxxxxx富婆| 午夜精品久久久久久久99| 欧美日韩三级视频| 亚洲精品福利网站| 亚洲欧美综合图区| 少女频道在线观看高清| 日韩免费中文字幕| 久久久久久亚洲精品美女| 极品尤物一区二区三区| 国产精品视屏| 四虎一区二区| 影音先锋亚洲电影| 伊人影院综合在线| 免费的国产精品| 亚洲av成人精品一区二区三区| 国产精品69久久久久水密桃| 国产成人在线综合| 99久久99久久综合| 亚洲一区二区三区四区五区六区 | 日韩视频中文字幕在线观看| 欧美日韩一区二区在线| 99视频国产精品免费观看a| 亚洲人成在线电影| 99热99re6国产在线播放| 91久久久久久久一区二区| 国产欧美日韩精品高清二区综合区| 亚洲精品久久久久久久蜜桃臀| 久久97超碰色| 国产女同无遮挡互慰高潮91| 91蜜桃婷婷狠狠久久综合9色| 69av.com| 亚洲大尺度视频在线观看| av资源吧首页| 在线不卡中文字幕| 精品欧美一区二区精品少妇| 国产亚洲精品美女久久久| av毛片午夜不卡高**水| 69堂成人精品视频免费| 都市激情久久| 特级西西人体www高清大胆| 免费看欧美女人艹b| 国产精品久久久久无码av色戒| 亚洲综合精品自拍| 999av视频| 久久精品国产69国产精品亚洲| 性感美女一区二区在线观看| 久久精品人人做人人爽电影| 1024成人| jjzzjjzz欧美69巨大| 亚洲国产中文字幕| 中文字幕在线播| 日韩国产精品亚洲а∨天堂免| 狂野欧美激情性xxxx欧美| 97超碰人人看人人 | 2020国产成人综合网| 国产真实的和子乱拍在线观看| 日韩视频一区在线观看| 天堂av一区二区三区| 欧美精品第一页在线播放| 欧美视频二区欧美影视| 久久香蕉视频网站| 久久亚洲风情| 国产男男chinese网站| 色婷婷久久久亚洲一区二区三区| 欧美日本网站| 久久成年人视频| 久久uomeier| 欧美18视频| 日韩二区三区四区| 天天摸日日摸狠狠添| 欧美日韩在线一区二区| 免费a级毛片在线播放| 亚洲aa中文字幕| 黄色成人精品网站| 亚洲色偷偷色噜噜狠狠99网| 亚洲成人在线观看视频| 日本大片在线观看| 国产精品18久久久久久首页狼| 波多野结衣欧美| 伊人久久大香线蕉午夜av| 精品无码三级在线观看视频| 伊人在线视频观看| 精品人在线二区三区| 九色porny视频在线观看| 欧美男人的天堂| 毛片av一区二区| 岛国毛片在线观看| 精品999在线播放| 日日av拍夜夜添久久免费| 欧美日韩在线免费观看视频| 国产成人免费在线| 日韩视频在线观看一区| 欧美精品一区二区三区蜜臀 | 国产精品欧美风情| 午夜精品影院| 亚洲一区二区观看| 欧美乱熟臀69xxxxxx| 国产天堂在线播放视频| 日本免费一区二区三区| 国产酒店精品激情| 久草视频一区二区| 欧美精品在线播放| 亚洲+小说+欧美+激情+另类| 男人添女人下部视频免费| 91亚洲精品乱码久久久久久蜜桃| 中文字幕第一页在线播放| 欧美寡妇偷汉性猛交| 久久99性xxx老妇胖精品| 久久久精品视频国产| 一本一本大道香蕉久在线精品| a级影片在线观看| 日本一区二区三区视频在线观看| 国产精品影视在线观看| 国产偷人爽久久久久久老妇app|