精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開(kāi)源版GPT-4o來(lái)了,AI大神Karpathy盛贊!67頁(yè)技術(shù)報(bào)告全公開(kāi)

人工智能 新聞
兩個(gè)多月前那個(gè)對(duì)標(biāo)GPT-4o的端到端語(yǔ)音模型,終于開(kāi)源了。大神Karpathy體驗(yàn)之后表示:nice!

前段時(shí)間技驚四座、劍指GPT-4o的實(shí)時(shí)語(yǔ)音模型Moshi,終于開(kāi)源了!

自然聊天,情緒豐富,隨意打斷,拒絕呆板和回合制!

大神Karpathy體驗(yàn)之后也表示:nice~

圖片

來(lái)自法國(guó)的初創(chuàng)團(tuán)隊(duì)Kyutai,于7月初發(fā)布了這個(gè)對(duì)標(biāo)GPT-4o的神奇的端到端語(yǔ)音模型。

2個(gè)多月后的今天,他們兌現(xiàn)了自己的承諾,將代碼、模型權(quán)重和一份超長(zhǎng)的技術(shù)報(bào)告一股腦開(kāi)源。

圖片

論文地址:https://kyutai.org/Moshi.pdf

開(kāi)源代碼:https://github.com/kyutai-labs/moshi

開(kāi)放權(quán)重:https://huggingface.co/collections/kyutai

在海的那一邊,GPT-4o的語(yǔ)音模式還沒(méi)有完全端上來(lái),這邊的模型已經(jīng)免費(fèi)送了。

大家可以去官網(wǎng)(moshi.chat)在線免費(fèi)體驗(yàn),相比于平時(shí)你問(wèn)我答的AI語(yǔ)音助手,這種「像人一樣」的聊天方式還是很奇特的。

圖片

整個(gè)模型的參數(shù)量為7.69B,pytorch平臺(tái)上只有bf16版本,如果在本地跑的話對(duì)顯存有一定要求,而candle上提供了8bit版本,mlx上更是有4bit版本可供使用。

圖片

moshiko和moshika表示男聲和女聲兩個(gè)版本

moshi作為一個(gè)全雙工口語(yǔ)對(duì)話框架,由幾部分組成:首先是Mimi,目前最先進(jìn)的流式神經(jīng)音頻編解碼器,能夠以完全流式的方式(延遲80毫秒)處理24 kHz音頻(12.5 Hz表示,帶寬1.1 kbps)。

圖片

然后是負(fù)責(zé)知識(shí)儲(chǔ)備、理解和輸出的Transformer部分,包括Helium Temporal Transformer和Depth Transformer。

其中小型的深度Transformer負(fù)責(zé)對(duì)給定時(shí)間步長(zhǎng)的碼本間依賴性進(jìn)行建模,而大型(7B參數(shù))時(shí)間Transformer對(duì)時(shí)間依賴性進(jìn)行建模。

作者還提出了「內(nèi)心獨(dú)白」:在訓(xùn)練和推理過(guò)程中,對(duì)文本和音頻進(jìn)行聯(lián)合建模。這使得模型能夠充分利用文本模態(tài)傳遞的知識(shí),同時(shí)保留語(yǔ)音的能力。

Moshi模擬兩種音頻流:一種來(lái)自Moshi自身(模型的輸出),另一種來(lái)自用戶(音頻輸入)。

圖片

沿著這兩個(gè)音頻流,Moshi預(yù)測(cè)與自己的語(yǔ)音(內(nèi)心獨(dú)白)相對(duì)應(yīng)的文本,極大地提高了生成的質(zhì)量。

Moshi的理論延遲為160毫秒(Mimi幀大小80毫秒 + 聲學(xué)延遲80毫秒),在L4 GPU上的實(shí)際總延遲僅有200毫秒。

技術(shù)細(xì)節(jié)

Moshi突破了傳統(tǒng)AI對(duì)話模型的限制:延遲、文本信息瓶頸和基于回合的建模。

Moshi使用較小的音頻語(yǔ)言模型增強(qiáng)了文本LLM主干,模型接收并預(yù)測(cè)離散的音頻單元,通過(guò)理解輸入并直接在音頻域中生成輸出來(lái)消除文本的信息瓶頸,同時(shí)又可以受益于底層文本LLM的知識(shí)和推理能力。

Moshi擴(kuò)展了之前關(guān)于音頻語(yǔ)言模型的工作,引入了第一個(gè)多流音頻語(yǔ)言模型,將輸入和輸出音頻流聯(lián)合顯式處理為兩個(gè)自回歸token流,完全消除了說(shuō)話者轉(zhuǎn)向的概念,從而允許在任意動(dòng)態(tài)(重疊和中斷)的自然對(duì)話上訓(xùn)練模型。

圖片

Helium

首先介紹負(fù)責(zé)文本部分的Helium,這里采用了一些比較通用的設(shè)計(jì)。

比如,在注意力層、前饋層和輸出線性層的輸入處使用RMS歸一化;使用旋轉(zhuǎn)位置嵌入(RoPE)、4,096 個(gè)token的上下文長(zhǎng)度和 FlashAttention來(lái)進(jìn)行高效訓(xùn)練;使用門(mén)控線性單元,SiLU作為門(mén)控函數(shù)。

Helium的分詞器基于SentencePiece的一元模型,包含32,000個(gè)主要針對(duì)英語(yǔ)的元素。

作者將所有數(shù)字拆分為單個(gè)數(shù)字,并使用字節(jié)退避來(lái)確保分詞器不會(huì)丟失信息。使用AdamW優(yōu)化器訓(xùn)練模型,先采用固定學(xué)習(xí)率,然后進(jìn)行余弦學(xué)習(xí)率衰減。

圖片

7B Helium語(yǔ)言模型和Moshi架構(gòu)訓(xùn)練的超參數(shù)

研究人員在公共英語(yǔ)數(shù)據(jù)的2.1T token上對(duì)模型進(jìn)行了預(yù)訓(xùn)練。

訓(xùn)練數(shù)據(jù)包括維基百科、Stack Exchange和大量科學(xué)文章,還依賴網(wǎng)絡(luò)爬取(特別是來(lái)自CommonCrawl的數(shù)據(jù))來(lái)擴(kuò)展數(shù)據(jù)集,并通過(guò)重復(fù)數(shù)據(jù)刪除、語(yǔ)言識(shí)別和質(zhì)量過(guò)濾等操作獲得高質(zhì)量的訓(xùn)練集。

Mimi

Mimi使用殘差矢量量化 (RVQ) 將音頻轉(zhuǎn)換為Moshi預(yù)測(cè)的離散token,并通過(guò)蒸餾將非因果的高級(jí)語(yǔ)義信息傳輸?shù)揭蚬P蜕傻膖oken中,從而允許對(duì)語(yǔ)義進(jìn)行流式編碼和解碼。

圖片

Mimi架構(gòu)的靈感來(lái)自SoundStream和Encodec,編碼器通過(guò)級(jí)聯(lián)殘差卷積塊將單通道波形投射到潛在表示。所有卷積都是因果的,因此該自動(dòng)編碼器可以以流方式運(yùn)行。

通過(guò)4個(gè)步幅為(4、5、6、8)的卷積塊 ,以及步幅為2的1D卷積,Mimi的編碼器將24kHz波形投影為每秒12.5幀、維度為512的潛在表示,而解碼器采用轉(zhuǎn)置卷積將潛在表示投射回24kHz音頻。

為了提高M(jìn)imi將語(yǔ)音編碼為緊湊表示的能力,研究人員在模型中添加了Transformer模塊,分別位于量化之前和之后。

每個(gè)Transformer塊包含8層、8個(gè)頭、使用RoPE位置編碼、250幀(20 秒)的有限上下文、模型維度512、MLP維度2048。使用 LayerScale來(lái)保證穩(wěn)定訓(xùn)練,對(duì)角線值初始化為0.01。兩個(gè)Transformer都使用因果屏蔽,保留了整個(gè)架構(gòu)與流式推理的兼容性。

Moshi

Moshi作為一種用于音頻語(yǔ)言建模的新架構(gòu),將Helium與較小的Transformer模型相結(jié)合,以分層和流式傳輸?shù)姆绞筋A(yù)測(cè)音頻token。

這種無(wú)條件音頻語(yǔ)言模型,提供了優(yōu)于非流模型的清晰度和音頻質(zhì)量,同時(shí)以流方式生成音頻。作者進(jìn)一步擴(kuò)展了這種架構(gòu),以并行模擬多個(gè)音頻流,從而可以在概念上和實(shí)踐上簡(jiǎn)單地處理具有任意動(dòng)態(tài)的全雙工對(duì)話。

圖片

在上圖的整體架構(gòu)中,RQ Transformer將長(zhǎng)度為K·S的扁平序列分解為大型時(shí)間Transformer的S個(gè)時(shí)間步長(zhǎng),生成上下文嵌入,用于在K個(gè)步驟上調(diào)節(jié)較小的深度Transformer。

與使用單個(gè)模型對(duì)展平序列進(jìn)行建模相比,這允許通過(guò)增加S來(lái)縮放到更長(zhǎng)的序列,或者通過(guò)增加K來(lái)縮放到更高的深度。

圖片

架構(gòu)中的深度Transformer有6層,維度為1024,16個(gè)注意力頭。與之前的工作不同,作者在深度Transformer中為線性層、投影層和全連接層使用每個(gè)索引的不同參數(shù)。

圖片

事實(shí)上,不同的子序列可能需要不同的轉(zhuǎn)換。鑒于該Transformer的尺寸較小,這對(duì)訓(xùn)練和推理時(shí)間都沒(méi)有影響,但上表結(jié)果顯示這種深度參數(shù)化是有益的。

內(nèi)心獨(dú)白

內(nèi)心獨(dú)白是一種用于音頻語(yǔ)言模型訓(xùn)練和推理的新方法,它通過(guò)在音頻token之前預(yù)測(cè)時(shí)間對(duì)齊的文本token,顯著提高了生成語(yǔ)音的事實(shí)性和語(yǔ)言質(zhì)量。

Moshi允許推理來(lái)自用戶音頻和Moshi音頻的非語(yǔ)言信息,但這與Moshi在其語(yǔ)音輸出中生成文本并不矛盾。根據(jù)過(guò)去的觀察,從粗到細(xì)的生成(從語(yǔ)義到聲學(xué)token)對(duì)于生成一致的語(yǔ)音至關(guān)重要。

圖片

作者利用這種層次結(jié)構(gòu),使用文本token作為語(yǔ)義token的每個(gè)時(shí)間步前綴。實(shí)驗(yàn)表明,這不僅極大地提高了生成語(yǔ)音的長(zhǎng)度和質(zhì)量,還展示了單個(gè)延遲超參數(shù)如何允許從ASR模型切換到TTS模型,而不會(huì)改變損失、架構(gòu)或訓(xùn)練數(shù)據(jù)。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2024-09-19 13:34:27

AI開(kāi)源模型

2024-08-14 14:30:00

AI訓(xùn)練

2024-07-31 13:20:14

2025-04-16 09:15:00

AI模型數(shù)據(jù)

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2024-05-14 11:29:15

2025-04-08 02:26:00

2025-08-11 08:42:00

GPT-5AI模型

2025-05-26 09:05:00

2025-08-07 14:05:40

OpenAI大模型開(kāi)源

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-06-21 09:58:38

2024-08-13 13:50:00

數(shù)據(jù)模型

2025-06-23 07:05:00

AI智能體虛擬社區(qū)

2024-09-23 15:10:00

2024-05-20 08:20:00

OpenAI模型

2024-11-28 15:51:19

GPT-4o微軟

2025-08-05 09:15:15

2024-05-24 14:04:04

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

久久精品国产精品青草| 日韩欧乱色一区二区三区在线| 国产精品一二一区| 91精品国产精品| 国产精品一二三区在线观看| 日本电影久久久| 亚洲在线视频网站| 区一区二区三区中文字幕| 国产精品人妻一区二区三区| 制服诱惑一区二区| 俺去亚洲欧洲欧美日韩| 中文字幕在线视频播放| 日本在线精品| 亚洲成人午夜影院| 一本久道久久综合狠狠爱亚洲精品| 国产黄色片免费观看| 极品av少妇一区二区| 在线播放亚洲激情| www.男人天堂| 伊人久久大香线蕉综合影院首页| 伊人性伊人情综合网| 日韩国产一区久久| 国模私拍视频在线| 激情综合网最新| 国内精品在线一区| 69夜色精品国产69乱| 在线日本制服中文欧美| 亚洲精品一线二线三线| 亚洲精品第三页| 精品日韩视频| 精品欧美aⅴ在线网站| www.国产亚洲| 在线观看免费版| 91首页免费视频| 国产欧美一区二区三区精品观看| 国产.欧美.日韩| 国产精品亚洲аv天堂网| 国产精品50页| 亚洲国产精品成人| 在线观看久久久久久| 国产人妻人伦精品1国产丝袜| 99热99re6国产在线播放| 五十路六十路七十路熟婆| av在线网址导航| 黄色网址视频在线观看| 久久精品一区二区三区不卡牛牛| 成人3d动漫一区二区三区91| 亚洲天堂手机版| 日韩中文字幕亚洲一区二区va在线| 欧美精品18videosex性欧美| 动漫性做爰视频| 日韩啪啪电影网| 伊人久久男人天堂| 人妻少妇无码精品视频区| 欧美调教视频| 日韩av在线免费看| 国产精品久久不卡| 偷窥自拍亚洲色图精选| 精品一区二区亚洲| 成人免费无遮挡无码黄漫视频| 琪琪久久久久日韩精品| 亚洲精品suv精品一区二区| 波多野结衣三级视频| 日韩高清在线观看一区二区| 日韩欧美一级二级三级久久久| 欧美激情国内自拍| 日韩精品一区二区三区中文| 日韩小视频在线观看专区| 欧美视频亚洲图片| 中文字幕亚洲在线观看| 亚洲第一福利网站| 亚洲熟女乱综合一区二区三区| 清纯唯美亚洲经典中文字幕| 亚洲人永久免费| 成年人看的免费视频| 国产精品久久久久9999赢消| 另类色图亚洲色图| 久久精品人妻一区二区三区| 国产亚洲成人一区| 国产成人在线一区二区| 91丨九色丨蝌蚪丨对白| 国产v综合v亚洲欧| 精品国产一区二区三区久久久久久| 四虎在线免费看| 国产亚洲精品福利| 9999在线观看| 毛片在线导航| 色播五月激情综合网| 中文字幕在线综合| 亚洲成人五区| 国产午夜一区二区| 精品无码一区二区三区蜜臀| 精品999网站| 国产精品成人av性教育| 国产毛片毛片毛片毛片| 丁香五精品蜜臀久久久久99网站| 久久精品日产第一区二区三区精品版 | 亚洲经典一区二区三区| 91在线码无精品| 在线观看日韩片| 超碰高清在线| 欧美人与禽zozo性伦| yjizz视频| 日韩欧美视频| 欧美最顶级丰满的aⅴ艳星| 一级久久久久久久| 99精品视频一区二区| 一区二区三区不卡在线| av在线最新| 欧美电影一区二区三区| 无码人妻精品一区二区三区温州| 国产韩日影视精品| 欧美在线视频一区| 国内老熟妇对白xxxxhd| 国产欧美日韩在线视频| 成人精品视频在线播放| 国产精品第一| 国产午夜精品麻豆| 精品视频一区二区在线观看| 蜜桃在线一区二区三区| 国产综合av一区二区三区| 中文日本在线观看| 欧美午夜片在线免费观看| 成人三级做爰av| 久久精品高清| 日本一区二区在线播放| 国产成人手机在线| 亚洲欧美日韩系列| 999精品视频在线| 欧美国产不卡| 性欧美xxxx| 精品人妻少妇嫩草av无码专区| 欧美高清在线精品一区| 日韩精品一区二区三区久久| 岛国av一区| 久久777国产线看观看精品| 97caocao| 国产精品久久久久影院| 亚洲欧美日韩一级| 天天躁日日躁成人字幕aⅴ| 欧美大片免费观看| 午夜精品久久久久久久99| 亚洲视频一区在线观看| 在线看免费毛片| 久久人体视频| 国产欧美亚洲精品| 日本在线观看免费| 欧美嫩在线观看| 国产精品久久久免费看| 免费人成在线不卡| 亚洲成人自拍视频| 久久久久黄色| 久久久精品视频成人| 国产日本精品视频| 亚洲欧美aⅴ...| 久久婷婷中文字幕| 国产综合精品一区| 51精品国产人成在线观看| av网址在线免费观看| 在线播放91灌醉迷j高跟美女 | 美国黄色a级片| 99精品视频免费全部在线| 国产精品免费一区二区三区在线观看| 欧美wwww| 亚洲精品大尺度| 日韩黄色在线播放| 久久久99久久精品欧美| 无人在线观看的免费高清视频 | 日本少妇精品亚洲第一区| 欧美激情乱人伦一区| 少妇精品视频一区二区| 欧美性猛交xxxx久久久| 国产又黄又粗视频| 国精品**一区二区三区在线蜜桃| 麻豆映画在线观看| 久久男人av| 国产精品嫩草影院久久久| 日本不卡视频| 欧美成人vr18sexvr| 亚洲另类欧美日韩| 中文字幕国产一区| 亚洲热在线视频| 亚洲免费成人| 色狠狠久久av五月综合| 精品久久免费| 538国产精品一区二区免费视频| 国产黄色免费在线观看| 日韩一区二区三区视频在线观看| 国产一级二级三级视频| 久久久综合视频| 一区二区三区四区毛片| 亚洲精品免费观看| 亚洲午夜精品一区二区| 国产精品网站在线看| 国产精彩精品视频| 黄色在线观看视频网站| 中文字幕欧美日韩精品| 韩国av免费在线| 欧美色倩网站大全免费| 精品少妇爆乳无码av无码专区| 国产免费久久精品| 岛国精品一区二区三区| 免费在线欧美视频| 国产欧美日韩网站| 婷婷中文字幕一区| 免费av一区二区三区| 精品久久亚洲| 国产精品99一区| аⅴ资源天堂资源库在线| 日韩网站在线观看| 青青草在线视频免费观看| 日韩一区二区三区免费观看| 无码人妻一区二区三区免费 | 69亚洲精品久久久蜜桃小说| 亚洲精品国产a久久久久久 | 国产麻豆精品久久| 国产精品二区三区四区| 久久精品资源| 国产精品久久91| 九九色在线视频| www国产精品视频| 国产天堂在线| 亚洲精品福利免费在线观看| 国内精品久久久久久久久久久| 欧美色综合天天久久综合精品| 毛片视频网站在线观看| 亚洲一本大道在线| 91在线播放观看| 亚洲欧洲www| 亚洲av毛片基地| 久久精品一区二区三区不卡| 亚洲第九十七页| 成人福利电影精品一区二区在线观看| 捷克做爰xxxⅹ性视频| 麻豆精品在线看| 男人插女人下面免费视频| 免费亚洲网站| 国产裸体舞一区二区三区| 国产欧美一区二区色老头| 日韩一级性生活片| 亚洲国产高清一区| 成人黄色大片网站| 怡红院精品视频在线观看极品| 中文字幕在线中文| 国产精品大片| 日韩黄色片在线| 精品动漫av| 99热亚洲精品| 亚洲作爱视频| 精品www久久久久奶水| 久久久久免费| 一级特黄性色生活片| 日韩国产欧美三级| 男女男精品视频站| 久久精品国产一区二区三区免费看 | 久久久久天天天天| 要久久电视剧全集免费| 日韩精品伦理第一区| 日韩成人免费| 亚洲一区三区视频在线观看| 国产精品二区不卡| 天天做天天躁天天躁| 亚洲欧洲视频| 国产精品免费观看久久| 日本午夜精品一区二区三区电影| 九九热在线免费| 精品亚洲porn| 少妇伦子伦精品无吗| 91美女在线视频| 亚洲精品国产91| 亚洲免费观看在线视频| av资源吧首页| 色吊一区二区三区| 国产精品视频在线观看免费| 日韩欧美国产不卡| 香蕉视频黄色片| 最好看的2019年中文视频| 黄色国产网站在线播放| 国内揄拍国内精品少妇国语| 不卡一二三区| 成人春色激情网| 伊人久久大香线蕉av超碰| 欧美日韩精品久久| 国产精品久久观看| 国产精品333| 另类的小说在线视频另类成人小视频在线 | 精品一区二区三区蜜桃| 亚洲一级Av无码毛片久久精品| 久久这里只精品最新地址| 国产精品综合激情| 亚洲地区一二三色| 中文字幕久久久久| 欧美videos中文字幕| 国产综合在线观看| 大胆人体色综合| 成人做爰视频www网站小优视频| 91精品在线观| 日韩有码av| 超碰在线免费观看97| 国产欧美亚洲一区| 下面一进一出好爽视频| 久久久精品影视| 黄色一级视频在线观看| 欧美亚一区二区| 婷婷久久久久久| 久久亚洲欧美日韩精品专区| 成人性教育av免费网址| 粉嫩av一区二区三区免费观看| 欧美日韩国产一区二区三区不卡| 97中文字幕在线| 久久99精品国产麻豆不卡| 50一60岁老妇女毛片| 最新热久久免费视频| 欧美男人亚洲天堂| 亚洲福利小视频| 免费黄色在线网站| 国产不卡在线观看| 精品视频自拍| 久久久国内精品| 九九精品视频在线看| 久久久久久久久久久久| 调教+趴+乳夹+国产+精品| 国产手机av在线| 日韩在线观看网址| 成人性生交大片免费观看网站| 国产精品毛片va一区二区三区| 91欧美日韩| 亚洲精品午夜在线观看| 中文乱码免费一区二区| 日日夜夜操视频| 亚洲精品色婷婷福利天堂| 91吃瓜在线观看| 肥熟一91porny丨九色丨| 欧美69视频| 手机在线观看日韩av| 中文字幕亚洲欧美在线不卡| 中文字幕av片| 一区三区二区视频| 久久天堂av| 视频在线一区二区三区| 肉丝袜脚交视频一区二区| 久久中文字幕人妻| 欧美香蕉大胸在线视频观看| 婷婷在线免费观看| 国内揄拍国内精品| 偷窥自拍亚洲色图精选| 日本黄网站免费| 久久久精品人体av艺术| 亚洲天堂五月天| 国产一区二区三区视频| 国产精品亚洲成在人线| 色中文字幕在线观看| 精品一区二区三区香蕉蜜桃 | 亚洲日韩视频| 国产xxxx视频| 精品福利樱桃av导航| 五月婷婷丁香网| 奇门遁甲1982国语版免费观看高清| 日日狠狠久久偷偷综合色| 久久美女福利视频| 久久青草国产手机看片福利盒子 | 91超碰在线免费| 久久精品国产美女| 视频一区二区不卡| 男女男精品视频网站| 日韩限制级电影在线观看| 成年人黄色大片在线| 日本一区高清不卡| 韩国视频一区二区| 精品无码久久久久久久| 亚洲精品一区二区久| 日韩午夜视频在线| 久久手机在线视频| 久久老女人爱爱| 国产又黄又粗又硬| 97香蕉超级碰碰久久免费的优势| 自拍偷拍精品| 日本美女视频一区| 亚洲成a人在线观看| 精品99又大又爽又硬少妇毛片| 91精品美女在线| 亚洲国产一区二区三区高清 | 亚洲乱码国产乱码精品精98午夜| 亚洲乱色熟女一区二区三区| 欧美一区二区视频97| 欧美高清视频在线观看mv| 丰满岳乱妇一区二区| 91久久奴性调教| 污污在线观看| 欧洲亚洲一区| 国产a视频精品免费观看| 天堂网中文字幕| 欧美精品做受xxx性少妇| 窝窝社区一区二区| 欧美激情第一区| 日韩人体视频一二区| 中国av在线播放| 亚洲二区自拍| 久久品道一品道久久精品| 成人黄色免费视频|