精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」

發(fā)布于 2024-6-3 10:03
瀏覽
0收藏

最近的一系列研究表明,純解碼器生成模型可以通過訓(xùn)練利用下一個 token 預(yù)測生成有用的表征,從而成功地生成多種模態(tài)(如音頻、圖像或狀態(tài) - 動作序列)的新序列,從文本、蛋白質(zhì)、音頻到圖像,甚至是狀態(tài)序列。


能夠同時生成多種模態(tài)輸出的多模態(tài)模型一般是通過某種形式的詞匯擴展(將多模態(tài)表征轉(zhuǎn)換為離散 token 并添加到模型的基本詞匯表中)來實現(xiàn)的,即在預(yù)訓(xùn)練階段或在后期微調(diào)階段進行跨模態(tài)對齊。


多模態(tài)預(yù)訓(xùn)練方法具有很強的性能優(yōu)勢(例如,一個模型可以原生理解多種模態(tài)),但也有缺點。例如,無法解決如何在預(yù)訓(xùn)練后添加新模態(tài)的問題,也缺乏靈活性,因為添加另一種模態(tài)需要從頭開始訓(xùn)練一個新的模型,并進行超參數(shù)搜索,以獲得模態(tài)之間的最佳訓(xùn)練數(shù)據(jù)混合比。因此,這種解決方案不適合小眾模態(tài),特別是 IMU、蛋白質(zhì)序列等。


或者,將詞匯擴展到另一種模態(tài)可以在一個從未見過該模態(tài)的模型上進行預(yù)訓(xùn)練后進行。只在文本模態(tài)下訓(xùn)練的解碼器模型可以在上下文中遵循指令并從樣本中學習,通常是通過微調(diào)將另一種模態(tài)(如音頻或圖像功能)嫁接到現(xiàn)有的強大文本骨干上,以利用文本模態(tài)的可表達性和人類用戶的可控性。這樣做的缺點是骨干網(wǎng)絡(luò)的文本到文本功能會被破壞,由此產(chǎn)生的模型只能執(zhí)行其經(jīng)過微調(diào)的跨模態(tài)任務(wù)。


總體來說,無論是預(yù)訓(xùn)練還是微調(diào),都需要大量對齊的跨模態(tài)數(shù)據(jù),因此這兩種方法都不適用于沒有足夠數(shù)量以對齊多模態(tài)數(shù)據(jù)的模態(tài)。


Google DeepMind 近期提出了模塊化設(shè)計的新型架構(gòu) Zipper,它由多個單模態(tài)預(yù)訓(xùn)練解碼器模型組成。利用豐富的無監(jiān)督單模態(tài)數(shù)據(jù),Zipper 可以在單一模態(tài)中預(yù)訓(xùn)練強大的純解碼器模型,然后利用交叉注意力將多個這樣的預(yù)訓(xùn)練解碼器「壓縮」在一起,并利用有限的跨模態(tài)數(shù)據(jù)進行微調(diào),實現(xiàn)多模態(tài)生成能力。預(yù)訓(xùn)練的純解碼器模型可以在新的多模態(tài)組合中靈活地重復(fù)使用和再利用。


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

  • 論文標題:Zipper: A Multi-Tower Decoder Architecture for Fusing Modalities
  • 論文鏈接:https://arxiv.org/pdf/2405.18669


這是第一項研究靈活組合模態(tài)的工作,通過組合單獨預(yù)訓(xùn)練的單模態(tài)解碼器來實現(xiàn)多模態(tài)生成能力。


雖然 Zipper 架構(gòu)可在多種模態(tài)和兩種以上模態(tài)的骨干上通用,但這項工作的重點放在了僅融合兩種骨干(語音和文本)的實驗設(shè)置上。論文展示了 Zipper 在同時跨模態(tài)生成文本(自動語音識別(ASR)任務(wù))和語音(文本到語音任務(wù)(TTS))方面的強大能力。


僅使用部分文本 - 語音對齊數(shù)據(jù)(低至原始數(shù)據(jù)的 1%)進行的實驗表明,首先在無標記數(shù)據(jù)上對骨干進行單模態(tài)預(yù)訓(xùn)練,與使用詞匯擴展方法進行微調(diào)相比,Zipper 可以依賴更少的對齊數(shù)據(jù),這為使用解碼器 - 解碼器架構(gòu)融合模態(tài)提供了可能性,對于成對數(shù)據(jù)量有限的生成任務(wù)非常有用。


接下來,讓我們看看論文細節(jié)。


模型


Zipper 架構(gòu)由兩個自回歸解碼器 tower(或主干)組成,它們通過門控交叉注意力層「壓縮」在一起。每個骨干使用下一個 token 預(yù)測功能分別對單個模態(tài)進行訓(xùn)練。


圖 1 顯示了 Zipper 架構(gòu)的概覽。與 CALM 類似,在解碼器骨干之間的每 i 層都插入了交叉注意力層。在這些有規(guī)律交錯的層中,一種模態(tài)的表征被交叉注意力到另一種模態(tài)中。這與 Flamingo [4] 編碼器 - 解碼器設(shè)置不同,后者只在一個 tower(編碼器)的最后一層定期交叉注意力到另一個 tower(解碼器)的各層。


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

在交叉注意力過程中,投影層被插入模態(tài)之間。從功能上講,這可以均衡骨干之間的嵌入維度大小差異。從語義上講,它還能實現(xiàn)從一種模態(tài)到另一種模態(tài)的表征轉(zhuǎn)換,尤其是當一個或兩個骨干被凍結(jié)時。此外,在每個骨干網(wǎng)的輸入嵌入之后,還直接加入了一個非線性輸入投影層,以便更好地調(diào)整輸入的單模態(tài)表征,用于多模態(tài)任務(wù)。


在第一個 Transformer 塊之前(嵌入層之后),插入兩個可學習的多層感知器(MLP)投影,然后對每個骨干進行 ReLU 轉(zhuǎn)換:


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

這樣做是為了讓單模態(tài)表征更好地適應(yīng)多模態(tài)設(shè)置。


讓 i_A 和 i_B 分別代表 A 層交叉到 B 層和 B 層交叉到 A 層的間隔。將 k 層單模解碼器 A 的隱藏表征法稱為 

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

,其中 d_A 是 transformer A 的隱藏維度;同樣,將 l 層單模解碼器 B 的隱藏表征法稱為 

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

,其中 d_B 是 transformer B 的相應(yīng)隱藏維度。設(shè) fcross (Q, K, V ) 是來自 [4] 的門控交叉注意力層,其后是前饋層,Q、K、V 分別是查詢、鍵和值。讓 

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

和 

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

分別代表 tower A 和 tower B 的線性前饋投影和全連接投影。


解碼器 A 中第 k 層的新表征多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)


具體如下:


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

同樣,解碼器 B 第 l 層的新表征多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)為:


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

最后,每個 tower 以一個 softmax 層(與同 tower 嵌入層共享)結(jié)束,以便利用下一個 token 預(yù)測任務(wù)將隱藏表征投射到(特定模態(tài) /tower)token 詞匯的概率分布中。


研究者將交叉注意力機制用于交錯序列的自動回歸訓(xùn)練,具體做法是只交叉關(guān)注原始線性序列中當前位置之前的另一種模態(tài)的數(shù)據(jù)。


在解碼過程中,輸出模態(tài)的序列是指定的(例如,[語音]、[文本]、[文本、語音])。模型以序列中的第一種模態(tài)生成輸出,直到遇到特殊的句末 token,這時才會切換到序列中的下一種模態(tài)。該過程一直持續(xù)到序列中的所有模態(tài)都被解碼為止。雖然可以擴展模型自動選擇輸出生成的模態(tài),但這一設(shè)置的通用化還需要后續(xù)的工作。


實驗


雖然 Zipper 可以擴展到任意數(shù)量的模態(tài),研究者率先評估了語音到文本生成和文本到語音(TTS)生成的自動語音識別(ASR)。


值得注意的是,雖然對 TTS 系統(tǒng)(合成語音)的標準評估依賴于人類反饋(平均意見分數(shù)),可以捕捉到語音的許多整體方面(如文本保真度和聲音質(zhì)量等),但這里的 TTS 評估只希望捕捉到架構(gòu)選擇對語義 token 建模和預(yù)測能力的影響。


表 1 列出了 ASR 任務(wù)的測試結(jié)果:


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

將 Zipper 與擴展詞匯量的單解碼器基線進行比較時,可以發(fā)現(xiàn) Zipper 在 test-clean 子集上的性能略好,而在噪音較高的語音 test-other 子集上的性能則略有下降,總體性能相當接近。


表 2 列出了在 LibriTTS 數(shù)據(jù)集的 test-clean 分割上進行 TTS 任務(wù)的結(jié)果。


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

可以看出,Zipper 模型明顯優(yōu)于單解碼器模型,Zipper S/128M unfrozen model 模型提高了 13 個 WER 點(相對誤差減少 40%),Zipper L/1B unfrozen model 模型提高了 12 個 WER 點(相對誤差減少 38%)。


研究者還觀察到,與使用凍結(jié)骨干網(wǎng)絡(luò)相比,在訓(xùn)練過程中解凍語音骨干網(wǎng)絡(luò)可持續(xù)改善所有尺寸 Zipper 模型的性能,這驗證了直覺 —— 微調(diào)語音骨干網(wǎng)絡(luò)的參數(shù)比僅依賴交叉注意力產(chǎn)生的模態(tài)對齊效果更好。


更多研究細節(jié),可參考原論文。


本文轉(zhuǎn)自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/F8wstkJyYiNJCbSqYq3Pbw??

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
国产91精品久久久久| 日韩精品一区二区三区蜜臀| 日本视频精品一区| 中文字幕资源网| 欧美激情91| 亚洲精品一区二区在线| 三级性生活视频| 99re6在线精品视频免费播放| 久久久久久黄色| 成人免费视频97| 久久黄色精品视频| 亚洲成人国产| 亚洲欧美另类人妖| 肉色超薄丝袜脚交| 漫画在线观看av| 亚洲人成人一区二区在线观看| 国产精品污www一区二区三区| 日本丰满少妇做爰爽爽| 精品999成人| 日韩视频在线观看免费| 97香蕉碰碰人妻国产欧美| 欧美极品在线| 色婷婷综合久久久久中文一区二区 | 日韩av在线资源| 特级黄色片视频| 成人免费毛片嘿嘿连载视频…| 亚洲电影一级黄| 国产高潮呻吟久久久| 狠狠狠综合7777久夜色撩人| 成人av电影在线| 亚洲aaa激情| 亚洲视频中文字幕在线观看| 亚洲在线国产日韩欧美| 国内精品久久影院| 91人妻一区二区三区蜜臀| www亚洲国产| 国产美女精品久久久| 5566中文字幕| 欧美三级美国一级| 亚洲精品自拍第一页| 黄色激情在线观看| 亚洲无线观看| 日韩免费视频一区| 欧美日韩一区二区区别是什么 | 青青草成人在线| 在线观看 中文字幕| 韩国精品一区二区三区| 久色乳综合思思在线视频| 老熟妇高潮一区二区三区| 999国产精品| 久久精品人人爽| fc2ppv在线播放| 国产精品国产一区| 最好看的2019年中文视频| 国产毛片欧美毛片久久久| 精品久久久久久久| 中文字幕精品在线视频| 天堂av免费在线| 99精品美女| 久久久精品999| 欧美日韩在线观看免费| 国产主播精品| 97在线视频免费| yjizz国产| 首页亚洲欧美制服丝腿| 国产精品免费看久久久香蕉| 一区二区美女视频| 国产精品自在欧美一区| 国产精品国产精品国产专区不卡| 欧美一级做性受免费大片免费| 99re66热这里只有精品3直播 | 国产精品三区四区| 天天干免费视频| 久久久亚洲精品一区二区三区| 欧美亚洲精品日韩| 午夜免费播放观看在线视频| 一区二区三区精品在线观看| 国产96在线 | 亚洲| 中文一区一区三区高中清不卡免费| 色视频一区二区| 999在线观看| 国产精品毛片久久久| 亚洲乱码一区av黑人高潮| eeuss中文字幕| 综合日韩在线| 欧美有码在线观看| 国产一区二区三区在线观看| 懂色av中文一区二区三区| 国产欧美日韩亚洲| av在线电影网| 亚洲欧美日韩中文播放| 久久国产精品视频在线观看| 日韩欧美精品一区二区综合视频| 欧美一激情一区二区三区| 天天插天天射天天干| 日韩一区二区中文| 97视频在线观看视频免费视频 | 日韩一级高清毛片| 性久久久久久久久久| 五月天久久久| 日本不卡视频在线播放| www.五月婷婷| 中文字幕乱码日本亚洲一区二区| 黄色特一级视频| av一区在线| 精品福利一二区| 欧美日韩国产精品一卡| 国产视频在线看| 亚洲卡通动漫在线| 国产精品乱码久久久久| 成人在线超碰| x99av成人免费| 你懂的国产在线| 国产高清一区日本| 日韩精品久久久毛片一区二区| av免费不卡| 日韩一级片在线播放| 992在线观看| 美女日韩在线中文字幕| 国产精品久久久久久久久久久久冷| 99re在线视频| 欧美三级xxx| 亚洲av人人澡人人爽人人夜夜| 婷婷综合亚洲| 国产精品欧美风情| 欧美欧美欧美| 午夜精品福利一区二区三区av | 污色网站在线观看| 青青一区二区| 欧美激情精品久久久久| 国产精品熟女久久久久久| 中文字幕国产一区| 红桃av在线播放| 国产精品一区二区三区美女| 欧美人在线观看| 国产又粗又黄又爽| 国产精品进线69影院| www.色就是色| 国产精品亚洲片在线播放| 国产91成人video| 亚洲 另类 春色 国产| 亚洲一区二区三区免费视频| 中文字幕av一区二区三区人妻少妇 | 欧美日韩偷拍视频| 国产精品 欧美精品| 色呦呦网站入口| **日韩最新| 久久这里只有精品99| 国产免费av电影| 亚洲天堂精品视频| 中文字幕一区二区在线观看视频 | 久久久91精品| 国产三级午夜理伦三级| 玉米视频成人免费看| 曰本三级日本三级日本三级| 欧美日韩国产在线一区| 99九九视频| brazzers在线观看| 日韩精品在线影院| 亚洲图片欧美日韩| 中文字幕色av一区二区三区| 免费网站在线观看黄| 欧美粗暴jizz性欧美20| 官网99热精品| 亚洲国产成人二区| 亚洲午夜激情免费视频| 亚洲手机在线观看| 亚洲精品美国一| 亚洲调教欧美在线| 日日嗨av一区二区三区四区| 正义之心1992免费观看全集完整版| www.久久久.com| 欧美精品激情blacked18| 头脑特工队2在线播放| 欧美日韩色一区| 久久黄色免费网站| 26uuu亚洲| 成人黄色一级大片| 亚洲毛片播放| 神马影院我不卡| 免费观看在线一区二区三区| 91精品国产九九九久久久亚洲| 国产在线免费观看| 7777精品伊人久久久大香线蕉经典版下载| 日韩一级片av| 久久影音资源网| 久久成年人网站| 99精品热6080yy久久| 亚洲精品8mav| 国内精品国产成人国产三级粉色| 日产日韩在线亚洲欧美| 国产淫片在线观看| 国产视频在线观看一区二区| 一本到在线视频| 亚洲超碰97人人做人人爱| av永久免费观看| 成人黄色一级视频| jizzzz日本| 国产视频一区免费看| 一区二区精品在线| 亚洲电影一级片| 亚洲综合色av| 成人国产精品入口免费视频| 国产做受高潮69| 精品欧美色视频网站在线观看| 精品视频在线观看日韩| 国产按摩一区二区三区| 欧美吻胸吃奶大尺度电影| 日韩精品成人一区| 亚洲青青青在线视频| 国产精品国产三级国产专业不| 成人动漫视频在线| 激情在线观看视频| 日韩激情一二三区| 国产一区二区在线视频播放| 亚洲香蕉av| 亚洲一区二区三区精品动漫| 久久99高清| 精品免费国产| 成人在线tv视频| 成人动漫视频在线观看免费| 国产精品久久久久久妇女| 78色国产精品| xxxx在线视频| 欧美大片第1页| 美女免费久久| 日韩视频免费观看| 最新真实国产在线视频| 亚洲性夜色噜噜噜7777| 五月激情婷婷网| 精品国产伦一区二区三区观看体验| 国产女人18毛片水18精| 7777精品伊人久久久大香线蕉| 中文字幕免费观看视频| 欧洲精品在线观看| 成年人晚上看的视频| 色先锋久久av资源部| 久久青青草原亚洲av无码麻豆| 精品国产乱码久久久久久婷婷| 国产亚洲欧美精品久久久久久| 日韩美女精品在线| www日韩在线| 亚洲乱码国产乱码精品精的特点 | 亚洲成人黄色影院| 国产无遮挡aaa片爽爽| 亚洲第一搞黄网站| 久草国产精品视频| 欧美日韩亚洲视频一区| 中文字幕亚洲乱码熟女1区2区| 天天综合色天天| 亚洲 欧美 日韩 综合| 精品国产91久久久久久老师| 在线观看国产亚洲| 日本丰满少妇一区二区三区| 成人黄色片在线观看| 777色狠狠一区二区三区| 国产99久久九九精品无码免费| 日韩午夜在线观看视频| 日本人妻熟妇久久久久久| 亚洲国产成人在线播放| 精品乱码一区二区三四区视频| 在线观看久久av| 99视频免费在线观看| 国语自产精品视频在线看一大j8| 性欧美freesex顶级少妇| 国产精品www| 高清一区二区中文字幕| 国产精品国产三级国产专区53| 首页亚洲中字| 亚洲欧洲精品一区| 午夜电影亚洲| 久久精品国产sm调教网站演员| 久久精品中文| 五月花丁香婷婷| 成人h动漫精品| 欧美黄色一级生活片| 亚洲精品乱码久久久久久久久| 日韩av在线播| 欧美日韩卡一卡二| 欧美 日韩 国产 成人 在线| 亚洲天堂色网站| 日日夜夜天天综合入口| 热久久美女精品天天吊色| 曰本一区二区| 蜜桃视频成人| 亚洲女同一区| 日韩久久一级片| 国产一区在线精品| 蜜桃无码一区二区三区| 日韩毛片在线免费观看| 日韩手机在线视频| 日韩欧美三级在线| 高清在线观看av| 久久免费高清视频| 欧美日韩破处视频| 九九九九九九精品| 永久91嫩草亚洲精品人人| 久久久久人妻精品一区三寸| 国产剧情av麻豆香蕉精品| 天天躁日日躁aaaxxⅹ| 伊人开心综合网| 中文字幕 自拍偷拍| 亚洲精品国产品国语在线| 国内精品久久久久久野外| 国产suv精品一区二区| 91蜜桃臀久久一区二区| 正义之心1992免费观看全集完整版| 中文在线一区| 久草免费资源站| 综合久久久久久| 午夜久久久久久久久久影院| 欧美精品一区二区三区久久久 | 一区二区三区丝袜| 亚洲无码精品在线播放| 亚洲欧美成人一区二区在线电影| 欧美女同一区| 91热精品视频| 四季av一区二区凹凸精品| 日韩黄色片视频| 91在线观看污| 天海翼一区二区| 精品国产欧美一区二区| 成人在线免费看黄| 国产日韩av在线播放| 国精一区二区| 成人黄色片视频| av亚洲产国偷v产偷v自拍| 豆国产97在线 | 亚洲| 日韩女优av电影| 中文字幕在线观看播放| 成人免费网站在线看| 99热国内精品| 五月天婷婷亚洲| 国产精品二三区| 一级黄色大毛片| 日韩一区二区福利| 欧美大陆国产| 宅男噜噜99国产精品观看免费| 美国一区二区三区在线播放| 国产传媒国产传媒| 欧美在线综合视频| av资源网在线观看| 成人a级免费视频| 99精品在线观看| 在线a免费观看| 亚洲已满18点击进入久久| 亚洲风情第一页| 久久久免费电影| 欧美aaaaa级| 久久精品99国产| 欧美激情一区不卡| 亚洲天堂网视频| 大量国产精品视频| 哺乳一区二区三区中文视频| 日本网站免费在线观看| 91丨九色丨蝌蚪丨老版| 无码人妻丰满熟妇区五十路| 亚洲天堂一区二区三区| 日韩黄色碟片| 国产一级大片免费看| 91色.com| 天堂免费在线视频| 久久精品久久精品亚洲人| 91精品国产乱码久久久竹菊| 国产乱子伦农村叉叉叉| 久久精品一区四区| 一级做a爱片性色毛片| 欧美精品手机在线| 国产日韩三级| 日本va中文字幕| 亚洲女与黑人做爰| 天天操天天爱天天干| 国产激情视频一区| 午夜片欧美伦| 国产一级黄色录像| 欧美性生活大片视频| 在线观看wwwxxxx| 另类小说综合网| 九一九一国产精品| 国产成年人免费视频| 中文字幕精品av| 国产精品流白浆在线观看| 日本爱爱免费视频| 亚洲一区视频在线观看视频| 国产香蕉视频在线看| 亚洲淫片在线视频| 亚洲一区二区三区免费在线观看 | 你懂的视频在线免费| 成人免费淫片aa视频免费| 在线视频精品| 成人免费精品动漫网站| 日韩精品在线影院| 欧美第一在线视频| 国产日韩成人内射视频| 一区二区三区 在线观看视频| 青青草av免费在线观看| 97操在线视频| 麻豆成人在线观看| 日本中文字幕在线| 久久久久久国产精品久久|