精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在圖像、視頻生成上,語(yǔ)言模型首次擊敗擴(kuò)散模型,tokenizer是關(guān)鍵

人工智能 新聞
為什么語(yǔ)言模型在視覺生成方面落后于擴(kuò)散模型?來(lái)自谷歌、CMU 的研究表明,tokenizer 是關(guān)鍵。

大型語(yǔ)言模型(LLM 或 LM)一開始是用來(lái)生成語(yǔ)言的,但隨著時(shí)間的推移,它們已經(jīng)能夠生成多種模態(tài)的內(nèi)容,并在音頻、語(yǔ)音、代碼生成、醫(yī)療應(yīng)用、機(jī)器人學(xué)等領(lǐng)域開始占據(jù)主導(dǎo)地位。

當(dāng)然,LM 也能生成圖像和視頻。在此過(guò)程中,圖像像素會(huì)被視覺 tokenizer 映射為一系列離散的 token。然后,這些 token 被送入 LM transformer,就像詞匯一樣被用于生成建模。盡管 LM 在視覺生成方面取得了顯著進(jìn)步,但 LM 的表現(xiàn)仍然不如擴(kuò)散模型。例如,在圖像生成的金標(biāo)基準(zhǔn) —ImageNet 數(shù)據(jù)集上進(jìn)行評(píng)估時(shí),最佳語(yǔ)言模型的表現(xiàn)比擴(kuò)散模型差了 48% 之多(以 256?256 分辨率生成圖像時(shí),F(xiàn)ID 為 3.41 對(duì) 1.79)。

為什么語(yǔ)言模型在視覺生成方面落后于擴(kuò)散模型?來(lái)自谷歌、CMU 的研究者認(rèn)為,主要原因是缺乏一個(gè)良好的視覺表示,類似于我們的自然語(yǔ)言系統(tǒng),以有效地建模視覺世界。為了證實(shí)這一假設(shè),他們進(jìn)行了一項(xiàng)研究。

論文鏈接:https://arxiv.org/pdf/2310.05737.pdf

這項(xiàng)研究表明,在相同的訓(xùn)練數(shù)據(jù)、可比模型大小和訓(xùn)練預(yù)算條件下,利用良好的視覺 tokenizer,掩碼語(yǔ)言模型在圖像和視頻基準(zhǔn)的生成保真度和效率方面都超過(guò)了 SOTA 擴(kuò)散模型。這是語(yǔ)言模型在標(biāo)志性的 ImageNet 基準(zhǔn)上擊敗擴(kuò)散模型的首個(gè)證據(jù)。

需要強(qiáng)調(diào)的是,研究者的目的不是斷言語(yǔ)言模型是否優(yōu)于其他模型,而是促進(jìn) LLM 視覺 tokenization 方法的探索。LLM 與其他模型(如擴(kuò)散模型)的根本區(qū)別在于,LLM 使用離散的潛在格式,即從可視化 tokenizer 獲得的 token。這項(xiàng)研究表明,這些離散的視覺 token 的價(jià)值不應(yīng)該被忽視,因?yàn)樗鼈兇嬖谝韵聝?yōu)勢(shì): 

1、與 LLM 的兼容性。token 表示的主要優(yōu)點(diǎn)是它與語(yǔ)言 token 共享相同的形式,從而可以直接利用社區(qū)多年來(lái)為開發(fā) LLM 所做的優(yōu)化,包括更快的訓(xùn)練和推理速度、模型基礎(chǔ)設(shè)施的進(jìn)步、擴(kuò)展模型的方法以及 GPU/TPU 優(yōu)化等創(chuàng)新。通過(guò)相同的 token 空間統(tǒng)一視覺和語(yǔ)言可以為真正的多模態(tài) LLM 奠定基礎(chǔ),后者可以在我們的視覺環(huán)境中理解、生成和推理。

2、壓縮表示。離散 token 可以為視頻壓縮提供一個(gè)新的視角。可視化 token 可以作為一種新的視頻壓縮格式,以減少數(shù)據(jù)在互聯(lián)網(wǎng)傳輸過(guò)程中占用的磁盤存儲(chǔ)和帶寬。與壓縮的 RGB 像素不同,這些 token 可以直接輸入生成模型,繞過(guò)傳統(tǒng)的解壓縮和潛在編碼步驟。這可以加快生成視頻應(yīng)用的處理速度,在邊緣計(jì)算情況下尤其有益。

3、視覺理解優(yōu)勢(shì)。先前的研究表明,離散 token 在自監(jiān)督表示學(xué)習(xí)中作為預(yù)訓(xùn)練目標(biāo)是有價(jià)值的,如 BEiT 和 BEVT 中所討論的那樣。此外,研究發(fā)現(xiàn),使用 token 作為模型輸入提高了魯棒性和泛化性。

在這篇論文中,研究者提出了一個(gè)名為 MAGVIT-v2 的視頻 tokenizer,旨在將視頻(和圖像)映射為緊湊的離散 token。

該模型建立在 VQ-VAE 框架內(nèi)的 SOTA 視頻 tokenizer——MAGVIT 基礎(chǔ)上。基于此,研究者提出了兩種新技術(shù):1)一種新穎的無(wú)查找(lookup-free)量化方法,使得大量詞匯的學(xué)習(xí)成為可能,以提高語(yǔ)言模型的生成質(zhì)量;2)通過(guò)廣泛的實(shí)證分析,他們確定了對(duì) MAGVIT 的修改方案,不僅提高了生成質(zhì)量,而且還允許使用共享詞匯表對(duì)圖像和視頻進(jìn)行 token 化。

實(shí)驗(yàn)結(jié)果表明,新模型在三個(gè)關(guān)鍵領(lǐng)域優(yōu)于先前表現(xiàn)最好的視頻 tokenizer——MAGVIT。首先,新模型顯著提高了 MAGVIT 的生成質(zhì)量,在常見的圖像和視頻基準(zhǔn)上刷新了 SOTA。其次,用戶研究表明,其壓縮質(zhì)量超過(guò)了 MAGVIT 和當(dāng)前的視頻壓縮標(biāo)準(zhǔn) HEVC。此外,它與下一代視頻編解碼器 VVC 相當(dāng)。最后,研究者表明,與 MAGVIT 相比,他們的新 token 在兩個(gè)設(shè)置和三個(gè)數(shù)據(jù)集的視頻理解任務(wù)中表現(xiàn)更強(qiáng)。

方法介紹

本文引入了一種新的視頻 tokenizer,旨在將視覺場(chǎng)景中的時(shí)間 - 空間動(dòng)態(tài)映射為適合語(yǔ)言模型的緊湊離散 token。此外,該方法建立在 MAGVIT 的基礎(chǔ)上。

隨后,該研究重點(diǎn)介紹了兩種新穎的設(shè)計(jì):無(wú)查找量化(Lookup-Free Quantization ,LFQ)和 tokenizer 模型的增強(qiáng)功能。

無(wú)查找量化

最近一段時(shí)間,VQ-VAE 模型取得巨大進(jìn)展,但該方法存在一個(gè)缺點(diǎn),即重建質(zhì)量的改進(jìn)與后續(xù)生成質(zhì)量之間的關(guān)系不明確。很多人誤以為改進(jìn)重建就等于改進(jìn)語(yǔ)言模型的生成,例如,擴(kuò)大詞匯量可以提高重建質(zhì)量。然而,這種改進(jìn)僅適用于詞匯量較小時(shí)的生成,而詞匯量非常大時(shí)會(huì)損害語(yǔ)言模型的性能。

本文將 VQ-VAE codebook 嵌入維度縮減到 0 ,即 Codebook 圖片被替換為一個(gè)整數(shù)集圖片,其中圖片

與 VQ-VAE 模型不同的是,這種新設(shè)計(jì)完全消除了對(duì)嵌入查找的需要,因此將其稱為 LFQ。本文發(fā)現(xiàn) LFQ 可以通過(guò)增加詞匯量,提高語(yǔ)言模型的生成質(zhì)量。如圖 1 中的藍(lán)色曲線所示,隨著詞匯量的增加,重建和生成都不斷改進(jìn) —— 這是當(dāng)前 VQ-VAE 方法中未觀察到的特性。

到目前為止,可用的 LFQ 方法很多,但本文討論了一種簡(jiǎn)單的變體。具體來(lái)說(shuō),LFQ 的潛在空間被分解為單維變量的笛卡爾積,即 圖片。假定給定一個(gè)特征向量圖片,量化表示  q (z) 的每個(gè)維度從以下獲得:

圖片

對(duì)于 LFQ ,q (z) 的 token 索引為:

圖片

除此以外,本文在訓(xùn)練過(guò)程中還增加了熵懲罰:

視覺 tokenizer 模型的改進(jìn)

聯(lián)合圖像 - 視頻 tokenization。為了構(gòu)建聯(lián)合圖像 - 視頻 tokenizer,需要一種新的設(shè)計(jì)。本文發(fā)現(xiàn) 3D CNN 的性能比空間 transformer 更好。

本文探索了兩種可行的設(shè)計(jì)方案,如圖 2b 將 C-ViViT 與 MAGVIT 進(jìn)行結(jié)合;圖 2c 使用時(shí)間因果 3D 卷積來(lái)代替常規(guī) 3D CNN。 

表 5a 對(duì)圖 2 中的設(shè)計(jì)進(jìn)行了經(jīng)驗(yàn)比較,發(fā)現(xiàn)因果 3D CNN 表現(xiàn)最好。

除了使用因果 3D CNN 層之外,本文還進(jìn)行了其他架構(gòu)的修改,以提高 MAGVIT 性能,比如本文將編碼器下采樣器從平均池化更改為跨步卷積;又比如在解碼器中每個(gè)分辨率的殘差塊之前添加一個(gè)自適應(yīng)組歸一化層等。

實(shí)驗(yàn)結(jié)果

實(shí)驗(yàn)從三個(gè)部分驗(yàn)證了本文提出的 tokenizer 的性能:視頻和圖像生成、視頻壓縮,動(dòng)作識(shí)別。圖 3 直觀地比較了 tokenizer 與先前研究的結(jié)果對(duì)比。

視頻生成。表 1 顯示了本文模型在兩個(gè)基準(zhǔn)測(cè)試中都超越了所有現(xiàn)有技術(shù),證明了良好的視覺 tokenizer 在使 LM 生成高質(zhì)量視頻方面發(fā)揮著重要作用。

圖片

圖 4 顯示了模型的定性樣本。

圖片

圖像生成。本文在標(biāo)準(zhǔn) ImageNet 類條件設(shè)置下對(duì) MAGVIT-v2 的圖像生成結(jié)果進(jìn)行了評(píng)估。結(jié)果表明本文模型在采樣質(zhì)量(ID 和 IS)和推理時(shí)間效率(采樣步驟)方面都超過(guò)了表現(xiàn)最好的擴(kuò)散模型。

圖片

圖 5 為可視化結(jié)果。

圖片

視頻壓縮。結(jié)果如表 3 所示,本文模型在所有指標(biāo)上都優(yōu)于 MAGVIT,并且在 LPIPS 上優(yōu)于所有方法。

視頻理解。如表 4 所示,MAGVIT-v2 在這些評(píng)估中優(yōu)于之前最好的 MAGVIT。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2023-10-16 12:31:17

人工智能數(shù)據(jù)

2025-05-16 13:18:37

2025-07-21 09:03:00

模型AI訓(xùn)練

2022-10-19 14:17:32

圖像模型

2024-09-24 15:51:02

2024-12-26 11:48:27

2025-07-14 08:51:00

2025-08-07 07:56:52

2024-03-20 00:00:00

StabilityAI開源人工智能

2024-05-10 07:58:03

2025-11-17 09:22:09

2025-04-09 13:11:27

2023-12-20 14:54:29

谷歌Gen-2視頻

2024-12-04 11:07:09

2024-09-10 11:21:30

2024-11-25 08:20:00

2023-04-03 10:04:44

開源模型

2025-04-22 09:17:00

模型生成開源

2025-04-16 09:20:00

虛擬模型數(shù)字
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

综合久久国产| 97免费视频在线| 1314成人网| 91老司机福利在线| 日本一区免费视频| 亚洲影视中文字幕| 国产手机在线视频| 91久久电影| 亚洲精品视频在线观看视频| 精品久久久久av| 亚洲精品天堂| 欧美国产精品一区| 国产精品一区视频| 一级久久久久久久| 国产精品一区亚洲| 久久精品久久久久久| 懂色av粉嫩av蜜乳av| av一级久久| 欧美专区日韩专区| 秋霞无码一区二区| 哥也色在线视频| 国产欧美一区二区精品忘忧草| 成人动漫在线观看视频| 中文字幕无码乱码人妻日韩精品| 亚洲第一区色| 欧美成人精品在线观看| 亚洲无人区码一码二码三码的含义| 一区二区三区视频播放| 欧美日韩国产中文| 女性隐私黄www网站视频| 黑人精品视频| 亚洲三级在线免费观看| 婷婷五月色综合| 秋霞网一区二区| 国产一区二区三区国产| 国产精品夜间视频香蕉| 日韩欧美亚洲一区二区三区| 亚洲成人免费| 日韩视频中文字幕| 亚洲精品国产精品乱码在线观看| 伊人久久大香线蕉无限次| 亚洲电影免费观看| 丰满人妻一区二区三区免费视频棣 | 国产毛片精品视频| 91最新在线免费观看| 国产又粗又黄又爽视频| 久久成人18免费观看| 国产精品久久视频| 中文字幕免费高清在线观看| 天堂影院一区二区| 欧美最近摘花xxxx摘花| 免费在线观看黄网站| 亚洲精品专区| 51久久精品夜色国产麻豆| 日韩av一二三区| 99视频一区| 欧美在线国产精品| 二区视频在线观看| 三级一区在线视频先锋 | 2020国产成人综合网| 精品视频导航| 可以在线观看的av| 欧美激情一区二区三区四区| 亚洲精品一区二区三区樱花| 蜜桃视频网站在线观看| 亚洲色图丝袜美腿| 国产免费内射又粗又爽密桃视频| www欧美xxxx| 午夜电影一区二区| 99免费视频观看| 欧美日韩免费电影| 欧美一区二区视频网站| 极品白嫩的小少妇| 久草精品在线| 日韩中文字幕网站| 成人免费看片98| 久久久久久久高潮| 国产精品美女免费看| 国产乱人乱偷精品视频| 国产99久久久精品| 欧美婷婷久久| 国内精品久久久久久野外| 伊人色综合久久天天人手人婷| 精品久久一二三| 九七电影院97理论片久久tvb| 欧美一区二区三区四区高清| 亚洲久久久久久| 成人a'v在线播放| 欧美极品xxxx| 无码免费一区二区三区| 国产尤物一区二区在线 | 欧美一区二区麻豆红桃视频| 精品国产自在精品国产浪潮| 亚洲国产精品成人无久久精品| 欧美亚洲一区| 成人激情春色网| 无码精品在线观看| 国产精品免费久久久久| 久草视频国产在线| jizz欧美| 亚洲精品午夜精品| 中文字幕av久久爽av| 免费久久99精品国产自在现线| 国产精品丝袜高跟| 天天色综合久久| 自拍偷拍亚洲综合| 99热成人精品热久久66| 亚洲国产aⅴ精品一区二区| 亚洲视频999| 久久精品第一页| 久久机这里只有精品| 精品视频高清无人区区二区三区| 黄av在线免费观看| 欧美亚洲国产bt| 51调教丨国产调教视频| 欧美日一区二区在线观看 | 欧美乱人伦中文字幕在线| 亚洲 欧美 日韩 在线| 风间由美性色一区二区三区 | 懂色av粉嫩av蜜乳av| 午夜久久福利| 91精品免费看| 国产高清视频在线播放| 午夜成人在线视频| 亚洲乱妇老熟女爽到高潮的片| 日韩欧美自拍| 国产精品你懂得| 欧美18xxxxx| 欧美日韩亚洲视频一区| 日韩综合第一页| 午夜久久黄色| av免费精品一区二区三区| 蜜桃视频在线观看www社区| 欧美无人高清视频在线观看| 久久精品国产亚洲av久| 国产视频一区三区| 精品国产免费一区二区三区 | 欧美日韩激情小视频| 四虎永久免费观看| 影音先锋久久精品| 国产69精品久久久久9999apgf | 欧美最猛性xxxxx免费| 六月婷婷中文字幕| 亚洲在线视频一区| 欧美一级大片免费看| 中文字幕一区二区三区久久网站 | 青青青国产在线视频| 亚洲色图美女| 欧美亚洲成人免费| 能在线看的av| 色噜噜狠狠成人中文综合| 无码一区二区三区在线| 视频一区免费在线观看| 视频一区三区| 国产精品黄色片| 久久精品99久久香蕉国产色戒| 在线视频 91| 亚洲欧美日韩在线| 最好看的中文字幕| 国产综合自拍| 明星裸体视频一区二区| 亚洲一区二区三区四区| 国产亚洲精品成人av久久ww| 国产精华7777777| 1024成人网| 亚洲最大视频网| 国产精品入口| 亚洲欧美日韩精品在线| www.欧美| 97免费视频在线| 国产高清在线看| 欧美一区欧美二区| 久久草视频在线| 中文字幕不卡的av| 国产精品igao网网址不卡| 欧美日本在线| 欧美精品123| 先锋影音网一区二区| 久久97久久97精品免视看| 天天综合天天综合| 欧美亚洲动漫精品| 久久久夜色精品| 久久久久久综合| 91插插插影院| 亚洲综合日本| 超碰免费在线公开| 久久超级碰碰| 国产一区二区香蕉| 国产99在线| 久久精品国产v日韩v亚洲| 欧美 日韩 中文字幕| 欧美在线一区二区三区| 精品无码久久久久久久久| 久久久五月婷婷| 三级网站免费看| 日日夜夜一区二区| 免费特级黄色片| 欧美综合在线视频观看| 国产精品theporn88| www.26天天久久天堂| 久久久久久美女| 日本在线看片免费人成视1000| 亚洲国产欧美自拍| 国产精品久久久久久久成人午夜| 欧美日韩国产限制| 黄页网站免费观看| 国产精品久久网站| 精品人妻无码一区二区三区 | 中文字幕在线观看的网站| 久久av老司机精品网站导航| 国产特级淫片高清视频| 综合一区二区三区| 午夜精品一区二区三区在线观看| 99亚洲乱人伦aⅴ精品| 国产精品久久久久久网站| 韩国精品一区| 色综合久久悠悠| 欧美被日视频| 中文字幕av一区中文字幕天堂| 神马久久久久久久久久| 欧美成人女星排行榜| 6—12呦国产精品| 欧美性猛交xxxx乱大交退制版| 日本在线视频免费观看| 亚洲靠逼com| 精品国产国产综合精品| 国产日产精品1区| 亚洲精品乱码久久久久久久| 国产成人av电影在线观看| 亚洲第一天堂久久| 另类中文字幕网| 任你操这里只有精品| 亚洲欧美bt| 国产二级片在线观看| 亚洲激情影院| 日韩日韩日韩日韩日韩| 黄色av成人| 国产自产在线视频| 黄色免费成人| 日韩精品一区在线视频| 国产综合激情| 国产深夜男女无套内射| 一区二区国产精品| 国产成人精品视频免费看| 亚洲国产午夜| 中文字幕无码精品亚洲35| 日韩视频二区| 欧美黄色免费影院| 久久最新视频| 国产视频1区2区3区| 久久99深爱久久99精品| 亚洲欧美日本一区二区| 国产精品一区二区三区网站| 国产又粗又猛大又黄又爽| 粉嫩在线一区二区三区视频| 国产乱淫av麻豆国产免费| av中文字幕不卡| 中文字幕丰满孑伦无码专区| 久久久亚洲午夜电影| 成人在线手机视频| 亚洲视频在线一区观看| 欧美黄色一级网站| 欧美日韩亚洲精品一区二区三区| 亚洲 欧美 中文字幕| 欧美视频在线观看一区二区| 国产又粗又黄又爽的视频| 日韩精品一区二区三区三区免费| 免费看av毛片| 国产亚洲精品91在线| www久久日com| 91av在线精品| 日韩电影精品| 国产精品日韩高清| 国产成人高清| 吴梦梦av在线| 99亚洲一区二区| 在线观看av网页| 国产不卡一区视频| www.中文字幕av| 亚洲欧美日韩一区二区三区在线观看| 国产真实乱人偷精品视频| 色综合久久88色综合天天6 | 亚洲第一精品夜夜躁人人爽 | 国产亚洲一区字幕| 久久国产高清视频| 欧美日韩国产影院| 97国产成人无码精品久久久| 亚洲丁香久久久| 国产免费av高清在线| 九色精品美女在线| 欧美大胆性生话| 亚洲最大福利视频| 国产一区2区| 国产黄色激情视频| 日本成人在线一区| 成熟妇人a片免费看网站| 日本一区二区三区视频视频| 久久久美女视频| 欧美日本精品一区二区三区| 午夜一区在线观看| 欧美成人午夜激情| 成人黄色毛片| 久久爱av电影| 欧美精品自拍| 亚洲污视频在线观看| 99久久精品国产导航| chinese全程对白| 日本道色综合久久| 色欲久久久天天天综合网 | 麻豆mv在线观看| 91综合免费在线| 日韩www.| 精品久久久久久久免费人妻| 国产高清视频一区| 性色国产成人久久久精品| 日韩欧美在线国产| 人妻精品无码一区二区| 久久国产精品影片| 日日夜夜亚洲精品| 日韩精品一区二区三区丰满| 一区二区三区高清视频在线观看| 午夜诱惑痒痒网| 国产精品久久久久久久久快鸭 | 日本一区二区精品| 亚洲一区二区毛片| 亚洲熟女乱综合一区二区三区| 一区二区视频在线| 精品国产伦一区二区三| 精品国模在线视频| 亚洲电影二区| 亚洲一区在线直播| 久久激情五月激情| jizzjizzjizz国产| 欧美日韩精品综合在线| jizz在线观看视频| 国产精品无av码在线观看| 国产一区二区三区不卡视频网站| 日本日本19xxxⅹhd乱影响| av高清不卡在线| 日韩美女一级片| 亚洲激情视频网| 小早川怜子影音先锋在线观看| 精品国产乱码一区二区三区四区| 在线视频观看日韩| 中国av免费看| 色综合久久综合| 黄色国产在线| 国产日韩在线一区| 99久久夜色精品国产亚洲1000部| 国内国产精品天干天干| 日韩一区欧美小说| 99国产精品久久久久99打野战| 美女福利视频一区| 91国内精品| 国产中文字幕在线免费观看| 91视频在线看| 国产成人麻豆免费观看| 中文字幕视频在线免费欧美日韩综合在线看| 北岛玲heyzo一区二区| 日本免费一区二区三区| 美女网站视频久久| 久久精品亚洲a| 精品日本一线二线三线不卡| 国产在线天堂www网在线观看| 精品国产中文字幕| 日韩成人午夜精品| 永久免费未视频| 亚洲电影在线观看| 国产一区二区三区朝在线观看| 亚洲精品日韩在线观看| 国产成人免费在线观看| wwwwww国产| xx视频.9999.com| 久久精品国产亚洲blacked| 精品一卡二卡三卡| 1000精品久久久久久久久| 神马午夜一区二区| 国产在线精品播放| 亚洲小说欧美另类婷婷| 日本激情小视频| 欧美一区二区三区成人| 国产在线精彩视频| 伊人久久av导航| 99在线热播精品免费| 中文天堂在线播放| 欧美极品少妇xxxxⅹ裸体艺术 | 色综合影院在线| youjizzjizz亚洲| 最近中文字幕一区二区| 亚洲午夜精品网| 国产丝袜在线视频| 国产在线精品一区二区三区不卡| 亚洲bt欧美bt日本bt| 97在线观看免费观看高清 | 欧美日韩视频| 欧美三级一级片| 国产精品高潮呻吟久久| 亚州av在线播放| 91影视免费在线观看| 母乳一区在线观看|