精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

詳解Latte:應(yīng)用于文生視頻的DiT模型

發(fā)布于 2024-4-7 11:13
瀏覽
0收藏
隨著 Sora 的成功發(fā)布,視頻 DiT 模型得到了大量的關(guān)注和討論。設(shè)計(jì)穩(wěn)定的超大規(guī)模神經(jīng)網(wǎng)絡(luò)一直是視覺生成領(lǐng)域的研究重點(diǎn)。DiT [1] 的成功為圖像生成的規(guī)模化提供了可能性。然而,由于視頻數(shù)據(jù)的高度結(jié)構(gòu)化與復(fù)雜性,如何將 DiT 擴(kuò)展到視頻生成領(lǐng)域卻是一個(gè)挑戰(zhàn),來自上海人工智能實(shí)驗(yàn)室的研究團(tuán)隊(duì)聯(lián)合其他機(jī)構(gòu)通過大規(guī)模的實(shí)驗(yàn)回答了這個(gè)問題。早在去年 11 月,該團(tuán)隊(duì)就已經(jīng)開源了一款與 Sora 技術(shù)相似的自研模型:Latte。作為全球首個(gè)開源文生視頻 DiT,Latte 受到了廣泛關(guān)注,并且模型設(shè)計(jì)被眾多開源框架所使用與參考,如 Open-Sora Plan (PKU) 和 Open-Sora (ColossalAI)。

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

論文題目: 

Latte: Latent Diffusion Transformer for Video Generation 

論文鏈接:

??https://arxiv.org/pdf/2401.03048v1.pdf??

開源鏈接:

??https://github.com/Vchitect/Latte??

項(xiàng)目主頁:

??https://maxin-cn.github.io/latte_project/??

先來看下Latte的視頻生成效果。

一、 方法介紹

總體上,Latte 包含兩個(gè)主要模塊:預(yù)訓(xùn)練 VAE 和視頻 DiT。預(yù)訓(xùn)練 VAE 編碼器將視頻逐幀從像素空間壓縮到隱空間,視頻 DiT 對(duì)隱式表征提取 token 并進(jìn)行時(shí)空建模,最后 VAE 解碼器將特征映射回像素空間生成視頻。為了得到最優(yōu)的視頻質(zhì)量,作者著重探究了 Latte 設(shè)計(jì)中兩個(gè)重要內(nèi)容,(1) 視頻 DiT 模型整體結(jié)構(gòu)設(shè)計(jì)以及 (2) 模型與訓(xùn)練細(xì)節(jié)的最優(yōu)設(shè)計(jì)(The best practices)。

1.1 Latte 整體模型結(jié)構(gòu)設(shè)計(jì)探究

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

圖 1. Latte 模型結(jié)構(gòu)及其變體

作者提出了 4 種不同的 Latte 變體 (圖 1),從時(shí)空注意力機(jī)制的角度設(shè)計(jì)了兩種 Transformer 模塊,同時(shí)在每種模塊中分別研究了兩種變體(Variant):

1.單注意力機(jī)制模塊,每個(gè)模塊中只包含時(shí)間或者空間注意力

時(shí)空交錯(cuò)式建模 (Variant 1): 時(shí)間模塊插入到各個(gè)空間模塊之后。

時(shí)空順序式建模 (Variant 2): 時(shí)間模塊整體置于空間模塊之后。

2. 多注意力機(jī)制模塊,每個(gè)模塊中同時(shí)包含時(shí)間與空間注意力機(jī)制 (Open-sora所參考變體)

串聯(lián)式時(shí)空注意力機(jī)制 (Variant 3): 時(shí)空注意力機(jī)制串行建模。

并聯(lián)式時(shí)空注意力機(jī)制 (Variant 4): 時(shí)空注意力機(jī)制并行建模并特征融合。

實(shí)驗(yàn)表明 (圖 2),通過對(duì) 4 種模型變體設(shè)置相同的參數(shù)量,變體 4 相較于其他三種變體在 FLOPS 上有著明顯的差異,因此 FVD 上也相對(duì)最高,其他 3 種變體總體性能類似,變體 1 取得了最優(yōu)異的性能,作者計(jì)劃未來在大規(guī)模的數(shù)據(jù)上做更加細(xì)致的討論。

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

圖 2. 模型結(jié)構(gòu) FVD

1.2 Latte 模型與訓(xùn)練細(xì)節(jié)的最優(yōu)設(shè)計(jì)探究(The best practices)

除了模型總體結(jié)構(gòu)設(shè)計(jì),作者還探究了其他模型與訓(xùn)練中影響生成效果的因素。

1.Token 提取:探究了單幀 token(a)和時(shí)空 token(b)兩種方式,前者只在空間層面壓縮 token,后者同時(shí)壓縮時(shí)空信息。實(shí)驗(yàn)顯示單幀 token 要優(yōu)于時(shí)空 token(圖 4)。與 Sora 進(jìn)行比較,作者猜測(cè) Sora 提出的時(shí)空 token 是通過視頻 VAE 進(jìn)行了時(shí)間維度的預(yù)壓縮,而在隱空間上與 Latte 的設(shè)計(jì)類似都只進(jìn)行了單幀 token 的處理。

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

圖 3. Token 提取方式,(a) 單

幀 token 和 (b) 時(shí)空 token

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

圖 4. Token 提取 FVD

2.條件注入模式:探究了(a)S-AdaLN 和(b)all tokens 兩種方式 (圖 5)。S-AdaLN 通過 MLP 將條件信息轉(zhuǎn)換為歸一化中的變量注入到模型中。All token 形式將所有條件轉(zhuǎn)化為統(tǒng)一的 token 作為模型的輸入。實(shí)驗(yàn)證明,S-AdaLN 的方式相較于 all token 對(duì)于獲得高質(zhì)量的結(jié)果更加有效 (圖 6)。原因是,S-AdaLN 可以使信息被直接注入到每一個(gè)模塊。而 all token 需要將條件信息從輸入逐層傳遞到最后,存在著信息流動(dòng)過程中的損失。

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

圖 5. (a) S-AdaLN 和 (b) all tokens。

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

圖 6. 條件注入方式 FVD

3.時(shí)空位置編碼:探究了絕對(duì)位置編碼與相對(duì)位置編碼。不同的位置編碼對(duì)最后視頻質(zhì)量影響很小 (圖 7)。由于生成時(shí)長(zhǎng)較短,位置編碼的不同不足以影響視頻質(zhì)量,對(duì)于長(zhǎng)視頻生成,這一因素需要被重新考慮。

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

圖 7. 位置編碼方式 FVD

4.模型初始化:探究使用 ImageNet 預(yù)訓(xùn)練參數(shù)初始化對(duì)模型性能的影響。實(shí)驗(yàn)表明,使用 ImageNet 初始化的模型具有較快的收斂速度,然而,隨著訓(xùn)練的進(jìn)行,隨機(jī)初始化的模型卻取得了較好的結(jié)果 (圖 8)。可能的原因在于 ImageNet 與訓(xùn)練集 FaceForensics 存在著比較大的分布差異,因此未能對(duì)模型的最終結(jié)果起到促進(jìn)作用。而對(duì)于文生視頻任務(wù)而言,該結(jié)論需要被重新考慮。在通用數(shù)據(jù)集的分布上,圖像與視頻的內(nèi)容空間分布相似,使用預(yù)訓(xùn)練 T2I 模型對(duì)于 T2V 可以起到極大的促進(jìn)作用。

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

圖 8. 初始化參數(shù) FVD

5.圖像視頻聯(lián)合訓(xùn)練:將視頻與圖像壓縮為統(tǒng)一 token 進(jìn)行聯(lián)合訓(xùn)練,視頻 token 負(fù)責(zé)優(yōu)化全部參數(shù),圖像 token 只負(fù)責(zé)優(yōu)化空間參數(shù)。聯(lián)合訓(xùn)練對(duì)于最終的結(jié)果有著顯著的提升 (表 2 和表 3),無論是圖片 FID,還是視頻 FVD,通過聯(lián)合訓(xùn)練都得到了降低,該結(jié)果與基于 UNet 的框架 [2][3] 是一致的。

6.模型尺寸:探究了 4 種不同的模型尺寸,S,B,L 和 XL (表 1)。擴(kuò)大視頻 DiT 規(guī)模對(duì)于提高生成樣本質(zhì)量有著顯著的幫助 (圖 9)。該結(jié)論也證明了在視頻擴(kuò)散模型中使用 Transformer 結(jié)構(gòu)對(duì)于后續(xù) scaling up 的正確性。

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

表 1. Latte 不同尺寸模型規(guī)模

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

圖 9. 模型尺寸 FVD

三、定性與定量分析

作者分別在 4 個(gè)學(xué)術(shù)數(shù)據(jù)集(FaceForensics,TaichiHD,SkyTimelapse 以及 UCF101)進(jìn)行了訓(xùn)練。定性與定量(表 2 和表 3)結(jié)果顯示 Latte 均取得了最好的性能,由此可以證明模型整體設(shè)計(jì)是具有優(yōu)異性的。

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

表 2. UCF101 圖片質(zhì)量評(píng)估

詳解Latte:應(yīng)用于文生視頻的DiT模型-AI.x社區(qū)

表 3. Latte 與 SoTA 視頻質(zhì)量評(píng)估

三、文生視頻擴(kuò)展

為了進(jìn)一步證明 Latte 的通用性能,作者將 Latte 擴(kuò)展到了文生視頻任務(wù),利用預(yù)訓(xùn)練 PixArt-alpha [4] 模型作為空間參數(shù)初始化,按照最優(yōu)設(shè)計(jì)的原則,在經(jīng)過一段時(shí)間的訓(xùn)練之后,Latte 已經(jīng)初步具備了文生視頻的能力。后續(xù)計(jì)劃通過擴(kuò)大規(guī)模驗(yàn)證 Latte 生成能力的上限。

四、討論與總結(jié)

Latte 作為全世界首個(gè)開源文生視頻 DiT,已經(jīng)取得了很有前景的結(jié)果,但由于計(jì)算資源的巨大差異,在生成清晰度,流暢度上以及時(shí)長(zhǎng)上與 Sora 相比還具有不小的差距。團(tuán)隊(duì)歡迎并在積極尋求各種合作,希望通過開源的力量,打造出性能卓越的自主研發(fā)大規(guī)模通用視頻生成模型。

參考文獻(xiàn)

[1] Peebles, William, and Saining Xie. "Scalable diffusion models with transformers." Proceedings of the IEEE/CVF International Conference on Computer Vision. 2023.

[2] Ho, Jonathan, et al. Imagen video: High definition video generation with diffusion models. arXiv preprint arXiv:2210.02303 (2022)

[3] Wang, Yaohui, et al. "Lavie: High-quality video generation with cascaded latent diffusion models." arXiv preprint arXiv:2309.15103 (2023).

[4] Chen, Junsong, et al. "PixArt-: Fast Training of Diffusion Transformer for Photorealistic Text-to-Image Synthesis." arXiv preprint arXiv:2310.00426 (2023).

Illustration From IconScout By 22

本文轉(zhuǎn)載自??將門創(chuàng)投??,作者:王耀暉 ????

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
久久综合九色99| 色综合久久天天综线观看| 国产又黄又猛视频| av在线女优影院| 国产精品一区二区三区四区| 久久久在线观看| 手机毛片在线观看| 一区中文字幕| 91福利社在线观看| 免费极品av一视觉盛宴| 理论视频在线| 高清不卡在线观看| 国产精品久久二区| 久热这里只有精品在线| 精品国产不卡| 日韩精品一区在线观看| 少妇性l交大片| 青春草视频在线| 国产欧美日韩精品a在线观看| 91在线观看免费网站| 欧美一区二区三区四| 1024精品久久久久久久久| 国产丝袜一区视频在线观看| 手机av在线网站| 日韩精品三区| 天天综合色天天| 水蜜桃在线免费观看| 国产黄色片在线观看| 成人天堂资源www在线| 91精品久久久久久久久久入口| 国产精品视频123| 精品1区2区3区4区| 久久久久www| 国产在视频线精品视频| 亚洲人成精品久久久| 精品国精品自拍自在线| 在线视频一二区| 国产激情久久| 91成人免费电影| 久草青青在线观看| h片在线观看视频免费| 一区二区三区中文字幕电影 | 北条麻妃在线一区二区免费播放| 欧美私人免费视频| 国产精品亚洲αv天堂无码| 波多野结衣在线播放| 亚洲一区二区三区在线看| 黄色一级视频播放| 国产成人l区| 亚洲人精品午夜| 桥本有菜av在线| 免费黄色网址在线观看| 国产精品美女久久久久久久网站| 日韩欧美亚洲日产国产| 精品电影在线| 国产视频一区在线播放| 色狠狠久久av五月综合|| 国产三级视频在线看| 国产欧美精品在线观看| 亚洲国产高清国产精品| 色影院视频在线| 亚洲私人黄色宅男| 91视频成人免费| 亚洲无线看天堂av| 亚洲一线二线三线久久久| 97超碰国产精品| 欧美aaaaa性bbbbb小妇| 欧美视频在线视频| 日本激情视频在线| 在线观看欧美| 亚洲精品一区二区三区香蕉| 亚洲av成人片色在线观看高潮| 小说区图片区色综合区| 国产一区二区三区直播精品电影 | 国产中文字幕在线看| 国产日韩欧美综合在线| 中文字幕av日韩精品| 色yeye免费人成网站在线观看| 亚洲国产一区在线观看| 欧美 国产 小说 另类| 另类一区二区三区| 精品三级在线看| 成人性生交大免费看| 色乱码一区二区三区网站| 欧美伦理91i| 国产一级片毛片| 美女精品一区二区| 成人动漫视频在线观看免费| 日本成人一区二区三区| 久久精品一级爱片| 手机看片日韩国产| 在线视频超级| 在线播放日韩导航| 私密视频在线观看| 日韩综合在线| 91av在线影院| 国产乱色精品成人免费视频| 成人国产亚洲欧美成人综合网| 欧美日韩亚洲在线| 超碰免费在线播放| 一本到不卡精品视频在线观看| 国产一级免费大片| 九九在线精品| 欧美精品videossex88| 中文字幕第31页| 99久久综合精品| 亚洲精品偷拍视频| 日韩另类视频| 亚洲精品久久久久国产| 五月综合色婷婷| 日韩制服丝袜av| 精品国产综合| 怡红院在线播放| 8v天堂国产在线一区二区| 丰满圆润老女人hd| 国一区二区在线观看| 成人激情视频免费在线| 国产系列电影在线播放网址| 午夜国产不卡在线观看视频| 制服下的诱惑暮生| 久久免费精品视频在这里| 国产成人精品999| 五月婷中文字幕| 一区二区三区在线高清| 一区二区三区欧美精品| 精品美女在线视频| 国产成+人+综合+亚洲欧洲 | 国产极品尤物在线| 亚洲成人黄色| 久久中文精品视频| 亚洲一线在线观看| 国产欧美日韩视频在线观看| 久久免费视频3| 日本欧美三级| 97高清免费视频| 免费av网站在线播放| 一区二区三区欧美视频| 免费黄频在线观看| 999国产精品| 国产欧美婷婷中文| 一级毛片视频在线观看| 欧美视频在线观看一区二区| 五月天综合视频| 日韩av一区二区三区四区| 日本成人看片网址| 欧美三级精品| 中日韩美女免费视频网址在线观看 | 欧美精品尤物在线| 亚洲欧洲日本韩国| 亚洲精品视频二区| 激情五月婷婷网| 国产欧美视频一区二区三区| 香蕉视频禁止18| 国产精品久久久久久影院8一贰佰| 国产伦精品一区二区三区精品视频 | 日韩欧美激情| 久久这里有精品| www.热久久| 午夜精品久久久久久不卡8050| 成人性生活免费看| 久久综合亚州| 精品久久免费观看| 一区二区三区欧洲区| 性色av一区二区三区| 久久免费看视频| 欧美美女喷水视频| 久久久久久福利| 久久久综合视频| 亚洲欧美日韩综合网| 欧美激情成人在线| 欧美高清性xxxxhd| 日韩成人免费av| 欧美精品videos| 国产福利在线观看| 日韩女优av电影在线观看| 丰满少妇乱子伦精品看片| 国产欧美一区二区精品忘忧草| 成年人三级黄色片| 亚洲经典视频在线观看| 日本不卡在线观看| 日本一区二区乱| 日本精品一区二区三区在线| 好了av在线| 国产视频精品自拍| 国产又大又长又粗| 五月天欧美精品| av黄色免费在线观看| av综合在线播放| 国产探花在线看| 亚洲永久免费精品| 成人性做爰片免费视频| 一区二区三区视频免费观看| 7777精品久久久大香线蕉小说| 一个人看的www视频在线免费观看| 色多多国产成人永久免费网站| www.成人精品| 欧美性淫爽ww久久久久无| 久久久久无码国产精品| 国产亚洲精品资源在线26u| 性色av浪潮av| 日本欧美大码aⅴ在线播放| 日本免费a视频| 999久久久精品国产| 久久久国产精品一区二区三区| 午夜精品久久久久久毛片| 欧美在线中文字幕| 欧美bbbxxxxx| 中文字幕精品一区二区精品| 亚洲av电影一区| 欧美一二区视频| 国产精品传媒在线观看| 婷婷久久综合九色国产成人 | yiren22亚洲综合伊人22| 亚洲激情视频网| 国产乱叫456在线| 欧美在线看片a免费观看| 精品美女久久久久| 亚洲黄网站在线观看| 成人无码精品1区2区3区免费看| 91欧美一区二区| 国产精九九网站漫画| 国产一区欧美日韩| 奇米视频7777| 麻豆免费看一区二区三区| 18禁男女爽爽爽午夜网站免费| 极品尤物久久久av免费看| 在线观看av的网址| 999久久久精品国产| 一本一道久久a久久精品综合 | 欧美日本高清视频| 激情成人四房播| 最新的欧美黄色| 成人影院免费观看| 亚洲欧洲一区二区三区久久| 五月天婷婷在线观看| 91精品国产手机| 国产免费av观看| 91精品国产aⅴ一区二区| 国产又粗又黄视频| 欧美精品乱码久久久久久按摩| 中文字幕 欧美激情| 欧美亚洲一区二区在线| 羞羞色院91蜜桃| 欧美日韩日日骚| 亚洲综合精品国产一区二区三区 | 琪琪第一精品导航| 欧美91看片特黄aaaa| 日韩免费观看视频| 小黄鸭精品aⅴ导航网站入口| 日韩av成人在线观看| 户外露出一区二区三区| 国产精品视频地址| 四虎精品一区二区免费| 96国产粉嫩美女| 亚洲精品国产九九九| 国产精品一区二区欧美| 色婷婷狠狠五月综合天色拍| 美女黄毛**国产精品啪啪| 精品日韩一区| 国产精品久久成人免费观看| 亚洲一区欧美| 乱人伦xxxx国语对白| 免费日韩av片| 超碰超碰在线观看| 国产九九视频一区二区三区| 国产精品果冻传媒| 久久久久久**毛片大全| 在线日韩国产网站| 亚洲国产精品日韩专区av有中文| 成人毛片18女人毛片| 国产欧美一区在线| 永久免费av无码网站性色av| 亚洲国产成人午夜在线一区| 小泽玛利亚一区二区免费| 一区二区三区四区五区视频在线观看 | 国产三级小视频| 欧美v亚洲v综合ⅴ国产v| 婷婷色在线视频| 一区二区欧美日韩视频| а√天堂在线官网| 国产91|九色| 欧美黄色a视频| 国产九色精品| 成人同人动漫免费观看 | 亚洲小说区图片区都市| 啪一啪鲁一鲁2019在线视频| 999精品视频在线观看| 国产一区免费视频| 日本女优一区| 阿v天堂2018| 久久精品国产成人一区二区三区| 一级黄色大片免费看| 久久久久久亚洲综合| 日本老熟俱乐部h0930| 色综合久久88色综合天天6 | 国产福利91精品| 国产成人av一区二区三区不卡| 中文欧美字幕免费| 在线观看 中文字幕| 欧美日韩高清一区| 亚洲欧洲视频在线观看| 操人视频在线观看欧美| 欧美色网一区| 国产伦精品一区二区三区高清| 色偷偷综合网| 欧美日韩在线中文| 国产精品一区二区三区网站| 一区二区三区在线观看免费视频| 亚洲成人综合网站| 国产免费一区二区三区免费视频| 亚洲老头老太hd| 9999在线视频| 亚洲综合在线播放| 成久久久网站| 国产美女无遮挡网站| 成人妖精视频yjsp地址| 色欲一区二区三区精品a片| 91国偷自产一区二区三区观看| 亚洲精品无码久久久| 久久精品国产亚洲7777| 日韩天堂在线| 免费在线一区二区| 亚洲精品视频啊美女在线直播| www.国产福利| 国产精品久久久久9999吃药| 亚洲 欧美 中文字幕| 国产视频久久久| 美女扒开腿让男人桶爽久久软| 99www免费人成精品| 亚洲色图网站| caoporm在线视频| 国产精品美女久久久久高潮| 波多野结衣家庭主妇| 亚洲人成绝费网站色www| 在线观看特色大片免费视频| 激情视频一区二区| 亚洲人妖在线| 日韩Av无码精品| 亚洲狠狠爱一区二区三区| 亚洲经典一区二区三区| 萌白酱国产一区二区| 欧美一级片网址| 小泽玛利亚av在线| 高清久久久久久| 日本熟妇毛茸茸丰满| 亚洲国产又黄又爽女人高潮的| 97超碰在线免费| 久久久久久久久一区二区| 国产精品亚洲综合久久| 成人手机在线免费视频| 欧美日韩亚洲一区二区三区| 欧美香蕉爽爽人人爽| 国产成人精品日本亚洲| 不卡视频在线| 91欧美一区二区三区| 一区二区三区在线视频免费| 亚洲av少妇一区二区在线观看| 久久久久久久久久久av| 欧美1区二区| 欧美 日韩 国产 激情| 中文字幕+乱码+中文字幕一区| 91亚洲欧美激情| 久久99久国产精品黄毛片入口| 91久久偷偷做嫩草影院电| 大j8黑人w巨大888a片| 国产亚洲欧洲一区高清在线观看| 成人黄色免费网| 欧美成人免费网| 精品福利网址导航| 国产精品人人妻人人爽人人牛| 国产日韩精品一区二区三区 | 成人午夜免费av| 国产成人在线视频观看| 尤物精品国产第一福利三区 | 麻豆国产精品官网| 日韩成人毛片视频| 亚洲成色777777女色窝| 日韩电影免费观看高清完整版| 亚洲午夜在线观看| 国产精品白丝jk黑袜喷水| a v视频在线观看| 在线日韩av观看| 9l视频自拍蝌蚪9l视频成人| 北条麻妃在线一区| 一区二区三区欧美| 精品美女视频在线观看免费软件| 国产一区二区在线免费| 亚洲精品激情| 美女三级黄色片| 日韩精品高清视频| 在线日韩三级| av天堂永久资源网| 亚洲激情av在线| 波多野结衣一区二区| 国产精品毛片va一区二区三区| 日本在线观看不卡视频| 天天操天天射天天爽| 精品国内自产拍在线观看| 欧美人妖视频| 伊人影院在线观看视频|