精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型

發布于 2024-8-12 13:59
瀏覽
0收藏

訓練一個擴散模型要多少錢?


之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion這樣的模型還要再貴一個數量級。


大模型時代,一般人根本玩不起。想要各種文生小姐姐,還得靠廠商們負重前行

為了降低這龐大的開銷,研究者們嘗試了各種方案。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

比如,原始的擴散模型從噪聲到圖像大約需要1000步,目前已經被減少到20步左右,甚至更少。


當擴散模型中的基礎模塊逐漸由Unet(CNN)替換為DiT(Transformer)之后,一些根據Transformer特性來做的優化也跟了上來。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

比如量化,比如跳過Attention中的一些冗余計算,比如pipeline。


而近日,來自加州大學爾灣分校等機構的研究人員,把「省錢」這個目標直接向前推進了一大步:

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

論文地址:https://arxiv.org/abs/2407.15811


——從頭開始訓練一個11.6億參數的擴散模型,只需要1890美元!


對比SOTA有了一個數量級的提升,讓普通人也看到了能摸一摸預訓練的希望。


更重要的是,降低成本的技術并沒有影響模型的性能,11.6億個參數給出了下面這樣非常不錯的效果。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

除了觀感,模型的數據指標也很優秀,比如下表給出的FID分數,非常接近Stable Diffusion 1.5和DALL·E 2。


相比之下,Wuerstchen的降成本方案則導致自己的考試分數不甚理想。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

省錢的秘訣

抱著「Stretching Each Dollar」的目標,研究人員從擴散模型的基礎模塊DiT入手。

首先,序列長度是Transformer計算成本的大敵,需要除掉。


對于圖像來說,就需要在不影響性能的情況下,盡量減少參加計算的patch數量(同時也減少了內存開銷)。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

減少圖像切塊數可以有兩種方式,一是增大每塊的尺寸,二是干掉一部分patch(mask)。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

因為前者會顯著降低模型性能,所以我們考慮進行mask的方式。


最樸素的mask(Naive token masking)類似于卷積UNet中隨機裁剪的訓練,但允許對圖像的非連續區域進行訓練。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

而之前最先進的方法(MaskDiT),在輸出之前增加了一個恢復重建的結構,通過額外的損失函數來訓練,希望通過學習彌補丟掉的信息。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

這兩種mask都為了降低計算成本,在一開始就丟棄了大部分patch,信息的損失顯著降低了Transformer的整體性能,即使MaskDiT試圖彌補,也只是獲得了不太多的改進。


——丟掉信息不可取,那么怎樣才能減小輸入又不丟信息呢?

延遲掩蔽

本文提出了一種延遲掩蔽策略(deferred masking strategy),在mask之前使用混合器(patch-mixer)進行預處理,把被丟棄patch的信息嵌入到幸存的patch中,從而顯著減少高mask帶來的性能下降。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

在本架構中,patch-mixer是通過注意力層和前饋層的組合來實現的,使用二進制掩碼進行mask,整個模型的損失函數為:

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

與MaskDiT相比,這里不需要額外的損失函數,整體設計和訓練更加簡單。

而混合器本身是個非常輕量的結構,符合省錢的標準。

微調

由于非常高的掩蔽比(masking ratio)會顯著降低擴散模型學習圖像中全局結構的能力,并引入訓練到測試的分布偏移,所以作者在預訓練(mask)后進行了小幅度的微調(unmask)。


另外,微調還可以減輕由于使用mask而產生的任何不良生成偽影。

MoE和分層擴展

MoE能夠增加模型的參數和表達能力,而不會顯著增加訓練成本。


作者使用基于專家選擇路由的簡化MoE層,每個專家確定路由到它的token,而不需要任何額外的輔助損失函數來平衡專家之間的負載。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

此外,作者還考慮了分層縮放方法,線性增加Transformer塊的寬度(即注意力層和前饋層中的隱藏層尺寸)。


由于視覺模型中的更深層傾向于學習更復雜的特征,因此在更深層中使用更多的參數將帶來更好的性能。

實驗設置

作者使用兩種DiT的變體:DiT-Tiny/2和DiT-Xl/2,patch大小為2。

使用具有余弦學習率衰減和高權重衰減的AdamW優化器訓練所有模型。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

模型前端使用Stable-Diffusion-XL模型中的四通道變分自動編碼器(VAE)來提取圖像特征,另外還測試了最新的16通道VAE在大規模訓練(省錢版)中的性能。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

作者使用EDM框架作為所有擴散模型的統一訓練設置,使用FID以及CLIP分數來衡量圖像生成模型的性能。


文本編碼器選擇了最常用的CLIP模型,盡管T5-xxl這種較大的模型在文本合成等具有挑戰性的任務上表現更好,但為了省錢的目標,這里沒有采用。

訓練數據集

使用三個真實圖像數據集(Conceptual Captions、Segment Anything、TextCaps),包含2200萬個圖像文本對。


由于SA1B不提供真實的字幕,這里使用LLaVA模型生成的合成字幕。作者還在大規模訓練中添加了兩個包含1500萬個圖像文本對的合成圖像數據集:JourneyDB和DiffusionDB。


對于小規模消融,研究人員通過從較大的COYO-700M數據集中對10個CIFAR-10類的圖像進行二次采樣,構建了一個名為cifar-captions的文本到圖像數據集。

評估

使用DiT-Tiny/2模型和cifar-captions數據集(256×256分辨率)進行所有評估實驗。

對每個模型進行60K優化步驟的訓練,并使用AdamW優化器和指數移動平均值(最后10K步平滑系數為0.995)。

延遲掩蔽

實驗的基線選擇我們上面提到的Naive masking,而本文的延遲掩蔽則加入一個輕量的patch-mixer,參數量小于主干網絡的10%。


一般來說,丟掉的patch越多(高masking ratio),模型的性能會越差,比如MaskDiT在超過50%后表現大幅下降。

這里的對比實驗采用默認的超參數(學習率1.6×10e-4、0.01的權重衰減和余弦學習率)來訓練兩個模型。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

上圖的結果顯示了延遲屏蔽方法在FID、Clip-FID和Clip score三個指標上都獲得了提升。

并且,與基線的性能差距隨著掩蔽率的增加而擴大。在掩蔽率為75%的情況下,樸素掩蔽會將FID分數降低至 16.5,而本文的方法則達到5.03,更接近于無掩蔽時的FID分數(3.79)。

超參數

沿著訓練LLM的一般思路,這里比較兩個任務的超參數選擇。


首先,在前饋層中,SwiGLU激活函數優于GELU。其次,較高的權重衰減會帶來更好的圖像生成性能。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

另外,與LLM訓練不同的是,當對AdamW二階矩 (β) 使用更高的運行平均系數時,本文的擴散模型可以達到更好的性能。


最后,作者發現使用少量的訓練步驟,而將學習率增加到最大可能值(直到訓練不穩定)也顯著提高了圖像生成性能。

混合器的設計

大力出奇跡一般都是對的,作者也觀察到使用更大的patch-mixer后,模型性能得到持續改善。


然而,本著省錢的目的,這里還是選擇使用小型的混合器。


作者將噪聲分布修改為 (?0.6, 1.2),這改善了字幕和生成圖像之間的對齊。


如下圖所示,在75% masking ratio下,作者還研究了采用不同patch大小所帶來的影響。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

當連續區域變多(patch變大)時,模型的性能會下降,因此保留隨機屏蔽每個patch的原始策略。

分層縮放

這個實驗訓練了DiT-Tiny架構的兩種變體,一種具有恒定寬度,另一種采用分層縮放的結構。

兩種方法都使用Naive masking,并調整Transformer的尺寸,保證兩種情況下的模型算力相同,同時執行相同的訓練步驟和訓練時間。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

由上表結果可知發現,在所有三個性能指標上,分層縮放方法都優于基線的恒定寬度方法,這表明分層縮放方法更適合DiT的掩蔽訓練。


本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/Y01EkGV7veurruqNxFFrEw??

收藏
回復
舉報
回復
相關推薦
亚洲一区二区三区高清视频| 亚洲欧美高清在线| 免费大片黄在线| 国产精品一卡二卡在线观看| 97成人在线视频| 一级特黄曰皮片视频| 成人激情久久| 精品久久久久久中文字幕大豆网| 欧美一区二区三区电影在线观看 | 成人综合专区| 精品国产一区二区三区久久久蜜月 | 99久久综合狠狠综合久久止| 东京热一区二区三区四区| 99久久婷婷| 亚洲欧洲在线观看| 国产艳妇疯狂做爰视频| 91超碰碰碰碰久久久久久综合| 亚洲男人的天堂在线aⅴ视频| 鲁丝片一区二区三区| 国产婷婷一区二区三区久久| 久久久久看片| 国内揄拍国内精品| 亚洲欧洲中文| 国产美女作爱全过程免费视频| 蜜臀av午夜精品| 久久国产剧场电影| 茄子视频成人在线| 精品无码一区二区三区电影桃花 | 国产精品免费精品自在线观看| 午夜天堂影视香蕉久久| 艳母动漫在线观看| 日韩在线免费播放| 国产成人av一区二区| 国产精品久久久久999| 麻豆一区二区三区精品视频| 久久精品免费一区二区三区| 亚洲天堂免费观看| 亚洲天堂成人av| 国产精品巨作av| 日韩精品一区二区三区四区视频 | 成人一级片在线观看| 国产精品一二区| 波多野结衣一区二区在线 | 秋霞av国产精品一区| 国产黄色片视频| 狠狠入ady亚洲精品| 欧美成人一二三| www日韩在线| 午夜精品久久久久久久四虎美女版| 一区二区欧美激情| 日本少妇xxxxx| 欧美裸体在线版观看完整版| 国产亚洲aⅴaaaaaa毛片| 一本色道久久综合亚洲精品图片| 国产suv精品一区| 亚洲国产精品久久精品怡红院| avtt中文字幕| 精品综合久久88少妇激情| 亚洲高清一二三区| 内射中出日韩无国产剧情| 日日天天久久| 成人豆花视频| 一区二区三区四区乱视频| 免费观看国产视频在线| av网址在线| 亚洲一区免费观看| www.99热这里只有精品| 中老年在线免费视频| 日本高清不卡在线观看| 亚洲综合婷婷久久| 91麻豆精品| 精品日韩欧美在线| 丰满大乳奶做爰ⅹxx视频| 亚洲区小说区| 色噜噜亚洲精品中文字幕| 裸体武打性艳史| 亚洲成人在线| 国产精品jizz在线观看麻豆| 中文字幕人妻丝袜乱一区三区 | 一级 黄 色 片一| 亚洲国产欧美国产第一区| 欧美精品一区二区三区在线播放 | 中文字幕视频一区| 8x8x华人在线| 看黄在线观看| 欧美视频三区在线播放| 久久精品一二三四| 日韩在线黄色| 久久亚洲精品视频| 日韩av在线播| 美腿丝袜亚洲三区| 成人av男人的天堂| 国产在线视频网| 亚洲伦在线观看| 亚洲中文字幕无码中文字| 国产伊人久久| 亚洲国产精品成人精品| 女人十八毛片嫩草av| 中文字幕av亚洲精品一部二部| 国外成人免费在线播放| 亚洲图片视频小说| 99综合电影在线视频| 亚洲综合av一区| 狠狠躁少妇一区二区三区| 欧美日韩伊人| 亚洲第一福利在线观看| 国产sm调教视频| 国内在线观看一区二区三区| 热门国产精品亚洲第一区在线| 国产精品自拍电影| 久久精品无码一区二区三区| 麻豆视频传媒入口| 日韩高清在线| 日韩av一区在线观看| 91精品国产闺蜜国产在线闺蜜| 日韩亚洲精品在线| 1卡2卡3卡精品视频| 免费播放片a高清在线观看| 樱花影视一区二区| 成 人 黄 色 小说网站 s色| 要久久电视剧全集免费| 久久久久久久久久久久av| 在线免费a视频| 久久久久久久久伊人| 国产中文字幕二区| 日本免费精品| 俺去了亚洲欧美日韩| 极品国产91在线网站| 成人午夜视频在线| 日韩视频一二三| 大胆国模一区二区三区| 中文字幕一区二区三区电影| 天码人妻一区二区三区在线看| 成人美女视频在线看| 热久久最新地址| 国产一区一区| 久久夜色精品亚洲噜噜国产mv| 91麻豆精品在线| 久久精品综合网| 日韩在线一级片| 欧美顶级毛片在线播放| 午夜精品一区二区三区在线| 午夜精品久久久久久久91蜜桃| 日韩美女视频一区二区 | 国产一区二区不卡在线| 在线国产99| 欧美一级做一级爱a做片性| 中文字幕av日韩| 中文字幕乱码一区二区| 久久中文资源| 亚洲综合免费观看高清完整版在线 | 国产精品黄色网| 不卡电影免费在线播放一区| 2018日日夜夜| 美女网站色精品尤物极品姐弟| 欧美激情精品久久久久久蜜臀| 亚洲av无码一区二区三区性色| 亚洲日本在线a| 黑人性生活视频| 国产精品vip| 久久超碰亚洲| 欧美xo影院| 在线看日韩av| 一级片一区二区三区| 日韩久久一区二区| 韩国三级在线播放| 一区免费视频| 欧美日韩一区在线视频| 写真福利精品福利在线观看| 中文国产亚洲喷潮| 国产精品久久久久久在线| 一区二区三区丝袜| 少妇一级淫免费观看| 母乳一区在线观看| 午夜精品一区二区三区四区 | 欧美不卡在线视频| 国产精品第9页| 国产亚洲一区二区三区四区| 亚洲国产日韩欧美在线观看| 欧美不卡在线| 久久久婷婷一区二区三区不卡| 亚洲电影有码| 欧美国产日韩中文字幕在线| 五月婷婷深深爱| 欧美亚洲一区三区| 久久久全国免费视频| 91免费视频网| 亚洲精品免费一区亚洲精品免费精品一区 | 日韩av女优在线观看| 欧美激情一区三区| 日本中文字幕有码| 免费成人性网站| 欧美高清中文字幕| 日本在线电影一区二区三区| 亚洲一区二区三区久久| 成人免费直播| 欧美床上激情在线观看| 欧美日本韩国一区二区| 成人一级视频在线观看| 久久久亚洲网站| 国产乱视频在线观看| 日韩欧美区一区二| 波多野结衣家庭主妇| 一区二区三区成人| 久久久精品成人| av电影在线观看完整版一区二区| 午夜欧美福利视频| 精品成人在线| 中文字幕在线乱| 国产欧美日韩影院| 韩国成人一区| 精品一区二区三区中文字幕视频| 国产mv久久久| a毛片不卡免费看片| 日韩视频免费在线观看| 日韩一区二区三区中文字幕| 欧美一区二区三区视频免费播放| 午夜精品免费观看| 午夜精品福利一区二区蜜股av | 潘金莲一级淫片aaaaa| 日韩成人伦理电影在线观看| 五月丁香综合缴情六月小说| 欧美二区视频| 天天成人综合网| 精品美女视频| 欧洲亚洲一区| 亚洲妇女av| 久久精品国产精品国产精品污| 美女久久精品| 91最新国产视频| 色成人综合网| 国产日韩欧美在线视频观看| 成人深夜福利| 国产精品国产三级国产aⅴ浪潮| 三级在线观看视频| 777午夜精品福利在线观看| 国产经典三级在线| 欧美日韩国产第一页| 成人三级网址| 欧美wwwxxxx| 伊人精品影院| 欧美高清视频一区二区| 午夜av在线播放| 欧美二区在线播放| 美女网站视频在线| 国内免费久久久久久久久久久| 黄色在线观看视频网站| 久久久久久成人精品| 久久久123| 亚洲欧美成aⅴ人在线观看| www.久久久| 深夜福利亚洲| 亚洲自拍偷拍在线| 亚洲国产一区二区三区网站| 97夜夜澡人人双人人人喊| 欧一区二区三区| 99热在线国产| 精品欠久久久中文字幕加勒比| 国产一区福利视频| 日韩高清电影免费| 日本一区二区精品视频| 日韩精品网站| 黄色a级在线观看| 激情偷拍久久| 六月丁香婷婷激情| 美女视频黄免费的久久| 手机在线视频一区| 亚洲少妇久久久| 国产一区二区中文字幕| 在线看黄色的网站| 久久亚洲影视婷婷| 中文乱码字幕高清一区二区| 亚洲欧美电影一区二区| 国产精品久久久久久99| 欧美在线观看视频一区二区 | 国内不卡的二区三区中文字幕| 日韩视频在线观看一区二区三区| 国产成人免费xxxxxxxx| 亚洲观看黄色网| 国产偷国产偷亚洲高清人白洁| 免费黄色国产视频| 亚洲高清中文字幕| 蜜臀99久久精品久久久久小说 | 亚洲国产中文字幕| 日韩美一区二区| 欧美老女人第四色| 蜜桃视频久久一区免费观看入口| 亚洲人高潮女人毛茸茸| 黄色动漫在线| 日本欧美黄网站| 高清不卡一区| 欧美精品国产精品久久久| 天天综合亚洲| 人妻少妇被粗大爽9797pw| 久久机这里只有精品| 精品无码在线视频| 亚洲欧美视频一区| 波多野结衣网站| 精品国产91九色蝌蚪| 午夜伦理在线| 日本久久久a级免费| 日本中文字幕第一页| 日韩中文字幕一区二区三区| 亚洲天堂网2018| www日韩大片| 免费在线一区二区三区| 欧美视频自拍偷拍| 日本人妻丰满熟妇久久久久久| 综合136福利视频在线| 美女的胸无遮挡在线观看| 亚洲一区二区三区sesese| 加勒比久久综合| 欧美 丝袜 自拍 制服 另类| 国产综合色视频| 天天干天天舔天天操| 亚洲成人7777| 朝桐光av在线一区二区三区| 日韩中文在线视频| 吉吉日韩欧美| 精品无人区一区二区三区| 国产精品hd| 性久久久久久久久久久久久久| 国产女同性恋一区二区| 在线天堂中文字幕| 亚洲国产精品推荐| 牛牛电影国产一区二区| 亚洲va久久久噜噜噜| av一区二区高清| 人妻丰满熟妇av无码区app| 91网站在线播放| 日韩特黄一级片| 精品久久免费看| 色女人在线视频| 91丨九色丨国产| 欧美日韩国产在线一区| 色男人天堂av| 亚洲色图制服诱惑| 国产精品欧美激情在线| 日韩视频免费看| 国产精品视频一区视频二区| 黄色高清视频网站| 国产一区二三区好的| 亚洲色婷婷一区二区三区| 欧美美女视频在线观看| 欧美精品电影| 91久久精品日日躁夜夜躁国产| 日韩在线视屏| 亚洲免费在线播放视频| 亚洲欧美日韩综合aⅴ视频| 国产男女猛烈无遮挡| 两个人的视频www国产精品| 国产欧美日韩电影| 精品视频在线观看一区二区| 岛国一区二区在线观看| 欧美一二三区视频| 亚洲精品小视频| 欧美精品高清| 伊人久久大香线蕉成人综合网| 国产在线国偷精品产拍免费yy| 青草影院在线观看| 精品日韩在线观看| 丁香六月综合| 亚洲欧美在线网| 国产成人在线色| 日操夜操天天操| 亚洲视频自拍偷拍| 亚洲老司机网| 欧美午夜性视频| 国产成人免费av一区二区午夜| 亚洲第一福利视频| 午夜久久中文| 香蕉久久免费影视| 国产一区二区免费视频| 国产极品在线播放| 亚洲性视频网址| 国产精品亚洲欧美日韩一区在线| 成人在线视频一区二区三区| 99re免费视频精品全部| 中文字幕免费高清在线观看| 欧美成人亚洲成人| 你懂的一区二区三区| 成年人三级黄色片| 亚洲午夜日本在线观看| 久久久久久久影视| 91亚洲国产成人精品性色| 亚洲日本免费| 极品尤物一区二区| 精品成人在线观看| 精品福利在线| 一二三四视频社区在线| 中文字幕永久在线不卡| 六月婷婷综合网| 国产欧美精品一区二区| 一本一本久久| 欧美 日韩 国产 一区二区三区| 日韩av有码在线| 国产精品视频首页| 婷婷丁香激情网| 久久国产精品无码网站| 日韩欧美第二区在线观看|