精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO) 精華

發(fā)布于 2024-4-23 10:20
瀏覽
0收藏

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

文章鏈接:??https://arxiv.org/pdf/2404.11098??


在AIGC時(shí)代,對(duì)低成本甚至設(shè)備端應(yīng)用擴(kuò)散模型的需求日益增加。在壓縮Stable Diffusion模型(SDM)方面,提出了幾種方法,其中大多數(shù)利用手工設(shè)計(jì)的層移除方法來(lái)獲得更小的U-Net,同時(shí)利用知識(shí)蒸餾來(lái)恢復(fù)網(wǎng)絡(luò)性能。然而,這種手工設(shè)計(jì)的層移除方式效率低下,缺乏可擴(kuò)展性和泛化性,并且在重新訓(xùn)練階段使用的特征蒸餾面臨著不平衡問(wèn)題,即一些數(shù)值顯著的特征損失項(xiàng)在整個(gè)重新訓(xùn)練過(guò)程中占主導(dǎo)地位。


為此,本文提出了用于壓縮擴(kuò)散模型(LAPTOP-Diff)的層剪枝和歸一化蒸餾方法。

  • 引入了層剪枝方法來(lái)自動(dòng)壓縮SDM的U-Net,并提出了一個(gè)有效的一次性剪枝準(zhǔn)則,其一次性性能由其良好的可加性特性保證,超越了其他層剪枝和手工設(shè)計(jì)的層移除方法;
  • 提出了歸一化特征蒸餾用于重新訓(xùn)練,緩解了不平衡問(wèn)題。
    利用所提出的LAPTOP-Diff,壓縮了SDXL和SDM-v1.5的U-Net,以獲得最先進(jìn)的性能,即使在剪枝比率為50%時(shí),PickScore僅下降了最小的4.0%,而比較方法的最小PickScore下降為8.2%。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

引言

在最近幾年,文本到圖像(T2I)合成的生成建模經(jīng)歷了快速進(jìn)展。特別是,擴(kuò)散模型以其生成高分辨率、照片逼真且多樣化的圖像的能力而出現(xiàn)。在所有擴(kuò)散模型中,Stable Diffusion模型(SDM)是最具影響力的一個(gè),在AIGC社區(qū)中扮演著至關(guān)重要的角色,作為一個(gè)開(kāi)源框架,為廣泛的下游應(yīng)用提供了基礎(chǔ)。


然而,SDM卓越的性能伴隨著其相當(dāng)大的內(nèi)存消耗和延遲,使其在個(gè)人計(jì)算機(jī)甚至移動(dòng)設(shè)備上的部署受到嚴(yán)重限制。此外,最近版本的SDM系列,如SDXL,往往會(huì)增加更多的參數(shù),導(dǎo)致內(nèi)存消耗和延遲進(jìn)一步增加。


為了減少SDM的推理預(yù)算,提出了幾種方法,即降噪步驟的減少、高效的架構(gòu)設(shè)計(jì)、結(jié)構(gòu)剪枝、量化和硬件優(yōu)化。這些方法通常是相互正交的。


在這些方法中,高效的架構(gòu)設(shè)計(jì)和結(jié)構(gòu)剪枝是被低估的。一方面,先前的高效架構(gòu)設(shè)計(jì)方法通常通過(guò)大量的經(jīng)驗(yàn)研究來(lái)識(shí)別SDM的U-Net中不重要的層,然后移除它們以獲得更小更快的網(wǎng)絡(luò)。這種手工設(shè)計(jì)的方式通常無(wú)法達(dá)到最佳性能,并且缺乏可擴(kuò)展性和泛化性。

注意到,這些手工設(shè)計(jì)的層移除方法可以被自動(dòng)方案中的層剪枝方法所替代,以獲得更好的可擴(kuò)展性和性能。另一方面,先前的SDM結(jié)構(gòu)剪枝方法側(cè)重于精細(xì)的剪枝,即剪枝參數(shù)矩陣的行和列。然而,有研究表明,與更細(xì)粒度的結(jié)構(gòu)剪枝相比,粗粒度的層剪枝通常在減少模型延遲方面效率更低,并且有趣的是,層剪枝有可能達(dá)到與更細(xì)粒度的結(jié)構(gòu)剪枝甚至更好的性能?;谝陨蟽牲c(diǎn),層剪枝方法值得研究。


在層移除或剪枝之后,SDMs通常無(wú)法直接生成清晰的圖像。先前的方法利用知識(shí)蒸餾來(lái)重新訓(xùn)練被剪枝的網(wǎng)絡(luò)以恢復(fù)其性能。先前的方法通常利用三種類型的目標(biāo),即常規(guī)訓(xùn)練目標(biāo)、對(duì)數(shù)蒸餾(輸出蒸餾)目標(biāo)和特征蒸餾目標(biāo)。在這三個(gè)部分中,特征蒸餾是關(guān)鍵部分。然而,進(jìn)一步的檢查發(fā)現(xiàn),先前基于蒸餾的重新訓(xùn)練方法存在一個(gè)不平衡問(wèn)題,即一些特征損失項(xiàng)在整個(gè)重新訓(xùn)練過(guò)程中占主導(dǎo)地位,導(dǎo)致性能下降。


本文提出了用于壓縮擴(kuò)散模型的層剪枝和歸一化蒸餾方法(LAPTOP-Diff),將SDM的高效架構(gòu)設(shè)計(jì)和結(jié)構(gòu)剪枝推向自動(dòng)化、可擴(kuò)展性和更大性能的領(lǐng)域。從組合優(yōu)化問(wèn)題的高角度來(lái)闡述層剪枝問(wèn)題,并以簡(jiǎn)單而有效的一次性方式解決它。


受益于這種視角,我們探索了幾種其他可能的剪枝標(biāo)準(zhǔn),并通過(guò)消融研究,發(fā)現(xiàn)一次性層剪枝標(biāo)準(zhǔn)的有效性來(lái)自其良好的可加性屬性。此外,確定了先前基于蒸餾的重新訓(xùn)練方法存在一個(gè)不平衡問(wèn)題,即一些特征損失項(xiàng)在整個(gè)重新訓(xùn)練過(guò)程中占主導(dǎo)地位,通過(guò)提出的歸一化特征蒸餾來(lái)緩解這個(gè)問(wèn)題。貢獻(xiàn)總結(jié)如下:


  • 探索了層剪枝在SDMs上的一個(gè)被低估的結(jié)構(gòu)剪枝方法,并提出了一個(gè)有效的一次性剪枝標(biāo)準(zhǔn),其一次性性能由其良好的可加性屬性保證,超越了其他層剪枝和手工設(shè)計(jì)的層移除方法,將先前基于層移除的高效架構(gòu)設(shè)計(jì)方法推向自動(dòng)化、可擴(kuò)展性和更大性能。
  • 通過(guò)提出的歸一化特征蒸餾方法緩解了先前基于蒸餾的重新訓(xùn)練存在的不平衡問(wèn)題。
  • 提出的LAPTOP-Diff在不同SDMs和剪枝比率下大大超越了基于層移除的高效架構(gòu)設(shè)計(jì)方法,在不同SDMs和剪枝比率下具有更好的網(wǎng)絡(luò)性能。

相關(guān)工作

擴(kuò)散模型

擴(kuò)散模型是一種利用迭代去噪過(guò)程來(lái)合成數(shù)據(jù)的生成模型。在文本到圖像(T2I)合成領(lǐng)域,諸如DALL·E、Imagen、Deepfloyd IF和Stable Diffusion等擴(kuò)散模型展示了它們生成高分辨率、照片逼真且多樣化圖像的顯著能力。在各種擴(kuò)散模型中,Stable Diffusion在學(xué)術(shù)界和工業(yè)界都是最具影響力的一個(gè)。Stable Diffusion模型(SDM)是一種在低維潛在空間執(zhí)行迭代去噪過(guò)程,然后通過(guò)VAE解碼器將潛在表示轉(zhuǎn)換為像素空間圖像的潛在擴(kuò)散模型。SDM系列還有一個(gè)更新版本,即SDXL,在更高分辨率的1024×1024下展示出卓越的圖像生成質(zhì)量。


然而,擴(kuò)散模型令人印象深刻的性能伴隨著相當(dāng)大的內(nèi)存消耗和延遲。為了減少SDM的模型預(yù)算,已經(jīng)探索了幾種方法,例如,減少去噪步驟、量化、硬件優(yōu)化、高效的架構(gòu)設(shè)計(jì)和結(jié)構(gòu)剪枝。

SDM的高效架構(gòu)設(shè)計(jì)

與許多其他減少SDM模型預(yù)算的方法正交,高效的架構(gòu)設(shè)計(jì)主要旨在設(shè)計(jì)原始SDM U-Net的有效子結(jié)構(gòu),因?yàn)榇蟛糠諷DM的內(nèi)存消耗和延遲來(lái)自其U-Net。這種類型的先前方法通常通過(guò)大量的經(jīng)驗(yàn)研究來(lái)識(shí)別SDM U-Net中不重要的層,并移除它們以獲得更小更快的網(wǎng)絡(luò)。


例如,BK-SDM通過(guò)層移除為SDM-v1或SDM-v2手工設(shè)計(jì)了3個(gè)不同大小的高效U-Net,部分遵循了對(duì)BERT模型進(jìn)行壓縮的經(jīng)驗(yàn)結(jié)論。SSD-1B和Segmind-Vega(在本文的其余部分將它們簡(jiǎn)稱為SSD和Vega)通過(guò)人類評(píng)估識(shí)別不重要的層,然后施加層移除,為SDXL手工設(shè)計(jì)了2個(gè)不同大小的高效U-Net。KOALA是從BK-SDM衍生出來(lái)的,也通過(guò)層移除為SDXL手工設(shè)計(jì)了2個(gè)不同大小的高效U-Net。


這種手工設(shè)計(jì)的方式通常無(wú)法達(dá)到最佳性能,并且缺乏可擴(kuò)展性和泛化性。我們注意到這些基于層移除的方法可以歸類為手工設(shè)計(jì)的層剪枝。因此,我們提出這些手工設(shè)計(jì)的層移除方法可以被層剪枝方法在自動(dòng)方案中替代,以獲得更好的可擴(kuò)展性和性能。

層剪枝

層剪枝,也稱為深度剪枝,是一種旨在自動(dòng)評(píng)估和移除不重要層的結(jié)構(gòu)剪枝方法。與其他結(jié)構(gòu)剪枝方法不同,由于其粗粒度的特性,層剪枝受到的關(guān)注較少。相比于那些細(xì)粒度的結(jié)構(gòu)剪枝方法,層剪枝通常被認(rèn)為效果較差。然而,有研究表明,與細(xì)粒度的結(jié)構(gòu)剪枝方法相比,粗粒度的層剪枝通常更有效地減少模型的延遲,并且有可能實(shí)現(xiàn)相同甚至更好的性能。


雖然已經(jīng)提出了幾種層剪枝方法,但是沒(méi)有一種方法是從組合優(yōu)化問(wèn)題的角度來(lái)看待層剪枝。基于幅度和基于泰勒展開(kāi)的剪枝是常見(jiàn)的基準(zhǔn)線。基于幅度的層剪枝使用層中參數(shù)的幅度總和作為層重要性標(biāo)準(zhǔn),基于泰勒展開(kāi)的層剪枝使用損失函數(shù)的一階泰勒展開(kāi)作為層重要性標(biāo)準(zhǔn)。在通過(guò)不同的重要性標(biāo)準(zhǔn)評(píng)估每個(gè)層的重要性后,先前的層剪枝方法選擇修剪最不重要的層。


本文從更高的角度將層剪枝問(wèn)題描述為組合優(yōu)化問(wèn)題,并以簡(jiǎn)單而有效的一次性方式解決了它,形成了一個(gè)有效的一次性剪枝標(biāo)準(zhǔn),超越了其他層剪枝和手工設(shè)計(jì)的層移除方法。此外,通過(guò)這樣的視角,能夠確定一次性層剪枝標(biāo)準(zhǔn)的有效性來(lái)自于其良好的可加性屬性。

基于蒸餾的重新訓(xùn)練

在層移除或剪枝之后,SDMs通常無(wú)法直接生成清晰的圖像。先前的方法通過(guò)利用知識(shí)蒸餾來(lái)重新訓(xùn)練被剪枝的SDMs以恢復(fù)其性能。在重新訓(xùn)練階段使用的知識(shí)蒸餾通常包括三部分,即常規(guī)訓(xùn)練目標(biāo)、對(duì)數(shù)蒸餾(輸出蒸餾)目標(biāo)和特征蒸餾目標(biāo)。在這三個(gè)部分中,特征蒸餾是最有效的。然而,在實(shí)踐中,發(fā)現(xiàn)了基于蒸餾的重新訓(xùn)練過(guò)程中存在一個(gè)不平衡問(wèn)題。為此提出了一種簡(jiǎn)單而有效的重新加權(quán)策略來(lái)緩解這個(gè)問(wèn)題。

方法論

初步

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

先前的方法重新訓(xùn)練剪枝的SDM U-Net使用了三個(gè)目標(biāo),即任務(wù)損失、對(duì)數(shù)蒸餾(輸出蒸餾)損失和特征蒸餾損失:

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

一次性層剪枝

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)


目標(biāo)(2)的上界。根據(jù)三角不等式,我們得到了目標(biāo)(2)的上界。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

因此,我們?yōu)槟繕?biāo)(2)找到了一個(gè)替代目標(biāo)。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

最終,借助假設(shè)(5),我們可以通過(guò)優(yōu)化其近似的目標(biāo)來(lái)優(yōu)化目標(biāo)(4)。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

使用目標(biāo)(6)來(lái)代替原始目標(biāo)(2)意味著一種有趣的屬性,稱為可加性,即網(wǎng)絡(luò)受到多個(gè)擾動(dòng)引起的輸出失真大約等于每個(gè)單一擾動(dòng)引起的輸出失真之和。在第4.3節(jié)中進(jìn)行的進(jìn)一步實(shí)驗(yàn)驗(yàn)證了我們方法在SDMs上的可加性屬性,顯示出最終的目標(biāo)(6)是對(duì)原始目標(biāo)(2)的良好近似,同時(shí),假設(shè)(5)也得到了很好的支持。


為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)


實(shí)驗(yàn)和消融研究表明,我們的輸出損失剪枝標(biāo)準(zhǔn)顯著滿足可加性屬性,并在不同SDM模型上實(shí)現(xiàn)了最佳性能。此外,對(duì)于我們構(gòu)建的三個(gè)剪枝標(biāo)準(zhǔn),即輸出損失、Δ任務(wù)損失和ΔCLIP分?jǐn)?shù),對(duì)于每個(gè)模型,具有更強(qiáng)可加性屬性的標(biāo)準(zhǔn)實(shí)現(xiàn)了更好的剪枝性能。這個(gè)觀察是合理的,因?yàn)橐淮涡詫蛹糁χ苯觾?yōu)化了替代目標(biāo),如(6),而不是原始目標(biāo),如(2),優(yōu)化那些更好地近似原始目標(biāo)的替代目標(biāo)通常可以實(shí)現(xiàn)更好的剪枝性能。基于以上觀察和討論,我們可以得出結(jié)論,我們的輸出損失標(biāo)準(zhǔn)的有效性來(lái)自其良好的可加性屬性。

規(guī)范化特征蒸餾

在實(shí)踐中,我們發(fā)現(xiàn)重新訓(xùn)練的關(guān)鍵目標(biāo)是特征損失LFeatKD。然而,進(jìn)一步的檢查揭示了前面在重新訓(xùn)練階段采用的特征蒸餾方法存在不平衡問(wèn)題。如下圖3所示,不同階段末端的特征圖的L2-范數(shù)和不同特征損失項(xiàng)的值變化顯著。在圖3中顯示的相同現(xiàn)象在使用我們的層剪枝或手工層刪除的不同剪枝設(shè)置下,無(wú)論是在SDXL還是SDM-v1.5上都觀察到。在整個(gè)蒸餾過(guò)程中,最高的特征損失項(xiàng)約比最低的特征損失項(xiàng)大10000倍,并產(chǎn)生大約1000倍更大的梯度,稀釋了數(shù)值上不顯著的特征損失項(xiàng)的梯度。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

由于具有更大 L2-范數(shù)的特征圖自然傾向于產(chǎn)生更大的特征損失項(xiàng),不同特征損失項(xiàng)的顯著幅度差異歸因于兩個(gè)因素,即在不同階段末端,教師和學(xué)生之間特征圖的固有差異不同,以及特征圖的 L2-范數(shù)不同。第二個(gè)因素在很大程度上加劇了不平衡問(wèn)題。


基于以上觀察,簡(jiǎn)單地將所有特征損失項(xiàng)相加將導(dǎo)致少數(shù)特征損失項(xiàng)嚴(yán)重占優(yōu),阻礙數(shù)值上不顯著的特征損失項(xiàng)的減少,導(dǎo)致性能下降。為此,我們提出了一種簡(jiǎn)單而有效的特征蒸餾重新加權(quán)策略,以消除第二個(gè)因素對(duì)不平衡問(wèn)題的影響。我們選擇利用教師特征圖的 L2-范數(shù)重新加權(quán)特征損失項(xiàng),并將特征蒸餾適應(yīng)于我們的剪枝方案。規(guī)范化特征損失的制定如下:

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

其中,?? 是剪枝后仍保留有殘差層或transformer層的階段集合,|?? | 是集合 ?? 的大小。因此,整體重新訓(xùn)練目標(biāo)是:

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

實(shí)驗(yàn)

實(shí)現(xiàn)

在本小節(jié)中,主要詳細(xì)闡述了基本的實(shí)現(xiàn)設(shè)置。更多細(xì)節(jié)請(qǐng)參見(jiàn)補(bǔ)充材料。


模型選擇。在后面實(shí)驗(yàn)中,采用 512×512 分辨率以進(jìn)行快速驗(yàn)證,對(duì) SDXL 模型使用 ProtoVisionXL-v6.2.0,因?yàn)楣俜桨l(fā)布的 SDXL-Base-1.0在 512×512 分辨率附近生成的圖像異常,而對(duì)于 SDM-v1.5 模型,我們使用了官方發(fā)布的 stable-diffusion-v1-5。實(shí)驗(yàn),我們使用了每種比較方法的相同教師模型。


數(shù)據(jù)集。對(duì)于用于剪枝的校準(zhǔn)數(shù)據(jù)集,使用 LAION-2B的隨機(jī)抽樣的 1K 子集。在消融研究中,使用了 LAION-2B的隨機(jī)抽樣的 0.34M 子集。為了與其他方法進(jìn)行比較,使用了相同的數(shù)據(jù)集或選擇了質(zhì)量和數(shù)量較低的數(shù)據(jù)集,如果其他方法報(bào)告的數(shù)據(jù)集難以復(fù)現(xiàn),會(huì)選擇質(zhì)量和數(shù)量較低的數(shù)據(jù)集。數(shù)據(jù)集的選擇詳見(jiàn)補(bǔ)充材料。


評(píng)估指標(biāo)。盡管評(píng)估生成式 T2I 模型常用的指標(biāo)是 FID和 CLIP 分?jǐn)?shù),但最近的研究表明這兩個(gè)指標(biāo)與視覺(jué)美學(xué)和人類偏好之間的相關(guān)性較低。因此,

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

采用了 3 個(gè)高級(jí)指標(biāo)來(lái)評(píng)估模型的綜合性能。使用 HPS v2、PickScore和 ImageReward來(lái)評(píng)估生成圖像的視覺(jué)質(zhì)量和文本-圖像一致性。在它們各自的基準(zhǔn)數(shù)據(jù)集上計(jì)算這 3 個(gè)指標(biāo),即 HPS v2 在其 3.2K 基準(zhǔn)數(shù)據(jù)集上計(jì)算,ImageReward 在 ImageRewardDB的隨機(jī)抽樣的 3K 子集上計(jì)算,而 PickScore 在 Pick-a-Pic v1的隨機(jī)抽樣的 3K 子集上計(jì)算。

與其他方法的比較

到目前為止,對(duì)于 SDM 模型有三種手工制作的層移除方法。KOALA、SSD 和 Vega適用于 SDXL,而 BK-SDM可應(yīng)用于 SDM-v1 或 SDM-v2。將 LAPTOP-Diff 與這三種方法在相應(yīng)的模型上進(jìn)行比較。使用 SDXL-Base-1.0與 KOALA 1.16B 和 782M 進(jìn)行比較,使用 RealisticVision-v4.0與更先進(jìn)的 BK-SDM實(shí)現(xiàn)(由 Segmind)進(jìn)行比較,即 579M small-sd和 323M tiny-sd。對(duì)于與 1.3B SSD和 745M Vega進(jìn)行比較,僅使用它們?cè)诙嘟處熣麴s策略中使用的三個(gè)教師模型之一,即 ZavychromaXL-v1.0。對(duì)于所有比較方法的評(píng)估,我們使用它們發(fā)布的模型權(quán)重。


表1 顯示了與最先進(jìn)的壓縮 SDM 模型的比較結(jié)果。提出的 LAPTOP-Diff 實(shí)現(xiàn)了最先進(jìn)的性能。與 SSD和 Vega的視覺(jué)比較如圖5 所示,其他方法的更多視覺(jué)比較見(jiàn)補(bǔ)充材料??梢杂^察到,與其他方法相比,我們的方法在不同提示下實(shí)現(xiàn)了更好的視覺(jué)效果。值得注意的是,我們的大約 50% 壓縮的 SDXL 模型幾乎可以達(dá)到原始模型的相同視覺(jué)質(zhì)量。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

添加性質(zhì)的驗(yàn)證

由于最終的替代目標(biāo) (6) 是原始目標(biāo) (2) 的上界的近似,有必要檢驗(yàn)近似的精度。通過(guò)選擇不同的 ?? 和 Rm,覆蓋從 0% 到 90% 的剪枝比率,模擬了近似準(zhǔn)則 (6) 和真實(shí)準(zhǔn)則 (2) 的值。我們還對(duì)剪枝準(zhǔn)則 Δtask loss 和 ΔCLIP score 進(jìn)行了相同的實(shí)驗(yàn)。如圖6 所示,我們的輸出損失準(zhǔn)則在不同模型下顯著滿足添加性質(zhì),即使在極端的剪枝比率下也是如此,幾乎所有觀察點(diǎn)都位于恒等線附近。因此,我們最終的替代目標(biāo) (6) 是原始目標(biāo) (2) 的出色近似。另一方面,其他準(zhǔn)則未能始終滿足添加性質(zhì)。雖然我們的輸出損失準(zhǔn)則在不同模型之間具有最強(qiáng)的添加性質(zhì),但 ΔCLIP score 在 SDXL 上具有第二強(qiáng)的添加性質(zhì),而 Δtask loss 在 SDM-v1.5 上具有第二強(qiáng)的添加性質(zhì)。

剪枝準(zhǔn)則消融實(shí)驗(yàn)

實(shí)驗(yàn)表明,我們的輸出損失準(zhǔn)則在不同模型上顯著并一致地滿足添加性質(zhì),而其他準(zhǔn)則未能達(dá)到這一點(diǎn)。此外,我們?cè)u(píng)估了使用不同剪枝準(zhǔn)則的剪枝性能,包括我們構(gòu)建的剪枝準(zhǔn)則和兩個(gè)基線剪枝準(zhǔn)則,即幅度度量和損失函數(shù)的一階泰勒展開(kāi)。我們首先使用不同的層剪枝準(zhǔn)則對(duì) SDXL 和 SDM-v1.5 進(jìn)行剪枝,然后通過(guò)普通蒸餾對(duì)修剪后的網(wǎng)絡(luò)進(jìn)行相同次數(shù)的重新訓(xùn)練。如表2 所示,在不同模型上,輸出損失準(zhǔn)則在剪枝準(zhǔn)則中取得了最高的剪枝性能。


除了不同的剪枝準(zhǔn)則,還將層剪枝方法與手工制作的層移除方法進(jìn)行了比較。對(duì)于 SDXL 和 SDM-v1.5 的實(shí)驗(yàn),分別使用 SSD和 BK-SDM的相同手工制作層移除設(shè)置。表2 中的結(jié)果顯示,除了基于幅度的層剪枝被 SDXL 上的手工制作方法 SSD 打敗外,幾乎所有的層剪枝方法通常都優(yōu)于手工制作方法。


值得注意的是,在我們構(gòu)建的三種剪枝準(zhǔn)則中,即輸出損失、Δtask loss 和 ΔCLIP score,雖然輸出損失在不同模型上取得了最佳性能,但 ΔCLIP score 在 SDXL 上取得了第二好的性能,而 Δtask loss 在 SDM-v1.5 上取得了第二好的性能,與它們添加性質(zhì)的排名相一致。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

知識(shí)蒸餾消融實(shí)驗(yàn)

通過(guò)消融研究驗(yàn)證了我們的歸一化特征蒸餾的有效性。使用我們的一次性層剪枝方法對(duì) SDXL 和 SDM-v1.5 進(jìn)行剪枝,然后使用普通蒸餾或我們的歸一化蒸餾對(duì)修剪后的網(wǎng)絡(luò)進(jìn)行相同次數(shù)的重新訓(xùn)練。如表3 所示,我們的方法在 SDXL 和 SDM-v1.5 上都取得了很好的性能改進(jìn)。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

剪枝分析

以剪枝比例為 50% 的 SDXL 的 U-Net 和剪枝比例為 33% 的 SDM-v1.5 的 U-Net 為例進(jìn)行了剪枝架構(gòu)的分析。如表4 所示,對(duì)于 SDXL 和 SDM-v1.5,許多位于中間階段及其附近的層被認(rèn)為不太重要,因此被剪枝了。這一觀察結(jié)果與先前的手工制作層移除方法一致。然而,我們觀察到的是,與之前的手工制作層移除方法不同,更多的層在 Dn 階段被剪枝,而不是在 Up 階段。對(duì)于 SDXL,我們觀察到在 Dn 階段有 30 層中有 18 層被剪枝,而在 Up 階段只有 10 層中有 10 層被剪枝。同樣的現(xiàn)象也在 SDM-v1.5 上觀察到,在 Dn 階段有 14 層中有 4 層被剪枝,而在 Up 階段只有 21 層中有 1 層被剪枝。這一觀察結(jié)果與其他研究一致,即 Dn 階段,即 U-Net 的編碼器,不如 U-Net 的其他部分重要。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

結(jié)論

本項(xiàng)工作提出了用于壓縮擴(kuò)散模型的層剪枝和歸一化蒸餾(LAPTOP-Diff)。引入了層剪枝方法來(lái)實(shí)現(xiàn)自動(dòng)化、可擴(kuò)展性和更好的性能,并提出了一種有效的一次性剪枝準(zhǔn)則,即輸出損失準(zhǔn)則,其有效性是通過(guò)其良好的添加性質(zhì)來(lái)保證的。進(jìn)一步通過(guò)提出的歸一化特征蒸餾來(lái)緩解先前基于蒸餾的重訓(xùn)練中的不平衡問(wèn)題。使用提出的 LAPTOP-Diff,為 SDMs 實(shí)現(xiàn)了最先進(jìn)的性能壓縮。


本文轉(zhuǎn)自 AI生成未來(lái) ,作者:Dingkun Zhang等


原文鏈接:??https://mp.weixin.qq.com/s/fs-m7J3LZjUKCKup6yNyzA??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
哺乳挤奶一区二区三区免费看 | 91成人免费网站| 久久久99国产精品免费| 岳乳丰满一区二区三区| 欧美二区视频| 亚洲丝袜在线视频| 先锋资源在线视频| 中文不卡1区2区3区| 亚洲欧美在线高清| 精品日本一区二区| 在线免费看av片| 一本综合精品| 久久精品一偷一偷国产| 中文字幕日韩三级片| 欧美美女被草| 色综合久久久久综合| 免费观看国产视频在线| 国产三级视频在线看| 国产精品 欧美精品| 国产成人精品999| 久艹视频在线观看| 91青青国产在线观看精品| 亚洲国产精品电影| 亚洲欧美日韩一二三区| 欧美日韩123区| 亚洲国产日产av| 一本色道久久综合亚洲二区三区| 人妻少妇一区二区三区| 另类的小说在线视频另类成人小视频在线| 欧美激情国内偷拍| 女教师淫辱の教室蜜臀av软件| 成人自拍在线| 欧美精品亚洲一区二区在线播放| 欧美日韩中文在线视频| 日韩免费影院| 国产精品不卡在线| 欧美在线视频二区| 色综合成人av| 不卡一区中文字幕| 99久热re在线精品996热视频| 国产精品成人久久久| 99精品国产一区二区青青牛奶 | 欧美极品一区二区| 五月天激情开心网| 成人免费的视频| 99视频日韩| 性中国古装videossex| 久久av资源站| 国产综合福利在线| 中文字幕一区二区久久人妻| 日韩在线观看一区二区| 欧美重口另类videos人妖| 国产精品2020| 国内久久视频| 久久久久久久久久av| 国产在线一卡二卡| 自拍偷拍欧美| 欧美精品午夜视频| 午夜69成人做爰视频| 亚洲一级毛片| 美女性感视频久久久| www色aa色aawww| 91精品国产乱码久久久久久| 美女精品视频一区| 久久免费精彩视频| 亚洲激情婷婷| 清纯唯美亚洲激情| 午夜一级黄色片| 蜜桃精品在线观看| 91啪国产在线| 亚洲精品一区二区三区蜜桃| 成人免费不卡视频| 欧美日韩精品免费在线观看视频| 理论视频在线| 中文字幕第一区二区| 亚洲区一区二区三区| 九义人在线观看完整免费版电视剧| 国产精品电影一区二区| 国产免费内射又粗又爽密桃视频| 污片视频在线免费观看| 亚洲6080在线| 亚洲精品一二三四五区| 偷拍自拍亚洲| 欧美xingq一区二区| 国产精品福利导航| 精品国产一区二区三区小蝌蚪 | 色呦呦在线视频| 精品久久久久久久久久| 成人精品视频一区二区| 24小时成人在线视频| 欧美哺乳videos| 香蕉视频黄色在线观看| 日韩片欧美片| 国语自产精品视频在线看| 综合网在线观看| 狠狠色丁香久久婷婷综合丁香| 99在线视频播放| 免费黄色在线视频网站| 亚洲欧美激情一区二区| 亚洲欧洲日产国码无码久久99| 看片一区二区| 亚洲第五色综合网| 国产又粗又猛又爽又黄的视频四季| 亚洲澳门在线| 国产成人精品日本亚洲| 国产欧美第一页| 91麻豆.com| 日本天堂免费a| www.久久.com| 日韩成人小视频| 国产乱国产乱老熟300| 久色成人在线| 国产美女精品在线观看| jizzjizz在线观看| 狠狠色狠色综合曰曰| 手机精品视频在线| 成人影院在线| 欧美一性一乱一交一视频| www.亚洲天堂.com| 国产精品电影院| 手机看片福利盒子久久| 欧美日韩一区二区三区不卡视频| 久久精品中文字幕一区| 亚洲国产成人精品女人久久| 国产不卡免费视频| 在线天堂一区av电影| 都市激情综合| 日韩av影片在线观看| 久久精品一区二区三| 久久国产日韩欧美精品| 日韩在线第一区| 一区二区电影免费观看| 亚洲精品国产综合区久久久久久久| 国产精品国产精品88| 日本欧美一区二区在线观看| 国产精品一区二区三区不卡 | 久久9999久久免费精品国产| 久久99精品久久久| 欧美日韩另类丝袜其他| 蜜桃成人365av| 欧美人牲a欧美精品| www.免费av| 激情自拍一区| 2022国产精品| 国产原厂视频在线观看| 欧美丝袜丝nylons| 人妻在线日韩免费视频| 亚洲第一区色| 国产一区免费观看| 国产精品69xx| 欧美草草影院在线视频| 天天干中文字幕| 成人免费看的视频| 国产aaa免费视频| 日韩高清在线观看一区二区| 精品国产一区二区三区久久狼黑人| 日本免费精品视频| 欧美—级在线免费片| 92看片淫黄大片一级| 麻豆一区二区麻豆免费观看| 欧美黑人巨大xxx极品| 国产一区二区三区成人| 国产精品久久免费看| 日本美女视频一区| 亚洲电影影音先锋| 99精彩视频在线观看免费| av网站免费在线观看| 91精品黄色片免费大全| 欧美日韩生活片| 国产资源精品在线观看| 正在播放一区二区三区| 激情不卡一区二区三区视频在线| 久久精品国产精品亚洲| av加勒比在线| 午夜久久久久久| 国产亚洲色婷婷久久99精品91| 亚洲狠狠婷婷| 久久精品五月婷婷| 日韩三区免费| 亚洲最新中文字幕| 国产高清视频免费| 亚洲第一福利视频在线| 波多野结衣加勒比| 久久久夜夜夜| 亚洲乱码国产乱码精品天美传媒| 青草伊人久久| 97不卡在线视频| 狠狠色伊人亚洲综合网站l | 日韩黄色片网站| 亚洲视频一二区| 亚洲欧美高清在线| 久久香蕉精品| 2021国产视频| 蜜桃一区二区三区| 99久久自偷自偷国产精品不卡| 白浆在线视频| 国产亚洲激情视频在线| 国产精品日韩无码| 欧美日韩国产一中文字不卡| 国产精品免费在线视频| 成人午夜av电影| 日韩av在线综合| 91tv官网精品成人亚洲| 国产精品日韩欧美一区二区三区 | 亚洲一二三级电影| 中文字幕一区二区人妻在线不卡| 免费观看久久久4p| 黄色一级片在线看| 日韩在线中文| 日韩精品伦理第一区| 警花av一区二区三区 | 欧美三区四区| 欧美寡妇偷汉性猛交| 免费a在线看| 日韩av中文在线| 91麻豆成人精品国产| 午夜精品一区二区三区三上悠亚| 少妇精品一区二区| 粉嫩aⅴ一区二区三区四区五区| 国产欧美高清在线| 尹人成人综合网| 在线视频欧美一区| 亚洲永久精品唐人导航网址| 国产在线资源一区| 亚洲ww精品| 国产精品av免费在线观看| 国产高清在线a视频大全| 中文字幕一精品亚洲无线一区| 日韩毛片在线一区二区毛片| 在线综合视频播放| 亚洲成人av影片| 亚洲午夜一区二区| 国产激情无码一区二区三区| 国产精品色一区二区三区| 久久午夜夜伦鲁鲁片| 国产精品一区二区久久不卡 | 中文字幕求饶的少妇| 久久新电视剧免费观看| 在线播放av网址| 国产又粗又猛又爽又黄91精品| 制服丝袜综合网| 日韩不卡一二三区| 精品99在线视频| 99亚洲一区二区| 免费看黄在线看| a91a精品视频在线观看| 久久国产精品网| 欧美日韩综合| av一区二区三区免费观看| 精品日本12videosex| 日本一区视频在线播放| 久久av超碰| 五月天亚洲综合| 精品久久一区| 国产卡一卡二在线| 中文字幕一区二区三三| 国产日韩第一页| 欧美在线二区| 一区高清视频| 综合一区av| 妞干网视频在线观看| 欧美日一区二区在线观看| 黄色一级大片免费| 亚洲视频成人| 免费在线观看日韩视频| 欧美亚洲三区| 日本成人在线免费视频| 亚洲综合精品四区| 自拍偷拍21p| 精品一区中文字幕| 三级一区二区三区| 国产精品一二三在| 在线观看免费视频黄| 99精品久久只有精品| 亚洲精品国产91| 国产精品麻豆欧美日韩ww| 国精品人伦一区二区三区蜜桃| 亚洲人吸女人奶水| 日韩影院一区二区| 欧美午夜精品久久久久久久| 波多野结衣理论片| 欧美一卡二卡在线观看| 日本毛片在线观看| 尤物tv国产一区| www久久日com| 国自在线精品视频| 欧美日韩电影免费看| 97视频中文字幕| 亚洲精品3区| 2025韩国大尺度电影| 在线日韩欧美| 国产高清视频网站| 国产成人综合网站| 蜜臀av一区二区三区有限公司| 国产女同互慰高潮91漫画| 欧美又粗又大又长| 色综合色狠狠天天综合色| 91丨porny丨在线中文 | 欧美a级成人淫片免费看| 欧洲美女和动交zoz0z| 亚洲综合激情在线| 草草草在线视频| 国产成人av一区二区三区在线| 国产精品久久久久久久无码| 国产精品视频你懂的| 国产又大又黑又粗免费视频| 欧美日韩一级片在线观看| 懂色av蜜臀av粉嫩av分享吧| 亚洲天堂影视av| 狠狠操一区二区三区| 日韩男女性生活视频| 亚洲精品一区二区三区中文字幕| 久久久一本精品99久久精品| 亚洲女同中文字幕| 麻豆av免费在线| 国产很黄免费观看久久| 免费观看a级片| 欧美日韩国产色| 精品国产亚洲AV| 欲色天天网综合久久| av在线私库| 97久草视频| 日韩欧美在线中字| 农村妇女精品一二区| 成人免费观看男女羞羞视频| 国产三级短视频| 欧美午夜精品久久久久久人妖| av免费观看网址| 色七七影院综合| 国产传媒在线观看| 国产欧美日韩一区| 久久久9色精品国产一区二区三区| 久草热视频在线观看| 国产一区二区精品在线观看| 看黄色录像一级片| 在线观看亚洲a| 青青草视频在线观看| 九九九热精品免费视频观看网站| 国产激情欧美| 欧洲精品一区色| 9色精品在线| 大又大又粗又硬又爽少妇毛片 | 亚洲天堂日韩电影| 91av久久| 91在线看网站| 欧美日韩在线大尺度| 99精品视频免费版的特色功能| 亚洲欧美一区二区三区国产精品| 岛国av中文字幕| 亚洲精品福利免费在线观看| 精精国产xxxx视频在线中文版| 亚洲最大成人在线| 综合久久99| 欧美一级免费在线| 亚洲激情五月婷婷| 成人激情四射网| 欧美成人精品一区二区| 国产精品亚洲四区在线观看| 久久人妻无码一区二区| 蜜桃一区二区三区在线观看| 无码人妻丰满熟妇啪啪欧美| 在线观看视频91| 国产美女av在线| 亚洲自拍小视频| 国产综合自拍| 久久精品国产亚洲AV熟女| 色噜噜狠狠成人网p站| 精品99又大又爽又硬少妇毛片| 青青草成人在线| 久久国产精品亚洲人一区二区三区 | 色狠狠久久aa北条麻妃| 91久久久久久白丝白浆欲热蜜臀| 天天成人综合网| 国产专区综合网| 久久精品www人人爽人人| 日韩欧美一区二区视频| 无码小电影在线观看网站免费| 久久久水蜜桃| 日本最新不卡在线| 久久精品国产亚洲av麻豆色欲 | 粗大的内捧猛烈进出视频| 夜色激情一区二区| 色哟哟在线观看| 成人激情视频在线| 在线欧美亚洲| 亚洲ⅴ国产v天堂a无码二区| 欧美人妇做爰xxxⅹ性高电影| fc2ppv国产精品久久| 国产欧美韩日| 日本午夜一本久久久综合| 欧美黄色免费观看| 日韩不卡在线观看| 宅男噜噜噜66国产精品免费| 成人毛片一区二区| 国产嫩草影院久久久久| 国产视频一区二区三| 少妇熟女视频一区二区三区| 国产精品夜夜嗨| 成人午夜大片免费观看| 国产情侣小视频|