精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

統一自監督預訓練!視覺模型權重無縫遷移下游任務,SiT收斂提速近47倍

人工智能 新聞
來自高德地圖的研究者提出了統一自監督預訓練(USP, Unified Self-Supervised Pretraining)。

最近的研究強調了擴散模型與表征學習之間的相互作用。擴散模型的中間表征可用于下游視覺任務,同時視覺模型表征能夠提升擴散模型的收斂速度和生成質量。然而,由于輸入不匹配和 VAE 潛在空間的使用,將視覺模型的預訓練權重遷移到擴散模型中仍然具有挑戰性。

為了解決這些問題,來自高德地圖的研究者提出了統一自監督預訓練(USP, Unified Self-Supervised Pretraining),該方法通過在變分自編碼器(VAE)的潛在空間中進行潛在掩碼建模(Masked Latent Modeling)預訓練,預訓練得到的 ViT 編碼器等權重可以無縫遷移到下游任務,包括圖像分類、語義分割以及基于擴散模型的圖像生成。

圖片

  • 論文名稱:USP: Unified Self-Supervised Pretraining for Image Generation and Understanding
  • 論文地址:https://arxiv.org/pdf/2503.06132
  • 代碼地址:https://github.com/cxxgtxy/USP

USP 在理解任務上實現有競爭力的表現;在生成任務中,USP 顯著加速 DiT 和 SiT 模型收斂速度,比從頭訓練快 11.7 倍(DiT-XL)和 46.6 倍(SiT-XL)。

圖片

研究背景

在過去十年中,預訓練 - 微調(pretraining-finetuning)范式在圖像識別任務中取得了顯著成功。但在圖像生成領域,該范式的探索仍然有限。

DDAE 等近期的研究表明,生成模型不僅可以合成高質量圖像,還可以學習到優越的視覺表征,圖像理解和圖像生成之間存在著深層次的聯系。

例如,iGPT(Image GPT)探索了基于像素空間的自回歸預訓練,但該方法在大規模數據集和模型上擴展時面臨著嚴重的計算成本問題。此外,這種方法與擴散模型不兼容。

為了彌合這一差距,REPA 提出通過對齊擴散模型與預訓練的視覺模型(如 DINOv2)的表征,可以讓擴散模型更高效地學習判別特征,從而提高訓練效率和生成質量。然而,REPA 存在幾個主要問題:

1. 高昂的計算成本:REPA 依賴于 DINOv2 這樣的大規模預訓練視覺模型,其預訓練需要超過 22,000 GPU 小時(A100),計算資源需求極高。

2. 額外的教師網絡(Teacher Network):使用 DINOv2 作為教師模型會增加 GPU 顯存消耗,同時降低擴散模型的訓練速度。

盡管已有研究揭示了生成和理解任務間的聯系,但仍然有一些關鍵問題尚未解決:

1. 預訓練是否對擴散模型的訓練是可行且必要的?

2. 是否可以找到一種同時適用于生成和理解任務的預訓練方法?

3. 現有的 “預訓練 - 微調” 范式是否能成功應用于生成模型?

該論文旨在提出一種簡單而有效的方法來解決這些問題。

方法設計

實現能夠同時適用于圖像理解和生成的統一預訓練 - 微調范式面臨諸多挑戰:

  • C1: 輸入不匹配:圖像理解模型通常接收干凈的圖像作為輸入,而擴散模型接受的是添加了噪聲的圖像。
  • C2: 結構不匹配:生成模型多為基于 VAE 的潛空間擴散模型,而大多數圖像理解任務并不使用 VAE。此外, ViT 結構在圖像生成任務中通常會進行修改。
  • C3: 損失函數和標簽格式不同:圖像理解任務和圖像生成任務通常采用不同的優化目標,這使得直接共享預訓練模型變得困難。

盡管面臨這些挑戰,研究者也觀察到了一些有利的現象:

  • P1: 神經網絡對噪聲具有魯棒性:預訓練的視覺模型在噪聲或數據增強下仍然可以保持較高的分類精度,例如在 ImageNet-C 數據集上測試。說明即使擴散模型處理的是加噪圖像,預訓練模型仍可以學習到有效的特征。
  • P2: 擴散模型可以學習到判別性特征:擴散模型能學習到用于圖像分類等任務的判別性特征。如果能夠有效地對齊這些表征,擴散模型的收斂速度和最終性能都可以得到顯著提升。
  • P3: ViT 結構具有較強的適應性:盡管 ViT 在應用到擴散模型時經歷了一定修改(如 AdaLN-Zero 層歸一化和額外的條件輸入)。但如果設計得當,這些修改仍然可以與 ViT 的預訓練權重兼容。
  • P4: VAE 具有強大的壓縮和重建能力:擴散模型中使用的 VAE(如 SD-VAE)能夠有效地保留原始圖像的重要信息。即使在 VAE 的潛空間中進行訓練,仍然可以獲得高質量的視覺特征。

基于以上觀察,本文的研究者提出了統一的自監督預訓練架構,見下圖 1:

圖片

USP 架構基于一個簡單的自編碼器(Autoencoder),但在 VAE 潛空間中進行操作,而非像素空間。輸入圖像首先經過 VAE 編碼到潛空間,并通過 PatchConv 進行圖片分塊。部分塊按照設定 mask 比例被隨機掩碼,未掩碼的塊輸入到 ViT 編碼器,而解碼器負責重建掩碼塊,損失函數僅使用簡單的 MSE loss。在預訓練階段,VAE 參數被凍結,僅訓練 ViT 編碼器。預訓練完成后,ViT 編碼器的權重可用于初始化下游任務,如分類、分割和生成。

在將預訓練模型權重適配到下游理解和生成模型時,針對圖像分類任務,ViT 編碼器的預訓練權重可直接繼承,無需額外調整,且仍然使用 Class Token 作為最終表征。

對于生成任務,由于 DiT 和 SiT 的結構與 ViT 略有不同,對初始化策略進行了優化。首先,在 AdaLN-Zero 層歸一化中,恢復可訓練的偏置(β)和縮放因子(γ),使其與預訓練的 ViT 權重對齊。其次,由于預訓練是在 224×224 進行,而 ImageNet 生成任務通常在 256×256 進行,因此本文采用 Bicubic Interpolation 擴展位置編碼。最后,由于生成任務不需要 class token,在 DiT/SiT 中直接將其移除。這種初始化策略確保了 ViT 預訓練權重能夠無縫適配到下游分類和生成任務,而不引入額外計算開銷或存儲需求。

實驗設置

本論文涵蓋三種模型規模,見表 1。預訓練階段所有模型共享相同的解碼器 —— 由 8 個 Transformer 塊組成。

圖片

在額外實驗中,將預訓練時長擴展到 1600 輪,以證明 USP 在更長預訓練時間上的可擴展性。為了與 MAE 進行公平比較,本文在 224×224 分辨率上進行預訓練,盡管消融實驗表明更高的分辨率可以帶來更好的性能。

圖像生成實驗

本文在兩種基于 Transformer 的擴散模型,DiT 和 SiT 上驗證了 USP。評估均在 ImageNet 256×256 上進行,使用 50,000 個樣本,不使用 CFG。

圖片

表 2 顯示了在不同規模的 DiT 模型上的對比結果。USP 在所有模型規模上均顯著提升了生成質量,且隨著訓練時間延長,生成質量不斷提高。相比最近的 DiT 變體在 2.5M 步的 FID,USP 僅在 400K 內就能達到更好的效果。

圖片

表 3 顯示了在不同規模的 SiT 模型上的對比結果。USP 表現出和 DiT 一致的提升效果。同時,表 3 與近期利用表征對齊來提升 DiT/SiT 性能的方法進行了比較,USP 在所有模型設置下均優于其他方法。

圖像理解實驗

論文在 ImageNet-1k 數據集上進行了線性探測(Linear Probe)和微調(Fine-tuning)的圖像分類評估。在線性探測(LP)任務上,USP 的性能優于 MAE;在微調(SFT)任務上,USP 表現與 MAE 相當,表 5 總結了分類結果: 

圖片

進一步,論文在 ADE20 數據集上進行了分割性能評估。表 6 顯示了 USP 在單尺度 mIoU 指標上的表現,相比 MAE 提升了 0.5%。

圖片

消融實驗

研究者進行了全面的消融實驗,以探討 USP 設計中不同組件的影響。例如 VAE、輸入分辨率、掩蔽率等。更多的消融實驗說明見原論文。

圖片

討論

VAE 在圖像理解任務中的作用

在圖像分類任務中應用 VAE 并不是最理想的選擇。因為 VAE 的核心目標是在保證重建能力的同時盡可能壓縮信息,而原始圖像本身是無損的,因此直接在原始圖像上進行分類可能更高效。然而,我們的實驗表明,如果使用高質量的 VAE 進行編碼,圖像分類任務的性能至少可以達到與標準方法相當的水平。

研究者認為,這種現象的主要原因是:

  • VAE 的潛空間編碼仍然能保留足夠的判別信息,即使經過壓縮,仍能支持良好的分類表現。
  • VAE 提供了一種對抗噪聲的方式,通過潛空間中的信息提取,模型可能學習到更魯棒的特征。

工作機制(對比 REPA)

為了更深入地理解 USP,研究者在 DiT-XL/2 訓練過程中,對不同層的線性探測性能進行了分析(見圖 4)。比較了以下幾種情況:

1.DiT-XL/2 預訓練后的線性探測性能(“Pre.”)

2.DiT-XL/2 生成微調后的線性探測性能(“Ft.”)

3.SiT-XL/2 模型的線性探測性能

4.SiT-XL/2 在應用 REPA 方法后的線性探測性能

圖片

主要發現:

  • 與 REPA 不同,USP 不依賴額外的對齊損失,而是通過精心設計的初始化策略,讓模型自動找到最適合線性分類的層。
  • 經過 40 萬步訓練后,USP 的第 20 層成為最優的線性分類層,這表明 USP 能夠自適應地優化表征學習,在分類和生成任務之間找到平衡點。
  • REPA 通過人為設計的表征對齊方式來增強判別能力,但這種方法可能會限制生成模型的潛力。

這些實驗表明,USP 的初始化策略比基于表征對齊的方法更高效,并且更適用于同時提升分類和生成任務的統一框架。

對基礎范式的另一種視角

論文中使用經過 800 輪預訓練且掩碼比例為 0.75 的 ViT-Large 模型研究了圖像修復任務。如圖 5 所示,USP 在圖像修復方面顯著優于 MAE,凸顯了強表征能力對有效修復的重要性。

圖片

這一結果與下面基于擴散的生成框架相契合,表明過度使用監督標簽微調編碼器以增強判別能力,并不會顯著提升圖像生成效果。

為了實證這一假設,論文中采用了一個監督微調模型,模型在 ImageNet 驗證集上的準確率達 82.6%,并使用其初始化 DiT-B/2 進行 400K 步訓練。表 8 總結了實驗結果。其性能明顯低于預訓練,進一步驗證了對該范式的分析。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2017-12-26 13:53:31

深度學習遷移學習

2022-01-06 09:57:02

數據計算機神經網絡

2024-11-21 10:21:06

2025-09-19 09:05:18

AI模型訓練

2023-09-06 09:59:12

雷達技術

2022-11-28 14:00:24

人工智能

2023-03-28 16:01:01

PytorchSimCLR算法

2023-01-03 13:20:44

框架AI

2022-03-04 19:07:03

模型視覺人工智能

2020-07-29 12:16:12

預訓練自訓練神經網絡

2022-07-13 16:09:19

模型AI訓練

2025-06-12 08:46:00

2022-05-16 11:06:54

SOTA谷歌預訓練

2021-05-12 15:22:07

機器學習人工智能計算機

2024-12-03 09:49:07

2024-01-29 00:24:07

圖像模型預訓練

2025-01-09 11:14:13

2024-11-18 08:40:00

2023-04-18 17:23:00

Meta開源

2024-11-07 15:10:00

點贊
收藏

51CTO技術棧公眾號

黄色漫画在线免费看| 性感美女一级片| 久久久久久久久丰满| 日韩欧美一级二级| 国产亚洲欧美在线视频| 日本三级在线播放完整版| 国产精品资源网站| 国产91精品网站| 成人自拍小视频| 超碰97久久| 欧美日韩视频第一区| 免费超爽大片黄| 日本精品在线| www久久精品| 97视频热人人精品| 涩涩视频在线观看| 野花国产精品入口| 麻豆乱码国产一区二区三区| 在线观看免费视频国产| 欧美系列精品| 欧美日韩中文字幕综合视频| 日本a级片在线观看| 国产美女视频一区二区三区 | 久久天堂电影| 国产福利91精品一区| 国产精品欧美日韩久久| 亚洲黄色三级视频| 一本一本久久a久久综合精品| 亚洲美女av在线播放| 理论片大全免费理伦片| av在线亚洲一区| 欧美三电影在线| 欧美牲交a欧美牲交aⅴ免费下载| 免费影视亚洲| 亚洲精品视频自拍| 亚洲欧洲三级| eeuss影院在线观看| 91免费国产视频网站| 国产成人精品免费视频大全最热| 国产精品毛片一区二区在线看舒淇| 麻豆9191精品国产| 97超级碰在线看视频免费在线看 | 亚洲无线视频| 欧美成人精品xxx| 中文字幕电影av| 久久大综合网| 日韩在线观看视频免费| www久久久久久久| 欧美日韩精品一区二区视频| 亚洲裸体xxxx| av女人的天堂| 精品国产一区二区三区四区| 国产亚洲欧美另类中文| 最近中文字幕在线mv视频在线 | 日韩av在线免播放器| 日韩精品视频一区二区| 国产精品17p| 亚洲电影av在线| 国产精品手机在线观看| 嫩草国产精品入口| 亚洲免费人成在线视频观看| 深爱五月激情网| 国产精品最新| 日韩中文娱乐网| 日本在线一级片| 欧美高清一区| 国内精品伊人久久| 特级西西444www大精品视频免费看| 一本色道88久久加勒比精品| 欧美一级在线播放| 无码人妻精品一区二区蜜桃色欲| 琪琪一区二区三区| 91精品啪在线观看麻豆免费| 亚洲精品久久久久久无码色欲四季 | 91精品一区国产高清在线gif| 久久伊人91精品综合网站| 一区二区成人免费视频| 在线播放一区| 国产aaa精品| 91成品人影院| 国产精品一区久久久久| 精品一区二区三区免费毛片| 免费一级在线观看| 一色桃子久久精品亚洲| 国内少妇毛片视频| 欧美极品影院| 欧美一卡二卡在线观看| 久久人人爽人人人人片| 凹凸成人精品亚洲精品密奴| 欧美精品一二区| 日本韩国欧美中文字幕| 久久99国产精品成人| 国产精品yjizz| 免费国产在线视频| 亚洲另类色综合网站| 黄色大片中文字幕| 久久99久久久精品欧美| 精品国产免费一区二区三区香蕉| 69视频在线观看免费| 欧美一区二区三区久久精品茉莉花| 91精品国产高清自在线| 一级黄色片在线播放| av不卡一区二区三区| 亚洲欧美日韩精品久久久| 国产一线二线在线观看| 精品视频在线免费看| 免费不卡的av| 国产精品精品| 日本国产精品视频| 国产高清视频免费观看| 欧美激情自拍偷拍| 免费国产a级片| 精品久久免费| 在线视频国产日韩| 日韩精品在线免费视频| 国产精品99久久久久| 色播亚洲婷婷| 色资源二区在线视频| 欧美一卡2卡三卡4卡5免费| 人妻精品久久久久中文| 亚洲激情视频| 97超碰人人看人人| 日本福利在线| 欧美日韩中文字幕一区二区| 97人妻精品一区二区免费| 影音国产精品| 亚洲最大av网| av毛片在线免费| 欧美日韩精品一区视频| 精品人妻无码一区| 久久aⅴ国产紧身牛仔裤| 国产伦精品一区二区三区视频免费 | 国产免费av国片精品草莓男男| 国产一区二区三区视频| 天堂中文在线网| 99精品国产视频| 久久成人福利视频| www.国产精品一区| 欧美黑人又粗大| 国产绳艺sm调教室论坛| 国产精品久久777777| 国产福利在线免费| 日韩欧美伦理| 成人妇女免费播放久久久| av在线免费观看网站| 在线视频综合导航| av手机在线播放| 日本vs亚洲vs韩国一区三区二区| 欧美中文娱乐网| 国产一区二区精品调教| 亚洲偷熟乱区亚洲香蕉av| 欧美一级黄视频| 中国av一区二区三区| 黄大色黄女片18第一次| 99re6这里只有精品| 国产自产女人91一区在线观看| 在线观看完整版免费| 717成人午夜免费福利电影| 日本一级特级毛片视频| 国产精品一区二区三区乱码| 国产视频在线观看网站| 老汉色老汉首页av亚洲| 欧洲精品久久久| www 日韩| 日韩视频在线永久播放| 91av在线免费视频| 久久久蜜臀国产一区二区| 一区二区成人网| 91青青国产在线观看精品| 91精品入口蜜桃| 91桃色在线| 一区二区三欧美| 国产精品怡红院| 无吗不卡中文字幕| 无码少妇精品一区二区免费动态| 美女网站一区二区| 国产91视频一区| 久久99视频| 亚洲一区二区三区在线视频| 国语对白在线刺激| 精品五月天久久| 国产精品久久久久久久免费| 亚洲综合色自拍一区| 亚洲综合色一区| 国产一区二区女| 日本日本19xxxⅹhd乱影响| 精品国产一区二区三区av片| 亚洲最大福利视频| 美女100%一区| 久久成人18免费网站| 亚洲 美腿 欧美 偷拍| 欧美日韩一区二区电影| 久久久久久久久精| 国产三级一区二区| 亚洲精品久久久久久| 巨乳诱惑日韩免费av| 六月婷婷激情网| 亚洲综合图色| aa日韩免费精品视频一| 午夜av成人| 韩国欧美亚洲国产| www在线免费观看视频| 国产视频精品在线| www.国产.com| 欧美日本国产视频| 日韩电影在线观看一区二区| 亚洲综合在线观看视频| 精品伦精品一区二区三区视频密桃 | 五月婷婷六月综合| 久久精品日产第一区二区三区精品版 | 免费av在线电影| 精品少妇一区二区三区日产乱码| 最近国语视频在线观看免费播放| 亚洲成在线观看| 丝袜 亚洲 另类 欧美 重口| 国产日韩欧美a| 少妇一级淫免费观看| 国产专区综合网| 网站一区二区三区| 狂野欧美一区| 国产中文字幕免费观看| 黄色精品免费| 日本成人在线不卡| 亚洲女同另类| 亚洲一区bb| 欧美老女人另类| 蜜桃视频在线观看91| 里番精品3d一二三区| 成人xxxxx色| 国产一区二区三区免费观看在线| 国产精品男人的天堂| 日本不卡一二三| 欧美在线观看一区二区三区| gogo高清午夜人体在线| 欧美人与物videos| 在线观看a级片| 久久91精品国产| 特级毛片在线| 欧美丰满老妇厨房牲生活| 国产网友自拍视频导航网站在线观看| 国产一区二区三区在线观看视频 | 欧美理论电影在线观看| а天堂中文在线官网| 精品国产一区二区三区四区在线观看 | 97超碰国产精品| 欧美午夜精品| 国产玉足脚交久久欧美| 樱桃成人精品视频在线播放| 男的插女的下面视频| 亚洲国产第一| 男人操女人逼免费视频| 亚洲女同同性videoxma| 国产精品秘入口18禁麻豆免会员| 翔田千里一区二区| 欧美日韩在线免费播放| 另类小说视频一区二区| 不卡中文字幕在线观看| 国产在线视频一区二区| 涩视频在线观看| 91丨porny丨户外露出| 久久精品成人av| 中文字幕一区二区三区色视频| 久久久久久久麻豆| 亚洲综合无码一区二区| 精品美女久久久久| 日本高清视频一区二区| 一区二区国产欧美| 日韩美女在线视频| 天天躁日日躁狠狠躁喷水| 亚洲视频专区在线| 国产写真视频在线观看| 97久久精品人搡人人玩| 高清av一区二区三区| 亚洲aa中文字幕| 欧美性生活一级片| 亚洲精品高清视频| 韩国亚洲精品| 成人在线观看黄| 久久99国产精品麻豆| 伊人网综合视频| 国产农村妇女毛片精品久久麻豆 | 污污免费在线观看| 久久女同精品一区二区| 岛国片在线免费观看| 一二三四社区欧美黄| 国产免费一区二区三区四区五区| 欧美精品自拍偷拍动漫精品| 隣の若妻さん波多野结衣| 国产一区二区三区18| 日韩激情av| 国产精品欧美风情| 国产毛片久久久| 日韩电影大全在线观看| 中文字幕一区二区三区在线视频 | 精品视频在线播放色网色视频| yw193.com尤物在线| 欧美高清自拍一区| 99久久婷婷国产综合精品首页| 91久久极品少妇xxxxⅹ软件 | 国产精品国产亚洲精品| 欧美日本韩国在线| 欧美精品日韩| 黄色三级视频在线| 99久久综合99久久综合网站| 手机免费观看av| 欧美日韩国产在线| 性一交一乱一精一晶| 中文字幕亚洲欧美日韩高清| 成av人片在线观看www| 成人国产精品久久久久久亚洲| 丝袜美腿综合| av免费看网址| 狠狠色丁香久久婷婷综合_中| 日本高清www| 亚洲成人av中文| 性生活免费网站| 久久精品中文字幕| 日韩精品免费观看视频| 久久伦理网站| 99精品福利视频| 丰满熟女人妻一区二区三区| 亚洲欧美日韩中文播放| 中文字幕一区二区三区免费看| 国产丝袜一区二区| av小说在线播放| 国产伦精品一区| 国内成人在线| 波多野结衣电影免费观看| ...av二区三区久久精品| 黄色网址中文字幕| 亚洲欧美福利视频| 一二三四视频在线中文| 精品综合久久久| 亚洲黄色三级| 中文字幕 日本| 午夜欧美视频在线观看| 免费的黄色av| 韩国福利视频一区| 特黄特色欧美大片| 久久久免费视频网站| 久久在线观看免费| 免费黄色网址在线| 亚洲区中文字幕| 偷拍视频一区二区三区| 日本一区二区三区视频在线播放| 国产视频一区免费看| 毛片网站免费观看| 在线免费观看不卡av| 国产三级视频在线| 国产免费一区二区三区在线观看| 成人羞羞网站| 免费在线观看污网站| 亚洲精品一卡二卡| 亚洲爱情岛论坛永久| 久久久久久有精品国产| 欧美黑人巨大videos精品| 成年网站在线免费观看| 国产视频亚洲色图| 亚洲一级视频在线观看| 久久深夜福利免费观看| 亚洲网址在线观看| 久久久久久久中文| 国产欧美日韩精品一区| 97成人免费视频| 欧美黑人性猛交| 天天躁日日躁狠狠躁欧美| 噼里啪啦国语在线观看免费版高清版 | 国产98在线|日韩| 亚洲黄页一区| 国产精品20p| 日韩一级视频免费观看在线| 91老司机福利在线| 日韩免费av电影| 国产剧情一区二区| 国产精品久久久久久99| 中文字幕不卡在线视频极品| 免费看一区二区三区| 自慰无码一区二区三区| 中文字幕av一区二区三区| 99热这里只有精品在线| 欧美一区二区三区精品电影| 俺要去色综合狠狠| 中文字幕在线国产| 日本乱码高清不卡字幕| dy888亚洲精品一区二区三区| 国产日本一区二区三区| 免费在线观看不卡| 久热精品在线观看| 中日韩美女免费视频网址在线观看 | 色综合久久久久| av网站在线看| 热re99久久精品国99热蜜月| 国产黄色精品网站| 中文字幕在线播| 欧美激情网友自拍| 日韩国产一区二区| 9.1成人看片免费版| 日韩一级大片在线观看| 久久sese| 国产美女主播在线播放|