精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無VAE擴散模型! 清華&可靈團隊「撞車」謝賽寧團隊「RAE」

人工智能 新聞
本篇文章通過直接結(jié)合預(yù)訓(xùn)練視覺特征編碼器(如 DINO、SigLIP、MAE)結(jié)合殘差信息學(xué)習(xí)預(yù)訓(xùn)練視覺特征編碼器丟失的圖片重建信息與專門訓(xùn)練的解碼器,有效替代了傳統(tǒng) VAE,提升了表示質(zhì)量與效率。

長期以來,擴散模型的訓(xùn)練通常依賴由變分自編碼器(VAE)構(gòu)建的低維潛空間表示。然而,VAE 的潛空間表征能力有限,難以有效支撐感知理解等核心視覺任務(wù),同時「VAE + Diffusion」的范式在訓(xùn)練與推理效率上也存在顯著瓶頸。

清華大學(xué)智能視覺團隊和快手可靈團隊聯(lián)合推出《Latent Diffusion Model without Variational Autoencoder》與近期爆火的謝賽寧團隊 RAE 工作不謀而合,但在總體設(shè)計思路與研究重點上有所差異。

本篇文章通過直接結(jié)合預(yù)訓(xùn)練視覺特征編碼器(如 DINO、SigLIP、MAE)結(jié)合殘差信息學(xué)習(xí)預(yù)訓(xùn)練視覺特征編碼器丟失的圖片重建信息與專門訓(xùn)練的解碼器,有效替代了傳統(tǒng) VAE,提升了表示質(zhì)量與效率。

本文提出的系統(tǒng)性框架稱為 SVG(Self-supervised representation for Visual Generation)。

  • 論文標(biāo)題:Latent Diffusion Model without Variational Autoencoder
  • 論文鏈接:https://arxiv.org/abs/2510.15301
  • 項目鏈接:https://howlin-wang.github.io/svg/
  • 代碼地址:https://github.com/shiml20/SVG

該論文同樣對傳統(tǒng) VAE + Diffusion 的局限性進行了分析,發(fā)現(xiàn)其關(guān)鍵問題在于 VAE 空間存在非常明顯的語義糾纏現(xiàn)象。VAE 的 latent 空間缺乏清晰語義結(jié)構(gòu),不同類別特征高度混合(論文通過 t-SNE 可視化驗證,普通 VAE latent 中不同語義類別的特征點嚴重重疊),導(dǎo)致擴散模型需花費大量步數(shù)學(xué)習(xí)數(shù)據(jù)分布。

不同特征空間中不同語義類別的 t-SNE 可視化圖

這種語義糾纏現(xiàn)象直接導(dǎo)致了兩個關(guān)鍵問題:

  • 訓(xùn)練推理效率雙低: 如下圖中例子所示,如果語義糾纏程度高,那么即使給定了不同的語義條件,平均速度仍是難以區(qū)分的,模型在訓(xùn)練時就得花更多力氣「理清」語義糾纏的特征。并且如果語義區(qū)分度較高,在空間中不同位置的速度方向也將更趨于一致,從而有助于減少采樣過程的離散誤差,支持少步數(shù)采樣。

特征空間語義糾纏會對生成模型訓(xùn)練推理帶來消極影響

  • 通用性差: VAE 依賴于重建損失進行訓(xùn)練,只適合生成任務(wù),在感知理解這些視覺核心任務(wù)中的效果遠不如專門的特征提取器。

考慮到各類視覺基礎(chǔ)模型(如 DINO、SigLIP)已經(jīng)構(gòu)建出了具有優(yōu)良語義結(jié)構(gòu)的空間,研究者認為這類預(yù)訓(xùn)練視覺特征空間可能更適合生成模型的訓(xùn)練,同時也具有更強的可通用性。其中 DINO 特征在各種視覺下游任務(wù)中已經(jīng)展現(xiàn)出了良好的性能,并且保留了基礎(chǔ)的圖像結(jié)構(gòu)信息,具備比較高的重建潛力。

SVG 破局:

靠 DINO 搭地基,殘差分支補細節(jié)

SVG 自編碼器結(jié)構(gòu)示意圖

SVG 的核心思路很簡單:用更強的語義結(jié)構(gòu)解鎖模型生成潛力,基于自監(jiān)督特征構(gòu)建統(tǒng)一特征空間。 

SVG 自編碼器由「凍結(jié)的 DINOv3 編碼器」、「輕量殘差編碼器」、「解碼器」三部分組成,核心是通過多組件協(xié)作同時實現(xiàn)強判別性的語義結(jié)構(gòu)與圖像細節(jié)補充。

  • 凍結(jié) DINOv3 編碼器: 作為語義骨架,提供強判別性特征。DINOv3 通過自監(jiān)督訓(xùn)練(對比學(xué)習(xí) + 掩碼建模),天然具備清晰的語義類別邊界,同時,DINOv3 的特征已在多種視覺任務(wù)中驗證有效性,為 SVG 的通用性奠定基礎(chǔ);
  • 輕量殘差編碼器: 彌補色差,補充細粒度細節(jié)。DINOv3 雖能捕捉全局語義,但會丟失部分細節(jié)(如色彩、紋理),導(dǎo)致重建質(zhì)量差。SVG 設(shè)計了基于 ViT 的輕量殘差分支,專門學(xué)習(xí) DINOv3 未覆蓋的高頻細節(jié),并通過「通道級拼接」與 DINO 特征融合;
  • 分布對齊機制:避免細節(jié)干擾語義。為防止殘差特征破壞 DINO 的語義結(jié)構(gòu),SVG 將殘差輸出歸一化后再根據(jù) DINO 特征的均值和方差進行縮放,使其匹配 DINO 特征的分布,確保拼接后的 latent 空間既具備高保真重建能力,又有利于生成模型訓(xùn)練(消融實驗顯示,無對齊時生成 FID 從 6.12 升至 9.03,對齊后恢復(fù)至 6.11);
  • SVG 解碼器: 參考傳統(tǒng) LDM 的 VAE 解碼器結(jié)構(gòu),將融合后的 latent 特征映射回像素空間,確保生成圖像的分辨率與細節(jié)還原度。

二者結(jié)合,構(gòu)成了一個既有良好語義可區(qū)分性,又具有強重建能力的潛在空間。

重建效果展示圖:殘差編碼器修復(fù)了圖像色差問題,補充了高頻細節(jié)

SVG 擴散訓(xùn)練:

直接在高維 SVG 特征空間學(xué)習(xí)

與傳統(tǒng) LDM 在 VAE 的低維(如 16×16×4)latent 空間訓(xùn)練不同,SVG 擴散模型直接在高維特征空間(16×16×392)訓(xùn)練。研究者指出,盡管之前的觀點大多認為高維空間訓(xùn)練易導(dǎo)致生成模型收斂不穩(wěn)定,但實驗證明 SVG 空間良好的性質(zhì)使得在這種高維度情況下,模型訓(xùn)練依舊穩(wěn)定,甚至效率更高。

論文在 ImageNet 256×256 數(shù)據(jù)集上進行了全面實驗,對比 SiT、DiT、MaskDiT 等主流 LDM,從生成性能、效率、多任務(wù)適配性三個維度驗證 SVG 的優(yōu)勢,核心結(jié)果如下:

  • 生成質(zhì)量:性能顯著優(yōu)于基線

在訓(xùn)練 80 個 epoch,25 步采樣條件下,SVG-XL(675M 參數(shù))的生成性能全面超越同規(guī)模基線:

無分類器引導(dǎo)(w/o CFG)時,SVG-XL 的 gFID 為 6.57,而 SiT-XL(SD-VAE)為 22.58、SiT-XL(VA-VAE)為 7.29;

有分類器引導(dǎo)(w/ CFG)時,SVG-XL 的 gFID 降至 3.54,SiT-XL(VA-VAE)為 4.13。

若延長訓(xùn)練至 1400 個 epoch,SVG-XL 的 gFID 可進一步降至 1.92(w/ CFG),接近當(dāng)前生成模型 SOTA 水平。

  • 訓(xùn)練與推理效率:大幅降低資源消耗

訓(xùn)練效率: 在 w/o CFG 設(shè)定下,SVG-XL 僅需 80 個 epoch 即可達到 SiT-XL 1400 個 epoch 的生成質(zhì)量(gFID 6.57 vs 9.35);

推理效率: 消融實驗中,5 步采樣時,SVG-XL 的 gFID 為 12.26(w/o CFG),而 SiT-XL(SD-VAE)為 69.38、SiT-XL(VA-VAE)為 74.46,展現(xiàn)了良好的少步數(shù)推理性能。


  • 多任務(wù)通用性:統(tǒng)一特征空間適配多視覺任務(wù)

SVG 的 latent 空間繼承了 DINOv3 的良好性質(zhì),可直接用于分類、分割、深度估計等任務(wù),無需額外微調(diào)編碼器:

消融實驗結(jié)果證明 SVG 編碼器完全保持了 DINOv3 編碼器的性能。這一結(jié)果驗證了 SVG 作為統(tǒng)一表征空間的可行性。

  • 定性分析:插值平滑性與可編輯性

研究者發(fā)現(xiàn) SVG 空間中的隨機噪聲在直接線性插值與球面線性插值下均能生成平滑過渡的圖像;而傳統(tǒng) VAE 空間中直接線性插值可能產(chǎn)生較差的中間結(jié)果。這證明了 SVG 空間的魯棒性。

研究者還對 SVG 進行了零樣本編輯實驗,證明基于 SVG 空間的生成模型依然具備 VAE + Diffusion 模型所具備的可編輯性。

總結(jié)

SVG 的核心價值并非單純「棄用 VAE」,而是通過「自監(jiān)督特征 + 殘差細節(jié)」的組合,證明了「生成、理解與感知共享統(tǒng)一 latent 空間」的可行性。這一思路不僅解決了傳統(tǒng) LDM 的效率與通用性痛點,更為后續(xù)通用視覺模型的研發(fā)提供了新的思路。

在總體思路上,該論文關(guān)鍵思路與謝賽寧團隊的 RAE 高度相似,都驗證了在生成模型訓(xùn)練中用預(yù)訓(xùn)練視覺特征編碼器替代 VAE 的可行性。RAE 工作更多側(cè)重于如何優(yōu)化改善擴散模型在這種高維度特征空間的訓(xùn)練,而本文解決了單純依賴預(yù)訓(xùn)練視覺特征編碼器帶來的重建效果差的問題,從而也為該方法用于統(tǒng)一生成編輯模型初步驗證了可行性。

更多細節(jié)請參閱原論文。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-10-29 09:05:04

2025-10-15 08:50:01

2025-01-20 08:35:00

模型生成AI

2024-10-14 13:20:00

2025-07-04 08:52:00

3D圖像生成AI

2025-11-14 09:21:45

2025-11-12 08:42:00

2022-12-23 10:15:44

模型AI

2025-06-13 08:53:00

2025-08-01 09:12:00

2023-12-23 23:08:21

語音數(shù)據(jù)

2025-05-16 11:03:48

2025-07-08 09:18:12

AI模型論文

2025-06-19 09:04:00

2025-05-20 09:08:59

2025-11-19 08:59:15

2023-03-13 15:56:00

模型框架

2024-10-23 15:05:29

2025-05-14 09:15:00

2024-02-26 08:25:00

模型訓(xùn)練
點贊
收藏

51CTO技術(shù)棧公眾號

国产人妖在线观看| 四虎一区二区| 精品小视频在线观看| 91久久精品无嫩草影院| 亚洲h动漫在线| 久久人人九九| 欧美激情一区二区三区免费观看| 99热在线成人| 成人精品gif动图一区| 欧美极品少妇xxxxⅹ喷水| 无码精品一区二区三区在线播放| 亚洲一二三四| 日韩一区中文字幕| 日本不卡视频在线播放| аⅴ天堂中文在线网| 97精品资源在线观看| 亚洲午夜三级在线| 日韩视频在线观看国产| 精品人妻一区二区三区浪潮在线 | 国产传媒在线观看| 国产日韩av一区| 99c视频在线| 午夜精品一区二| 欧美日韩国产探花| 亚洲最新视频在线| 国产一级免费片| 久久国内精品| 色欧美乱欧美15图片| 97超碰在线视| 在线观看免费黄色| 99久久亚洲一区二区三区青草 | 国产中文字幕乱人伦在线观看| 男男电影完整版在线观看| 国产一区不卡精品| 国产精品露脸自拍| 国产污污视频在线观看| 欧美国产另类| 日韩性生活视频| a天堂中文字幕| 啪啪激情综合网| 欧美大肚乱孕交hd孕妇| 亚洲欧美日韩三级| 日本黄色一区| 久久久久国产精品厨房| 91嫩草免费看| 国产精品自拍电影| 青青青伊人色综合久久| 欧美性受xxx| 国产中年熟女高潮大集合| 91精品啪在线观看国产爱臀| 555夜色666亚洲国产免| 91日韩视频在线观看| 亚洲色图官网| 欧美色视频日本高清在线观看| 欧美精品卡一卡二| av在线不卡免费| 一区二区三区在线免费视频| 在线一区高清| 日本蜜桃在线观看| 亚洲欧洲韩国日本视频| 一本色道久久综合亚洲二区三区| 国产高清视频免费最新在线| 久久久天堂av| 色噜噜一区二区| gogogo高清在线观看免费完整版| 国产日韩精品久久久| 日本一区二区三区四区高清视频| www.亚洲激情| 日韩高清欧美激情| 国产成人精品电影| 黄色av一区二区| 免费精品视频最新在线| 成人免费视频a| 国产aⅴ爽av久久久久成人| 国产制服丝袜一区| 亚洲综合在线播放| 亚洲精品一区二区三区蜜桃| 成人的网站免费观看| 国产麻豆日韩| 免费在线高清av| 日本一区二区三区免费乱视频| 污视频在线免费观看一区二区三区| 国产亚洲依依| 亚洲视频免费看| 欧美国产视频一区| 日本天堂在线| 国产欧美日韩精品一区| 中文字幕欧美人与畜| 在线中文免费视频| 欧美日韩在线视频一区| 看欧美ab黄色大片视频免费| 欧洲美女精品免费观看视频| 欧美大片在线观看| 少妇毛片一区二区三区| 成人激情视频| 久久久久久噜噜噜久久久精品| www.国产com| 久久99精品国产.久久久久| a级国产乱理论片在线观看99| 无码国产伦一区二区三区视频 | 久久久久久艹| 99免在线观看免费视频高清| 一区二区久久久| 成人免费无码av| 国产一区2区在线观看| 日韩成人在线视频| 国精品人伦一区二区三区蜜桃| 红桃视频国产精品| 国产精品久久久久久久久久久不卡| 国产人妖一区二区| 91一区二区在线观看| 欧美性视频在线播放| 免费高潮视频95在线观看网站| 欧美日韩一卡二卡| 日韩欧美视频网站| 国精品产品一区| 亚洲福利视频专区| 青青青手机在线视频| 日韩午夜激情| 96pao国产成视频永久免费| 欧美777四色影视在线| 亚洲图片你懂的| 国产精品亚洲a| 国产图片一区| 久久福利视频导航| 亚洲视频一区在线播放| 95精品视频在线| 日韩一二区视频| 18加网站在线| 在线观看一区二区视频| 一级全黄裸体片| 国产高清欧美| 国产精品激情自拍| 亚洲AV第二区国产精品| 亚洲综合图片区| 天堂视频免费看| 国产一区2区| 在线成人免费网站| www日韩精品| 国产91精品在线观看| 正在播放一区| 国产精品第一| 在线成人一区二区| 无码人妻黑人中文字幕| 337p粉嫩大胆色噜噜噜噜亚洲| 久久www视频| 国产一区二区三区亚洲综合 | 国产日韩一区欧美| 91麻豆一二三四在线| 欧美欧美欧美欧美| 色撸撸在线视频| 老汉av免费一区二区三区| 成人免费xxxxx在线观看| sese一区| 欧美揉bbbbb揉bbbbb| 无码人妻aⅴ一区二区三区69岛| 国产日本精品| 久久综合九色综合久99| 人成在线免费网站| 精品无人区乱码1区2区3区在线| 亚洲国产成人精品激情在线| www.视频一区| 北条麻妃在线视频观看| 亚洲精品国产动漫| 日本久久久久久久| 国产不卡av在线播放| 中文字幕综合网| 波多野结衣网页| 国模吧视频一区| 国产一区免费在线观看| 九色porny视频在线观看| 国产网站欧美日韩免费精品在线观看| 亚洲AV无码成人精品区东京热| 2014亚洲片线观看视频免费| 亚洲高清在线免费观看| 色综合五月天| av成人在线电影| 欧美aa在线| 在线成人激情视频| 国产黄色片网站| 黄色一区二区在线| 一级黄色性视频| 国内精品视频666| 久久精品人人做人人爽电影| 欧美天堂视频| 久久人体大胆视频| 日韩一级免费毛片| 在线免费视频一区二区| 黄色香蕉视频在线观看| 国产成人精品亚洲777人妖| 蜜桃传媒一区二区三区| 你懂的视频欧美| 成人天堂噜噜噜| 欧美伦理91| www.精品av.com| 日本精品999| 欧美性猛交一区二区三区精品| 日韩三级在线观看视频| 成人黄页毛片网站| 9l视频白拍9色9l视频| 国产精品av久久久久久麻豆网| 你懂的网址一区二区三区| 亚洲图片小说区| 欧洲成人在线视频| 永久免费网站在线| 国产亚洲精品一区二区| www.色呦呦| 色av成人天堂桃色av| 欧美日韩成人免费观看| 国产欧美日韩激情| 婷婷五月精品中文字幕| 精品一区二区免费在线观看| 日本三级免费网站| 中国成人一区| 999视频在线观看| 久久精品女人天堂av免费观看 | 麻豆精品视频在线| 久草热视频在线观看| 亚洲午夜精品一区二区国产| 欧美一区二区三区四区在线观看地址 | 国产亚洲精品美女久久久久久久久久| 亚洲一区国产精品| 日韩欧美一区二区三区在线观看| 欧美激情精品久久久久久黑人| 波多野结衣在线网站| 精品视频在线导航| 午夜精品久久久久久久爽| 欧美日韩在线播| 91玉足脚交嫩脚丫在线播放| 亚洲免费观看高清完整版在线| 日本xxxxxxxxx18| 99精品久久久久久| 无码人妻aⅴ一区二区三区玉蒲团| 日本一不卡视频| 免费黄色日本网站| 亚洲激情不卡| 欧美a级免费视频| 91精品精品| 在线视频亚洲自拍| 色综合久久网| 亚洲午夜精品久久久中文影院av | 粉嫩91精品久久久久久久99蜜桃| 69久久夜色精品国产69| 毛片在线导航| 欧美国产日韩在线| 影音先锋男人在线资源| 久久视频在线直播| 国产一二区在线观看| 北条麻妃久久精品| 免费在线观看av网站| 欧美一区二区三区免费| 一级淫片免费看| 欧美日韩电影在线播放| 亚洲熟女乱色一区二区三区久久久| 日韩欧美一区二区三区| 中文字幕视频网| 欧美性猛交xxxx久久久| 欧美激情黑白配| 日韩欧美在线国产| 无码人妻精品一区二| 欧美午夜精品免费| 中文字幕人妻色偷偷久久| 欧美性猛交xxxxxxxx| 亚洲系列在线观看| 7777精品伊人久久久大香线蕉的| 97在线播放免费观看| 51精品久久久久久久蜜臀| 国产富婆一级全黄大片| 精品欧美一区二区在线观看| 免费观看国产精品| 日韩电影在线观看永久视频免费网站| 香蕉视频成人在线| 亚洲新中文字幕| 老司机精品影院| 欧美俄罗斯性视频| 蜜桃视频www网站在线观看| 国产成人亚洲精品| 国产情侣一区在线| 国产精品制服诱惑| 尤物tv在线精品| 一区不卡视频| 一区精品久久| 中文字幕一区综合| 亚洲性人人天天夜夜摸| 男人和女人啪啪网站| 麻豆91在线播放免费| 在线成人精品视频| www国产亚洲精品久久麻豆| 亚欧精品视频一区二区三区| 亚洲色图欧洲色图| 五月天婷婷综合网| 欧美性猛片aaaaaaa做受| 亚洲AV无码国产精品午夜字幕| 日韩精品有码在线观看| 欧美日韩在线资源| 亚洲91精品在线| 国产精品诱惑| 国内精品视频免费| 91免费精品| 日本日本19xxxⅹhd乱影响| 麻豆精品精品国产自在97香蕉| 香蕉视频免费网站| 国产乱码精品一区二区三| 免费黄色三级网站| 中文成人综合网| 91精品国产乱码久久久张津瑜| 欧美日韩视频专区在线播放| 少妇av在线播放| 精品国产一区二区三区久久| 涩涩涩在线视频| 亚洲一区二区少妇| 国产麻豆精品久久| 91动漫在线看| 国产尤物一区二区| 免费看黄色av| 欧美日韩另类在线| www.色亚洲| 久久精品欧美视频| 日韩精品第一| 精品国产一二| 久久精品色播| 中国一级黄色录像| 天堂成人国产精品一区| 年下总裁被打光屁股sp| 中文字幕日本乱码精品影院| 亚洲欧美综合另类| 亚洲国产成人精品女人久久久 | 亚洲日本成人在线观看| 激情视频网站在线观看| 亚洲国产97在线精品一区| 影音先锋在线播放| 91沈先生作品| 99精品电影| 国产福利精品一区二区三区| 国产清纯在线一区二区www| 日韩精品在线观看免费| 日韩丝袜美女视频| 久久77777| 国产日韩欧美另类| 秋霞影院一区| 这里只有精品66| 久久国产精品99久久人人澡| 能免费看av的网站| 日韩欧美国产视频| 青青草av免费在线观看| 欧美亚洲国产成人精品| 精品国内亚洲2022精品成人| 免费看欧美一级片| 处破女av一区二区| 国产在线视频在线观看| 欧美成人vr18sexvr| 五月天激情在线| 国产精品大全| 天堂网av成人| 欧美韩国日本在线| 久久一区二区三区四区| 亚洲黄色激情视频| 亚洲女同性videos| 韩国精品主播一区二区在线观看 | 国产精品美女www| 91欧美日韩| 性久久久久久久久久久久久久| 中文字幕在线观看不卡| 国产精品人人妻人人爽| 欧美成人性生活| 国产极品模特精品一二| www黄色日本| 国产午夜精品一区二区三区视频| 伊人久久久久久久久久久久 | 校园激情久久| www.99热| 欧美一区二区三区不卡| 国产91足控脚交在线观看| 国产欧美精品一区二区三区| 性8sex亚洲区入口| 一本色道久久88| 日韩欧美一区二区不卡| 麻豆视频在线观看免费网站黄| 欧美激情论坛| 精品一区二区日韩| 国产精品99re| 国产一区二区三区在线播放免费观看| 日日夜夜亚洲精品| 久久99久久99精品| 欧美—级在线免费片| 国产女同91疯狂高潮互磨| 久久久久久久爱| 国产一区国产二区国产三区| 亚洲av无日韩毛片久久| 香蕉成人啪国产精品视频综合网| 黄色影院在线播放| 亚洲自拍偷拍色片视频| 国产精品视区| 日韩欧美综合视频| 日韩精品999| 国产一区 二区| 男人的天堂日韩| 亚洲国产日韩综合久久精品| 国产乱子伦三级在线播放| 97人人干人人|