精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

人民大學&字節Seed:利用μP實現Diffusion Transformers高效擴展

人工智能 新聞
人大高瓴李崇軒團隊和字節跳動Seed團隊的研究員引入了大語言模型訓練中的μP理論,并將其擴展到diffusion Transformers的訓練中。

本文由中國人民大學高瓴人工智能學院李崇軒團隊和字節跳動Seed團隊共同完成。第一作者鄭晨宇是中國人民大學高瓴人工智能學院二年級博士生,主要研究方向為基礎模型的優化、泛化和可擴展性理論,導師為李崇軒副教授,論文為其在字節跳動Seed實習期間完成。第二作者張新雨是字節跳動研究員,主要研究方向為視覺生成模型。李崇軒副教授為唯一通訊作者。

近年來,diffusion Transformers已經成為了現代視覺生成模型的主干網絡。隨著數據量和任務復雜度的進一步增加,diffusion Transformers的規模也在快速增長。然而在模型進一步擴大的過程中,如何調得較好的超參(如學習率)已經成為了一個巨大的問題,阻礙了大規模diffusion Transformers釋放其全部的潛能。

為此,人大高瓴李崇軒團隊和字節跳動Seed團隊的研究員引入了大語言模型訓練中的μP理論,并將其擴展到diffusion Transformers的訓練中。μP通過調整網絡不同模塊的初始化和學習率,實現不同大小diffusion Transformers共享最優的超參,使得小模型上搜到的超參可以直接遷移到最終大模型上進行訓練,從而極大地減小了超參搜索的耗費。

團隊在DiT,PixArt和MMDiT(Stable Diffusion的基座)上進行了系統的大規模實驗驗證。在MMDiT的實驗中,0.18B小模型上搜得的超參成功被用在18B大模型的訓練中,并擊敗了人工專家的手調基線。其中,小模型超參搜索的計算量(FLOPs)僅是專家手調的3%左右。

團隊已在近期開放在線論文,并開源代碼。

圖片

  • 論文鏈接:https://arxiv.org/abs/2505.15270
  • 代碼倉庫:https://github.com/ML-GSAI/Scaling-Diffusion-Transformers-muP

μP的背景和問題

μP全稱為最大更新參數化(Maximal Update Parametrization),是Tensor Program無窮寬網絡理論系列中的里程碑之作,相關結果已被理論證明適用于標準的Transformer架構。μP的算法實現簡潔,對于應用最為廣泛的AdamW優化器而言,μP只需要調整隱藏層權重的學習率,和輸出層權重的系數以及初始化。μP在實際中被廣泛發現能夠實現不同大小的標準Transformer共享最優的超參,使得小模型上搜到的超參可以直接遷移到大模型,極大地減小了超參搜索的耗費。由于μP帶來了穩定的超參遷移性質,它近年來已經被成功使用在大語言模型(標準Transformer)的預訓練中。

然而,diffusion Transformers和標準Transformer存在較大的差異。從架構上來看,diffusion Transformers引入了額外的模塊來處理并整合文本信息,如DiT中的adaLN block。從任務目標上來看,diffusion Transformers處理的是視覺的擴散學習任務,而標準Transformer主要處理的是語言的自回歸學習任務。這兩點差異意味著已有的μP形式及其超參遷移律在視覺diffusion Transformers中不一定成立。針對這一問題,團隊從理論和實踐上進行了系統的研究。

Diffusion Transformers的μP形式

團隊首先從理論上研究了主流diffusion Transformers的μP形式,包括DiT,U-ViT,PixArt-α和MMDiT。Tensor Program理論系列中的結果表明,如果網絡架構能夠被Tensor Program中定義的算子表示,那么現有的μP形式就能成立。基于這個理論技術,我們證明了:即使主流diffusion Transformers的結構不同于標準Transformer,它們也能夠被Tensor Program表示,因此現有的μP理論和相關實踐可以被無痛遷移到這些主流diffusion Transformers上。我們的證明技術也可以被遷移到其它的diffusion Transformers做類似的分析。

總之,diffusion Transformers的μP方法論可以由下圖總結。我們首先基于μP理論,調節不同權重的系數、初始化和學習率。然后,我們在一系列小模型上搜索得到最優的超參。最后,我們將最優的超參直接遷移到大模型的訓練。

圖片

基于μP擴展Diffusion Transformers:初探

首先,我們使用DiT網絡在ImageNet數據集上系統地驗證了:當網絡寬度,數據批量大小和訓練步數足夠大時(如寬度達到144,批量大小達到256),超參便可以較為穩定地沿著不同的網絡寬度,數據批量大小和訓練步數進行遷移。這意味著我們能在網絡寬度,數據批量大小和訓練步數都更小的代理任務上搜索超參,然后遷移到最終大網絡大數據的訓練。

圖片

然后,為了驗證μP超參遷移的有效性,我們將最優的超參(學習率2^-10)直接遷移到DiT-XL-2的訓練中,我們發現,當模型訓練到2.4M步時,FID-50K就已經超過了原論文7M步最終的FID-50K結果,DiT-XL-2-μP的收斂速度是原論文的2.9倍。這向我們展現了利用μP遷移超參做擴展的良好前景。

圖片

基于μP擴展Diffusion Transformers:大規模驗證

圖片

我們進一步在大規模的文生圖任務上驗證了μP擴展diffusion Transformers的有效性。我們首先考慮了流行的開源文生圖模型PixArt-α,我們在0.04B的代理模型上搜索學習率,并遷移到最終0.61B大小PixArt-α的訓練。其中,小模型搜索超參的計算量總和(FLOPs)僅為一次訓練的5.5%。利用搜索得到的學習率,PixArt-α-μP在訓練的過程中穩定地取得了比基線更好的效果。

圖片

最后,我們考慮了SD3的基座模型MMDiT,并將驗證的規模提高到了18B的量級。為了能夠給社區帶來更多的可信的實踐經驗,我們在 4個超參(學習率,梯度裁剪值,REPA loss的權重以及warmup的步數)上進行了多達80次的隨機搜索,總搜索計算量(FLOPs)約是人工手調的3%。在0.18B模型上的超參搜索結果表明,我們學習率,梯度裁剪值,REPA loss都對結果有影響,其中學習率的影響仍是最為關鍵的。而warmup的步數則對結果影響不大。

圖片

我們將0.18B模型上搜索的超參應用在了18B模型的訓練上,不論從訓練loss的變化還是從人工評測的結果,MMDiT-μP都穩定地超過了人工專家手調的基線,而μP的超參搜索FLOPs僅是人工手調的3%!

圖片

經過這一系列系統的實驗探索,我們證明了μP是科學擴展diffusion Transformers的有效手段,我們也相信μP會是未來基礎模型擴展的必備利器。通過本工作的大量努力,我們希望讓社區了解μP理論,擁抱μP實踐,思考理論上最優的智能擴展范式(模型大小,數據量,推理時間)。我們也相信,放眼人工智能的長遠未來,類似μP的底層理論的發展仍然是必不可少的,也必將會在未來的大規模實踐中有著不可或缺的一席之地。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-06-26 10:25:45

人民大學服務器癱瘓流量

2015-03-12 10:53:56

SSL VPN深信服

2022-04-08 14:52:31

模型谷歌方法

2025-08-12 15:19:32

字節跳動生成模型工具鏈

2025-08-05 09:02:00

2020-11-26 17:04:02

騰訊實驗室系統

2015-03-25 13:49:10

無線網絡Aruba

2017-08-15 16:29:05

商學院

2023-04-03 10:21:05

模型技術

2018-01-11 10:15:14

速途網

2025-04-29 09:10:00

2025-01-23 17:07:07

2021-04-08 10:06:38

數字人民幣數字貨幣區塊鏈

2025-01-21 09:15:00

2025-06-18 08:47:00

2011-03-28 17:07:14

海量數據庫

2025-07-04 08:47:00

大模型AI信息

2010-03-21 19:05:19

微軟MSF

2023-11-20 15:26:18

人工智能GenAI模型

2025-10-30 09:31:10

點贊
收藏

51CTO技術棧公眾號

欧美成人全部免费| 欧美精品粉嫩高潮一区二区| 精品乱色一区二区中文字幕| 久久久久久91亚洲精品中文字幕| 国产亚洲欧美日韩在线观看一区二区 | 桃花岛成人影院| 中文字幕一区二区三区不卡| 99视频在线播放| jizz国产在线观看| 中文无码久久精品| 国产午夜精品全部视频播放| 国产成人精品一区二区三区在线观看| 在线观看欧美日韩电影| 中文字幕一区av| 久草精品电影| www.久久成人| 蜜臀a∨国产成人精品| 韩国福利视频一区| 国产人妻精品一区二区三区不卡| 日韩电影不卡一区| 日韩欧美一区二区免费| av免费中文字幕| 免费在线国产视频| 国产女人18毛片水真多成人如厕 | 天天操天天爱天天干| 久久国产生活片100| 午夜精品久久久久久久男人的天堂| 亚洲色图欧美色| 亚洲免费福利一区| 亚洲成人av片| 韩国三级与黑人| 素人啪啪色综合| 欧美日韩免费在线| 欧美国产日韩激情| 中文国产字幕在线观看| 国产精品网站导航| 日韩欧美亚洲日产国产| 亚洲人成色777777精品音频| 懂色av一区二区三区免费观看 | 久久久久久久久爱| 日韩欧美综合视频| 亚洲精品tv久久久久久久久久| 亚洲欧美中文日韩在线| 色婷婷免费视频| 哺乳挤奶一区二区三区免费看 | 台湾av在线二三区观看| 成人av电影在线| 国产高清精品一区二区| 怡红院男人的天堂| 麻豆成人综合网| 国产精品吊钟奶在线| 亚洲精品中文字幕乱码三区91| 亚洲美女黄网| 8x海外华人永久免费日韩内陆视频| 中文字幕在线观看成人| 欧美在线亚洲综合一区| 久久成人国产精品| 69xx绿帽三人行| 伊人色**天天综合婷婷| 久久最新资源网| www.99re7| 国产综合色产| 97视频在线观看视频免费视频| 日本一区二区三区免费视频| 国内激情久久| 66m—66摸成人免费视频| 亚洲久久在线观看| 免费亚洲网站| 国产精品久久久久国产a级| 国产情侣小视频| 开心九九激情九九欧美日韩精美视频电影| 国产精品亚洲аv天堂网| 中文字幕乱码在线观看| 九一九一国产精品| 999精品视频一区二区三区| 亚洲xxx在线| 91在线视频网址| 任我爽在线视频精品一| 91青青在线视频| 一区二区三区91| 成人在线免费观看av| 性欧美超级视频| 538在线一区二区精品国产| 久久久久久国产精品日本| 国产在线播放精品| 亚洲欧洲在线免费| 1024手机在线视频| 亚洲一区成人| 国产精品自拍偷拍视频| www.av在线.com| 久久日韩精品一区二区五区| 亚洲精品成人久久久998| 69xxx在线| 日韩欧美在线第一页| 亚洲精品久久久久久宅男| 91精品国产乱码久久久竹菊| 亚洲欧洲日产国产网站| 久久久久亚洲av无码专区体验| 日韩午夜在线电影| 国产日韩精品电影| 色猫av在线| 亚洲免费三区一区二区| 99福利在线观看| 精品久久亚洲| 亚洲欧洲视频在线| 日本一区二区三区四区五区| 人人超碰91尤物精品国产| 99久久无色码| 秋霞成人影院| 亚洲国产综合91精品麻豆| 在线观看av日韩| 美女一区二区在线观看| 日韩天堂在线视频| 亚洲欧美另类在线视频| 国产成人精品亚洲午夜麻豆| 亚洲丰满在线| 成人免费网站视频| 精品国产电影一区二区| 黑人操日本美女| 可以看av的网站久久看| 国产精品免费观看高清| 黄色网页在线看| 欧美亚洲一区二区在线| 91视频在线免费| 亚洲精品国产偷自在线观看| 国产精品电影观看| 精品99又大又爽又硬少妇毛片| 亚洲国产成人porn| 无码人妻少妇色欲av一区二区| 成人激情电影在线| 国产成+人+综合+亚洲欧洲| 丰满人妻一区二区三区四区53 | 成人精品一区二区三区四区| 正在播放一区二区三区| se69色成人网wwwsex| 亚洲日本成人网| 九九精品免费视频| 99久久精品免费看国产免费软件| 日本一道在线观看| 国产成人免费视频网站视频社区| 日韩中文理论片| 国产精品51麻豆cm传媒 | 精品福利一二区| 劲爆欧美第一页| 国产美女一区二区三区| 一区二区三区av在线| 日本成人一区二区| 日韩视频免费中文字幕| 91 中文字幕| 亚洲人精品午夜| 中文字幕第22页| 午夜性色一区二区三区免费视频| 95av在线视频| 亚洲www色| 亚洲高清色综合| 国产微拍精品一区| 久久女同互慰一区二区三区| 欧美日韩第二页| 加勒比久久综合| 国产欧美久久一区二区| 黄色网址免费在线观看| 日韩精品中文字幕在线一区| 国产小视频在线观看免费| 成人av网站免费| 日本一本二本在线观看| 国产精品入口久久| 成人黄色大片在线免费观看| а√天堂在线官网| 亚洲成人精品av| 国产成人无码av| 国产精品丝袜一区| 亚洲精品乱码久久久久久动漫| 欧美精选在线| 久久亚洲高清| 视频91a欧美| 色综合久久精品亚洲国产| 天堂在线中文网| 欧美午夜视频网站| 久久久久久久久久久97| 91蜜桃免费观看视频| 亚洲欧美日韩一级| 欧美激情无毛| 日韩av电影免费在线观看| 欧美91在线|欧美| 欧美激情欧美激情在线五月| 你懂的免费在线观看视频网站| 欧美色视频在线| 国产精彩视频在线| 欧美国产精品专区| 无码人妻精品一区二区三区99不卡| 午夜亚洲性色福利视频| 麻豆md0077饥渴少妇| 男人的天堂久久| 成人性教育视频在线观看| 川上优av中文字幕一区二区| 最新日韩中文字幕| 亚洲人成色777777精品音频| 制服丝袜日韩国产| 久久亚洲精品石原莉奈| 亚洲精品水蜜桃| 一级黄色片大全| 成人黄色国产精品网站大全在线免费观看| 免费男同深夜夜行网站| 在线国产精品一区| 亚洲欧美日韩不卡| 亚洲区小说区| 国产精品精品软件视频| 欧美成人aaa| 欧洲永久精品大片ww免费漫画| 在线观看中文字幕的网站| 亚洲午夜女主播在线直播| 亚洲男人天堂久久| 这里只有精品99re| 91porny九色| 欧美性猛xxx| 四虎成人精品永久免费av| 17c精品麻豆一区二区免费| 婷婷色一区二区三区| av在线免费不卡| wwwxx日本| 六月丁香婷婷色狠狠久久| 国产精品亚洲αv天堂无码| 黄色成人在线网址| 日韩video| 99久久婷婷| 在线电影看在线一区二区三区| 在线一级成人| 欧美不卡在线一区二区三区| 9l视频自拍九色9l视频成人| 成人福利在线视频| 免费视频观看成人| 国产精品一区二区电影| 日韩高清在线| 国产精品久久久久久久久免费看 | 国产精品无码网站| 成人免费看的视频| 最新版天堂资源在线| 粉嫩嫩av羞羞动漫久久久| 青青草精品在线| 国产福利91精品一区二区三区| 男人午夜视频在线观看| 国产在线播放一区三区四| 色婷婷激情视频| 国产精品18久久久久久vr| 麻豆传媒在线看| 粉嫩aⅴ一区二区三区四区五区| 国产探花在线观看视频| 国产精品影音先锋| 亚洲成人激情小说| 国产成人精品免费网站| 午夜福利三级理论电影 | 国产一区二区三区色淫影院 | 欧美一区二区三区在线播放| 亚洲图片久久| 无遮挡亚洲一区| 四季av在线一区二区三区| 精品一区二区成人免费视频| 亚洲91精品| 日本a级片在线播放| 极品少妇一区二区三区| 女人喷潮完整视频| 日韩黄色小视频| 小早川怜子一区二区三区| 国产不卡视频在线播放| 久久久久麻豆v国产精华液好用吗| 337p粉嫩大胆噜噜噜噜噜91av| 在线观看日本中文字幕| 国产精品久久久爽爽爽麻豆色哟哟| 69夜色精品国产69乱| 一区二区三区欧美日| 国产成人亚洲欧洲在线| 91成人国产精品| 国产男女裸体做爰爽爽| 亚洲丁香久久久| 国产高清一区在线观看| 久久艹在线视频| 中文不卡1区2区3区| 国产97在线播放| 蜜桃在线一区| 欧美一区二区福利| 欧美一区不卡| 欧美aⅴ在线观看| 国产麻豆精品95视频| 无遮挡aaaaa大片免费看| 国产精品青草综合久久久久99| 九九热国产在线| 欧美自拍丝袜亚洲| 亚洲黄色小说网| 永久免费精品影视网站| av毛片在线| 国产成人精品视频在线观看| 亚洲精品在线a| 日韩亚洲视频| 亚洲人成免费| 亚洲激情在线看| 91啦中文在线观看| 日本中文字幕免费在线观看| 欧美日韩亚洲国产一区| 国产超碰人人模人人爽人人添| 国产丝袜精品第一页| 最新黄网在线观看| 欧美在线亚洲在线| 欧美另类中文字幕| 四虎一区二区| 国产视频亚洲| gogo亚洲国模私拍人体| 中文欧美字幕免费| www.日本精品| 日韩色视频在线观看| 国产三级在线| 91av在线精品| 1769国产精品视频| 一区二区三视频| 视频一区二区中文字幕| 手机在线成人av| 亚洲免费伊人电影| 亚洲中文字幕一区二区| 国产亚洲精品久久久久久牛牛 | 国产拍精品一二三| 在线视频亚洲专区| 很污的网站在线观看| 国产乱码精品一品二品| 91狠狠综合久久久| 欧美日韩亚洲国产综合| 国产一二在线观看| 欧洲一区二区视频| 亚洲性视频大全| www一区二区www免费| jlzzjlzz国产精品久久| 国产精品第二十页| 精品福利一区二区三区免费视频| av网站在线免费| 91亚洲精华国产精华| 欧美激情电影| 国产精品久久久久久9999| 中文字幕一区二区视频| 亚洲一级av毛片| 日韩中文字幕不卡视频| 国产第一精品| 亚洲精品中文字幕乱码三区不卡| 日韩成人免费看| 少妇一级黄色片| 欧美三级在线看| 在线免费看a| 91免费看片网站| 欧美一区二区三区免费看| 91亚洲一区二区| 亚洲一区二区影院| 天天色综合av| 日本久久91av| 成人高清av| 一级做a免费视频| 亚洲欧美一区二区三区极速播放 | 久久99国产精品二区高清软件| 婷婷五月色综合| 国产一区二区剧情av在线| 一区二区国产精品精华液| 日韩欧美国产系列| 国产精品一二三产区| 久久青青草原| 青青草成人在线观看| 老熟妇高潮一区二区三区| 91精品国产综合久久久蜜臀图片| 99在线播放| 好看的日韩精品| 日韩福利视频网| 国产wwwwxxxx| 欧美成人国产一区二区| 涩涩视频在线| 这里只有精品66| 不卡一卡二卡三乱码免费网站| 五月天婷婷导航| 久色乳综合思思在线视频| 动漫3d精品一区二区三区乱码| 99蜜桃臀久久久欧美精品网站| 国产农村妇女毛片精品久久麻豆| 国产精品欧美综合亚洲| 国a精品视频大全| 成人黄色小视频| 少妇伦子伦精品无吗| 色狠狠综合天天综合综合| av免费在线观看网址| 久久艹中文字幕| 国产综合色精品一区二区三区| 国产91av视频| 久久人人爽人人爽人人片亚洲 | 亚洲精品狠狠操| 欧美aaa级| 成年人视频观看| 亚洲女子a中天字幕| 亚洲日本香蕉视频| 91热精品视频| 久久精品系列| 黄色小视频在线免费看| 中文字幕精品视频| 国产成人夜色高潮福利影视| 波多野结衣xxxx| 欧美性xxxx极品hd欧美风情| 国产写真视频在线观看| 欧美另类一区|