精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華、NVIDIA、斯坦福提出DiffusionNFT:基于前向過程的擴散強化學習新范式,訓練效率提升25倍

人工智能 新聞
DiffusionNFT 的提出,不僅為擴散模型的強化學習提供了一個高效、簡潔且理論完備的新框架,也對更廣泛的生成模型對齊研究具有啟發(fā)意義。

清華大學朱軍教授團隊, NVIDIA Deep Imagination 研究組與斯坦福 Stefano Ermon 團隊聯(lián)合提出了一種全新的擴散模型強化學習(RL)范式 ——Diffusion Negative-aware FineTuning (DiffusionNFT)。該方法首次突破現(xiàn)有 RL 對擴散模型的基本假設,直接在前向加噪過程(forward process)上進行優(yōu)化,在徹底擺脫似然估計與特定采樣器依賴的同時,顯著提升了訓練效率與生成質量。文章共同一作鄭凱文和陳華玉為清華大學計算機系博士生。

  • 論文標題:DiffusionNFT: Online Diffusion Reinforcement with Forward Process
  • 論文鏈接:https://arxiv.org/abs/2509.16117
  • 代碼倉庫:https://github.com/NVlabs/DiffusionNFT

背景 | 擴散模型的 RL 困境

近年來,強化學習在大語言模型(LLMs)后訓練中的巨大成功,催生了人們將類似方法遷移到擴散模型的探索。例如,F(xiàn)lowGRPO 等方法通過將擴散采樣過程離散化為多步?jīng)Q策問題,從而在反向過程上應用策略梯度優(yōu)化。然而,這一思路存在多重根本性局限:

1. 似然估計困難:自回歸模型的似然可精確計算,而擴散模型的似然只能以高開銷近似,導致 RL 優(yōu)化過程存在系統(tǒng)性偏差。

2. 前向–反向不一致:現(xiàn)有方法僅在反向去噪過程中施加優(yōu)化,沒有對擴散模型原生的前向加噪過程的一致性進行約束,模型在訓練后可能退化為與前向不一致的級聯(lián)高斯。

3. 采樣器受限:需要依賴特定的一階 SDE 采樣器,無法充分發(fā)揮 ODE 或高階求解器在效率與質量上的優(yōu)勢。

4.CFG 依賴與復雜性:現(xiàn)有 RL 方案在集成無分類器引導 (CFG) 時需要在訓練中對雙模型進行優(yōu)化,效率低下。

因此,如何設計一種既能保留擴散模型原生訓練框架,又能高效融入強化學習信號的統(tǒng)一方法,是亟待探索的問題。

方法 | 基于前向過程的負例感知微調

DiffusionNFT 提出了一個全新的思路:把強化學習直接作用于擴散的前向加噪過程,而非反向去噪軌跡。這一設計帶來了范式性的轉變。

核心機制包括:

正負對比的改進方向:在采樣生成中,利用獎勵信號將樣本劃分為正例與負例,從而定義出一個隱式的 “改進方向”。與只使用正樣本的拒絕采樣微調(Rejection FineTuning, RFT)不同,DiffusionNFT 顯式利用負樣本信號,確保模型有效 “避開” 低質量區(qū)域。

負例感知微調 (Negative-aware FineTuning, NFT):通過一種巧妙的隱式參數(shù)化方式,從目標模型同時定義正向策略與負向策略,將正負分布對比轉化為單一網(wǎng)絡的訓練目標,不需額外判別器或引導模型。

強化指導 (Reinforcement Guidance):在數(shù)學上,DiffusionNFT 將優(yōu)化目標刻畫為對舊策略分布的偏移量 ?,這一過程與 CFG 類似,但不依賴雙模型結構,而是內生于訓練目標中。

這樣的設計使 DiffusionNFT 同時滿足以下優(yōu)勢:

1. 前向一致性:訓練目標嚴格符合擴散的 Fokker–Planck 方程,不破壞與前向過程的一致性,使得訓練后的模型仍然是良定義的擴散模型。

2. 采樣器自由:訓練與采樣徹底解耦,可使用任意黑盒 ODE/SDE 求解器,擺脫對一階 SDE 的依賴;同時在訓練時只需存儲最終樣本與對應獎勵值,無需整條采樣軌跡。

3. 似然無關:不再需要變分下界或反向軌跡似然估計,訓練只依賴生成圖像與獎勵。

4.CFG-free 原生優(yōu)化:直接學習到獎勵引導的生成能力,避免 CFG 的推理開銷,同時仍可兼容 CFG 進一步提升性能。

實驗 | 高效性與生成質量

研究團隊在多個獎勵模型上驗證了 DiffusionNFT 的有效性。主要結果包括:

大幅效率提升:在 GenEval 任務上,DiffusionNFT 僅需 1k 步 即可將得分從 0.24 → 0.98,而 FlowGRPO 需超過 5k 步才能達到 0.95。整體上,DiffusionNFT 在不同任務上表現(xiàn)出 3×~25× 的訓練效率優(yōu)勢。

CFG-free 場景下顯著提升:即便完全不依賴 CFG,DiffusionNFT 也能在美感、對齊度等方面顯著優(yōu)于原始模型。

多獎勵聯(lián)合優(yōu)化:在 SD3.5-Medium 上同時優(yōu)化 GenEval、OCR、PickScore、ClipScore、HPSv2.1 等多種獎勵,最終模型在所有指標上均超越原始模型,與只針對單一獎勵進行優(yōu)化的 FlowGRPO 持平,并超過更大規(guī)模的 SD3.5-L 與 FLUX.1-Dev 模型。

展望 | 向統(tǒng)一的生成對齊范式邁進

DiffusionNFT 的提出,不僅為擴散模型的強化學習提供了一個高效、簡潔且理論完備的新框架,也對更廣泛的生成模型對齊研究具有啟發(fā)意義。從語言模型到視覺生成,DiffusionNFT 展示了負例感知 + 前向一致性普適價值。它打破了似然估計與反向軌跡的限制,建立起監(jiān)督學習與強化學習之間的橋梁。在未來,DiffusionNFT 有望推廣至多模態(tài)生成、視頻生成以及大模型對齊等更復雜場景,成為統(tǒng)一的生成優(yōu)化范式。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-11-03 14:13:52

強化學習方法

2023-11-13 07:51:58

ChatGPT研究

2025-04-25 13:34:53

R1DeepSeekAgent

2025-06-09 09:32:35

2025-06-30 09:08:00

2020-04-15 16:44:38

谷歌強化學習算法

2025-10-20 08:50:00

2025-07-02 09:21:30

2024-09-18 10:37:00

強化學習AI模型

2025-10-21 09:06:00

2022-10-20 15:38:02

谷歌模型

2018-12-03 09:35:26

互聯(lián)網(wǎng)

2025-10-10 08:33:49

2025-02-10 08:40:00

訓練數(shù)據(jù)模型

2025-06-27 10:10:43

AI模型技術

2022-11-02 14:02:02

強化學習訓練

2021-02-07 10:01:31

AI 數(shù)據(jù)人工智能

2025-08-21 09:10:00

2025-10-11 09:23:28

RLPT強化學習預訓練數(shù)據(jù)

2025-10-24 17:29:54

點贊
收藏

51CTO技術棧公眾號

日韩毛片在线| 无码人妻精品一区二区三应用大全| 国产三级在线免费观看| 日韩在线欧美| 91精品国产日韩91久久久久久| 丰满女人性猛交| 刘亦菲毛片一区二区三区| 亚洲综合日本| 久久久国产视频| 亚洲黄色免费在线观看| 国产黄色一区| 亚洲国产欧美日韩另类综合| 日本一区不卡| 亚洲春色一区二区三区| 久久激情网站| 欧美成人精品在线播放| www在线观看免费视频| 精品一区二区三区中文字幕在线| 第一福利永久视频精品 | 日韩在线视频免费| 蜜桃一区二区三区在线观看| 午夜精品久久久久久久99热| 任你操精品视频| 久久亚洲道色| 91精品国产91久久久久久最新毛片| 国产精品丝袜久久久久久消防器材| 美女黄视频在线观看| 91视视频在线观看入口直接观看www | 国产麻豆精品视频| 国产精品美女网站| 天堂在线免费观看视频| 欧美激情91| 北条麻妃99精品青青久久| 非洲一级黄色片| 欧美激情99| 精品国产a毛片| 一级淫片在线观看| 国内自拍亚洲| 色八戒一区二区三区| 国产精品久久精品国产| 中文字幕在线日亚洲9| 亚洲一区免费| 久久免费成人精品视频| 粉嫩av性色av蜜臀av网站| 精品美女久久| 亚洲色图色老头| 在线观看国产免费视频| 国产精品99久久免费观看| 日韩无一区二区| 一级黄色片在线免费观看| 国产91欧美| 欧洲激情一区二区| 黄色一级免费大片| 亚洲伦乱视频| 欧洲中文字幕精品| 九九热在线免费| 成人精品动漫| 色www精品视频在线观看| 妺妺窝人体色www在线小说| 国产精选在线| 色香蕉久久蜜桃| 玩弄japan白嫩少妇hd| caoporn国产精品免费视频| 91在线视频18| 欧美人与性禽动交精品| 中文字幕二区三区| 蜜桃视频在线观看一区二区| 国产精品一香蕉国产线看观看| 日韩国产成人在线| 七七婷婷婷婷精品国产| 国产剧情日韩欧美| 99久久精品无免国产免费| 国产毛片精品国产一区二区三区| 亚洲a区在线视频| 黄色激情视频在线观看| 亚洲福利电影| 秋霞成人午夜鲁丝一区二区三区| 激情高潮到大叫狂喷水| 爽成人777777婷婷| 久久躁狠狠躁夜夜爽| 免费在线观看av网址| 亚洲国内欧美| 国产精品扒开腿做爽爽爽的视频| 在线观看黄色国产| 国产一区二区三区四区五区美女| av噜噜色噜噜久久| 污视频在线免费观看| 国产欧美日本一区二区三区| 杨幂一区欧美专区| 丰满的护士2在线观看高清| 色综合色狠狠综合色| 美女网站色免费| 日韩中文字幕无砖| 亚洲人av在线影院| 91高清免费观看| 综合伊思人在钱三区| 中文字幕在线观看日韩| 国产探花在线播放| 免播放器亚洲| 亚洲曰本av电影| 四虎影视精品成人| 成人综合婷婷国产精品久久蜜臀 | 福利在线一区二区三区| 欧美永久精品| 日日狠狠久久偷偷四色综合免费 | 亚洲女子a中天字幕| 欧美不卡在线播放| 欧美精品少妇| 国产精品麻豆99久久久久久| 2018国产在线| 婷婷久久免费视频| 国产丝袜精品视频| 久久久国产精品黄毛片| 欧美理论视频| 九九九久久久久久| 影音先锋国产资源| 91免费视频大全| 久久人妻无码一区二区| 精品91久久| 精品国产麻豆免费人成网站| av资源在线免费观看| 亚洲一区欧美激情| 国产伦精品一区二区三区四区免费| 日韩三级影院| 91激情在线视频| www.88av| 欧美深夜福利| 欧美激情亚洲视频| 伊人免费在线观看| 久久久久久久久蜜桃| 日本中文字幕亚洲| 亚洲高清999| 久久精品国产96久久久香蕉| 亚洲高清视频免费观看| 91亚洲精品乱码久久久久久蜜桃| 超级碰在线观看| 精品三级在线| 日韩午夜在线视频| 中文字幕在线观看你懂的| 欧美极品少妇xxxxⅹ高跟鞋| 久久久精品在线视频| 人妖一区二区三区| 97色在线观看| 日韩一区二区三区不卡| 亚洲国产综合91精品麻豆| 国产在线播放观看| 99a精品视频在线观看| 久久视频免费在线播放| 亚洲天堂中文网| 中文欧美字幕免费| 日本三级黄色网址| 欧美综合视频| 国产欧美日韩丝袜精品一区| avav免费在线观看| 欧美丝袜丝交足nylons图片| 手机毛片在线观看| 卡一卡二国产精品| 色哺乳xxxxhd奶水米仓惠香| 91在线超碰| 精品国一区二区三区| 在线免费观看毛片| 91社区在线播放| 久久久久久久久久久久久久国产| 香蕉久久夜色精品国产使用方法 | 精品一区精品二区| 中文字幕在线欧美| 欧美激情中文不卡| 五月花丁香婷婷| 欧美国产免费| 韩国成人av| 日韩电影免费观| 中文字幕国内精品| 国产女人18毛片水真多| 亚洲福利视频导航| 波多野结衣一本| 美洲天堂一区二卡三卡四卡视频| 在线视频精品一区| 在线播放一区二区精品视频| 992tv成人免费影院| 黄色国产在线| 欧美一二三区在线观看| 国产午夜免费视频| 麻豆视频观看网址久久| 一区二区在线观| 亚洲日本va| 国产999精品久久久| 欧洲美女少妇精品| 欧美精品一区二区久久久| 日本在线播放视频| 亚洲欧洲一区二区在线播放| youjizz.com日本| 欧美在线电影| 99久久伊人精品影院| 日本不良网站在线观看| 少妇高潮久久久久久潘金莲| 国产黄色片网站| 色久综合一二码| 日韩在线中文字幕视频| 91麻豆国产福利精品| 91 视频免费观看| 亚洲制服av| 99久re热视频精品98| 色综合www| 亚洲自拍欧美色图| 亚洲四虎影院| 久久男人av资源网站| 国产视频第一页在线观看| 欧美mv日韩mv| 亚洲无码久久久久| 欧美午夜女人视频在线| 国产成人久久久久| 中文字幕国产一区二区| 精品一区二区视频在线观看| 国产一区二区三区在线观看免费 | 国产一级一片免费播放| 国产精品免费人成网站| 97人妻天天摸天天爽天天| 国产精品草草| 亚洲欧美日韩在线综合| ww久久综合久中文字幕| 97精品一区二区三区| 成人午夜在线影视| 中文字幕日韩av| 人成在线免费视频| 精品国产123| 国产欧美熟妇另类久久久| 欧美一a一片一级一片| 亚洲GV成人无码久久精品| 亚洲国产一区二区在线播放| 日韩精品一区二区亚洲av性色| 国产亚洲欧美日韩在线一区| 成人精品视频一区二区| 激情欧美日韩| 一级性生活视频| 国产精品久久久乱弄| 亚洲精品一区二区三区樱花| 国产欧美日韩在线观看视频| 精品午夜一区二区三区| 都市激情亚洲| 国产日韩精品推荐| 成人台湾亚洲精品一区二区 | jizz国产视频| 在线成人免费视频| 91福利在线观看视频| 欧美区一区二区三区| 中文字幕乱码人妻二区三区| 欧美中文字幕一区| 中日韩av在线| 欧美日韩精品一区二区在线播放| 97人妻精品视频一区| 欧美日韩亚洲综合在线| 在线免费av网| 91精品欧美一区二区三区综合在| av3级在线| 欧美日韩精品欧美日韩精品| 亚洲高清视频免费观看| 欧美亚洲国产一区在线观看网站 | 国产美女精品视频| 国产成人免费精品| 国产日韩精品入口| 国产精品一区二区精品| 色老头一区二区三区在线观看| 国产在线观看免费| 最好看的2019的中文字幕视频| av在线播放网| 久久久www成人免费精品| 主播国产精品| 午夜精品免费视频| 在线观看欧美日韩电影| 国产精品久久久久久久久久久久 | 欧美精品第一页| 99精品视频在线播放免费| 精品久久久久久久一区二区蜜臀| 人妻中文字幕一区| 亚洲欧美在线看| 欧美私人网站| 亚洲免费999| 亚洲美女91| 欧美日韩一区二区在线免费观看| 日韩中文字幕区一区有砖一区| 久久国产精品99久久久久久丝袜 | 51久久夜色精品国产麻豆| 精品国产99久久久久久宅男i| 亚洲欧洲中文日韩久久av乱码| 无码人妻一区二区三区免费n鬼沢| 国产成人aaa| 欧美一区二区三区成人精品| 中文字幕av一区二区三区免费看| 国产这里有精品| 欧美性精品220| 国产乱人乱偷精品视频| 日韩精品极品视频| 日韩子在线观看| 91成人性视频| 成人51免费| 欧美日本亚洲| 欧美1区2区3区| 免费裸体美女网站| 国产精品 日产精品 欧美精品| 欧美成人三级伦在线观看| 国产精品每日更新在线播放网址 | 精品夜夜澡人妻无码av| 国产精品嫩草影院com| 精品91久久久| 7777精品伊人久久久大香线蕉| 天堂中文在线资| 久久综合国产精品台湾中文娱乐网| 黄视频免费在线看| 91精品中国老女人| 欧美人妖在线| 国产xxxx振车| 999国产精品999久久久久久| 免费不卡av在线| 加勒比av一区二区| 国产精品密蕾丝袜| 激情久久av一区av二区av三区| 亚洲视频一区二区三区四区| 亚洲国内精品在线| 天堂中文资源在线观看| 久久精品视频在线| 午夜精品成人av| 国产精品中出一区二区三区| 亚洲欧洲日韩| jizz大全欧美jizzcom| 久久综合久久久久88| 欧美一级高潮片| 日韩欧美亚洲国产另类| 欧洲日本在线| 91精品美女在线| 日韩精品免费| 999在线免费视频| 91免费国产在线观看| 国产第100页| 精品欧美黑人一区二区三区| 在线网址91| 91久久久久久久一区二区| 成人在线免费观看视频| 欧美三级理论片| 久久精品欧美一区二区三区不卡| 日产精品久久久| 亚洲精品久久久一区二区三区 | 婷婷成人激情在线网| 亚洲春色一区二区三区| 欧美国产极速在线| 久久三级中文| 日韩精品一区二区在线视频| 国产成人在线视频网站| 久久高清无码视频| 亚洲精品一区二区三区精华液 | 999在线视频| 国产美女扒开尿口久久久| 成久久久网站| 色噜噜狠狠一区二区| 成人免费在线视频| a毛片在线免费观看| 欧美精品一区二区三区国产精品| 欧美国产亚洲精品| 男人添女荫道口女人有什么感觉| zzijzzij亚洲日本少妇熟睡| 午夜精品久久久久久久久久久久久蜜桃 | 免费97视频在线精品国自产拍| 国产精品xnxxcom| 日本福利视频网站| 9人人澡人人爽人人精品| av大全在线观看| 在线看日韩欧美| 亚洲欧美专区| 欧美性猛交内射兽交老熟妇| 9色porny自拍视频一区二区| 99久久久久久久久| 日韩亚洲精品视频| 911精品国产| 成人3d动漫一区二区三区| 国产精品蜜臀av| 亚洲国产www| 青草热久免费精品视频| 日本精品黄色| 又色又爽又黄18网站| 欧美性xxxx极品hd满灌| 在线免费看黄| 99伊人久久| 天堂精品中文字幕在线| 91精品一区二区三区蜜桃| 亚洲福利视频久久| yy6080久久伦理一区二区| 人人妻人人澡人人爽欧美一区| 99久久伊人网影院| 伊人久久成人网| 国模视频一区二区| 俺要去色综合狠狠| 91亚洲一线产区二线产区| 色婷婷av久久久久久久| caoporn97在线视频| 久精品国产欧美| 国模娜娜一区二区三区| 亚洲男人的天堂在线视频| 久久精品视频在线观看| 亚洲精品亚洲人成在线| 久久久久久久久久久影视| 色婷婷av久久久久久久|