精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

首次!流匹配模型引入GRPO,GenEval幾近滿分,組合生圖能力遠超GPT-4o

人工智能 新聞
港中文 MMLab、快手可靈、清華大學等團隊聯合提出?Flow-GRPO,首個將在線強化學習引入 Flow Matching 模型的工作。

本文由香港中文大學與快手可靈等團隊聯合完成。第一作者為香港中文大學 MMLab 博士生劉杰,他的研究方向為強化學習和生成模型,曾獲 ACL Outstanding Paper Award。

流匹配模型因其堅實的理論基礎和在生成高質量圖像方面的優異性能,已成為圖像生成(Stable Diffusion, Flux)和視頻生成(可靈,WanX,Hunyuan)領域最先進模型的訓練方法。然而,這些最先進的模型在處理包含多個物體、屬性與關系的復雜場景,以及文本渲染任務時仍存在較大困難。與此同時,在線強化學習因其高效探索與反饋機制,在語言模型領域取得顯著進展,但在圖像生成中的應用仍處于初步階段。

為此,港中文 MMLab、快手可靈、清華大學等團隊聯合提出 Flow-GRPO,首個將在線強化學習引入 Flow Matching 模型的工作。在 Flow-GRPO 加持下,SD3.5 Medium 在 GenEval 基準測試中的準確率從 63% 提升到 95%,組合式生圖能力超越 GPT4o,這說明流匹配模型還有很大提升空間,Flow-GRPO 的成功實踐,為未來利用 RL 進一步解鎖和增強各類流匹配生成模型(包括但不限于圖像、視頻、3D 等)在可控性、組合性、推理能力方面的潛力,開辟了充滿希望的新范式。

圖片

  • 論文標題:Flow-GRPO: Training Flow Matching Models via Online RL
  • 論文鏈接:https://www.arxiv.org/pdf/2505.05470
  • 代碼地址:https://github.com/yifan123/flow_grpo
  • 模型地址:https://huggingface.co/jieliu/SD3.5M-FlowGRPO-GenEval

作者團隊也會盡快提供 Gradio 在線 demo 和包含大量生成 case,強化學習訓練過程中圖片變化的網頁,幫助讀者更好地體會 RL 對于流匹配模型的極大提升。

一、核心思路與框架概覽

Flow-GRPO 的核心在于兩項關鍵策略,旨在克服在線 RL 與流匹配模型內在特性之間的矛盾,并提升訓練效率:

  1. ODE-SDE 等價轉換: 流匹配模型本質上依賴確定性的常微分方程(ODE)進行生成。為了強化學習探索所需的隨機性,作者采用了一種 ODE 到隨機微分方程(SDE)的轉換機制。該機制在理論上保證了轉換后的 SDE 在所有時間步上均能匹配原始 ODE 模型的邊緣分布,從而在不改變模型基礎特性的前提下,為 RL 提供了有效的探索空間。
  2. 去噪步數「減負」提效: 在 RL 訓練采樣時,大膽減少生成步數(例如從 40 步減到 10 步),極大加速數據獲取;而在最終推理生成時,仍然使用完整步數,保證高質量輸出。在極大提升 online RL 訓練效率的同時,保證性能不下降。

圖片

圖 1 Flow-GRPO 框架

二、ODE to SDE

GRPO 的核心是依賴隨機采樣過程,以生成多樣化的軌跡批次用于優勢估計和策略探索。但對于流匹配模型,其確定性的采樣過程不滿足 GRPO 要求。為了解決這個局限性,作者將確定性的 Flow-ODE 轉換為一個等效的 SDE,它匹配原始模型的邊際概率密度函數,在論文附錄 A 中作者提供了詳細的證明過程。原始的 flow matching 模型 inference 的時候按照如下公式:

圖片

轉變成 SDE 后,最終作者得到的采樣形式如下:

圖片

之后就可以通過控制噪聲水平的參數很好地控制 RL 策略的探索性。

三、Denoising Reduction

為了生成高質量的圖像,流模型通常需要大量的去噪步驟,這使得在線強化學習的訓練數據收集成本較高。作者發現,對于在線強化學習訓練,較大的時間步長在樣本生成時是多余的,只需要在推理時保持原有的去噪步驟仍能獲得高質量的樣本。作者在訓練時將時間步長設置為 10,而推理時的時間步長保持為原始的默認設置 40。通過這樣的「訓練時低配,測試時滿配」的設置,達到了在不犧牲最終性能的情況下實現快速訓練。

四、核心實驗效果

Flow-GRPO 在多個 T2I(文本到圖像)生成任務中表現卓越:

  • 復雜組合生成能力大幅提升: 在 GenEval 基準上,將 SD3.5-M 的準確率從 63% 提升至 95%,在物體計數、空間關系理解、屬性綁定上近乎完美,在該評測榜單上效果超越 GPT-4o! 

圖片

圖 2 Flow-GRPO 訓練過程中的性能持續上升

圖片

圖 3 GenEval 各項指標詳細結果

圖片

圖 4 在 GenEval 基準上的定性比較

  • 文字渲染精準無誤: 視覺文本渲染準確率從 59% 大幅提升至 92%,可以較為準確地在圖片中渲染文字。

圖片

  • 更懂人類偏好: 在人類偏好對齊任務上也取得了顯著進步。

圖片

  • 獎勵黑客行為顯著減少: Flow-GRPO 在性能提升的同時,圖像質量和多樣性基本未受影響,有效緩解 reward hacking 問題。

圖片

五、總結與展望

作為首個將在線強化學習引入流匹配模型的算法,Flow-GRPO 通過將流模型的確定性采樣機制改為隨機微分方程(SDE)采樣,并引入 Denoising Reduction 技術,實現了在流匹配模型上的高效在線強化學習。實驗結果顯示,即便是當前最先進的 flow matching 模型,在引入強化學習后依然有顯著的性能提升空間。Flow-GRPO 在組合式生成、文字渲染和人類偏好等任務上,相比基線模型均取得了大幅改進。

Flow-GRPO 的意義不僅體現在指標上的領先,更在于其揭示了一條利用在線強化學習持續提升流匹配生成模型性能的可行路徑。其成功實踐為未來進一步釋放流匹配模型在可控性、組合性與推理能力方面的潛力,尤其在圖像、視頻、3D 等多模態生成任務中,提供了一個充滿前景的新范式。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-27 12:45:30

2024-05-15 17:34:15

2024-05-20 08:20:00

OpenAI模型

2024-06-05 13:09:26

2025-04-16 09:15:00

AI模型數據

2024-11-28 15:51:19

GPT-4o微軟

2025-05-26 09:05:00

2025-03-26 09:13:02

2025-08-07 14:05:40

OpenAI大模型開源

2024-05-21 12:23:17

2024-06-05 08:29:35

2025-03-31 09:35:00

GPT-4oAI模型

2025-04-27 15:40:02

GPT-4oSTEMChatGPT

2025-10-28 02:11:00

2024-05-28 08:25:09

2024-05-14 11:29:15

2024-05-24 14:04:04

2025-04-08 02:26:00

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2025-04-15 08:01:12

點贊
收藏

51CTO技術棧公眾號

亚洲高清久久网| 国产精品毛片久久久久久久| 高清欧美一区二区三区 | 国内不卡的二区三区中文字幕| 最近的2019中文字幕免费一页| 日批视频在线看| 小视频免费在线观看| 国产精品乱码久久久久久| 91嫩草在线视频| 亚洲天堂一区在线| 欧美aaaaaaaaaaaa| 亚洲精品v天堂中文字幕| 波多结衣在线观看| 高清电影在线观看免费| 国产日产欧美精品一区二区三区| 成人日韩av在线| 久草手机在线视频| 欧美深夜福利| www.日韩欧美| 久久久久久国产精品无码| 99久久999| 欧美性生交xxxxx久久久| 米仓穗香在线观看| 91女主播在线观看| 91视频免费播放| 91久久精品国产91久久性色tv| 少妇久久久久久久| 99精品99| 久久久久久网址| 亚洲一级生活片| 成人看的视频| 亚洲色图在线观看| 国产伦精品一区二区免费| 成人豆花视频| 欧美日韩色一区| 国产精品乱码久久久久| 草草视频在线| 亚洲午夜精品17c| 水蜜桃在线免费观看| 婷婷在线视频观看| 欧美激情中文字幕| 日本一区二区三区免费看| 亚洲日本在线播放| www.久久久久久久久| y111111国产精品久久婷婷| 国产又粗又猛又黄| 老司机午夜精品| 国产精品网站视频| 亚洲视屏在线观看| 免费成人美女在线观看.| 日本一区二区三区四区视频| 精品欧美一区二区三区免费观看| 激情欧美亚洲| 久久久久久久亚洲精品| 精品无码一区二区三区电影桃花| 欧美一区综合| 欧美激情喷水视频| 久热精品在线观看| 精品成人久久| 羞羞色国产精品| 亚洲一区欧美在线| 亚洲免费在线| 国产97色在线|日韩| 高潮毛片又色又爽免费| 日韩电影在线一区二区三区| 国产成人综合亚洲| 亚洲一区在线观| 精品制服美女丁香| 91传媒在线免费观看| 国模无码一区二区三区| av色综合久久天堂av综合| 久久青青草综合| 啊v在线视频| 亚洲天天做日日做天天谢日日欢| 麻豆映画在线观看| 97在线超碰| 日韩欧美中文第一页| 一级特黄性色生活片| 亚洲精品伊人| 精品福利一二区| 日本黄色网址大全| 欧美电影一区| 久久久久久久久亚洲| 区一区二在线观看| 国产一区二区三区黄视频 | 青青草国产免费一区二区下载| 中文在线不卡视频| 91人妻一区二区三区蜜臀| 亚洲国产影院| 国产精品久久久久久久久久新婚 | 伊人久久综合一区二区| 欧美日韩一区二区在线观看 | 欧美极品少妇全裸体| 无码人妻久久一区二区三区不卡| 久久精品国产99国产精品| av一区二区三区免费| 国产中文在线视频| 亚洲综合激情小说| 99免费视频观看| 视频在线观看免费影院欧美meiju 视频一区中文字幕精品 | 久久99精品久久久久久秒播放器 | 国产精品自产拍在线观看中文| 午夜免费福利视频| 国产欧美日韩亚州综合| 亚洲精品国产suv一区88| 韩国主播福利视频一区二区三区| 欧美日韩免费观看一区二区三区 | 国产女主播福利| 久久精品一区二区三区四区| 少妇一晚三次一区二区三区| 日韩电影av| 精品国产1区2区3区| 正在播放国产对白害羞| 99xxxx成人网| 96pao国产成视频永久免费| 久久精品a一级国产免视看成人| 亚洲欧美日韩成人高清在线一区| 久草综合在线观看| 久久精品国产亚洲5555| 欧美成人免费全部观看天天性色| 色老头一区二区| 91亚洲精品久久久蜜桃| 永久免费网站视频在线观看| 日韩精品第一| 亚洲老头老太hd| 国产精品6666| 国产福利一区二区三区在线视频| 性欧美大战久久久久久久免费观看 | 成人涩涩视频| 亚洲欧美精品在线| 国产一级18片视频| av亚洲精华国产精华精华| 天堂а√在线中文在线| 青娱乐极品盛宴一区二区| 亚洲网在线观看| 国产91精品一区| 99久久久免费精品国产一区二区| 日韩国产小视频| 国产精品一区二区精品视频观看| 最好看的2019的中文字幕视频| 69xxxx国产| 久久久久久久久97黄色工厂| 免费黄色福利视频| 欧美三级午夜理伦三级小说| 欧美激情在线播放| 动漫av一区二区三区| 一区二区三区日韩欧美| av在线网站免费观看| 国产精品精品| 91亚洲精品在线| 日韩av激情| 欧美sm美女调教| 久久精品欧美一区二区| 成人深夜视频在线观看| 福利视频一区二区三区四区| 风间由美中文字幕在线看视频国产欧美 | 久久久久久久影视| 色香色香欲天天天影视综合网| 深爱五月激情网| 热久久国产精品| 一个色的综合| 日韩欧美激情电影| 久久免费视频在线观看| 手机看片福利永久| 色婷婷综合在线| 2017亚洲天堂| 九九在线精品视频| 成人午夜视频免费观看| 精品久久对白| 国产成人在线精品| 国产在线更新| 亚洲国产日韩欧美在线图片| www.欧美色| 国产精品久久久久aaaa| 亚洲欧美日韩一二三区| 亚洲黄色一区| 日本不卡一二三区| 精品一区二区三区视频在线播放| 国内揄拍国内精品| 成人动漫在线播放| 日韩一级大片在线观看| 中文字幕亚洲精品一区| 国产精品美女久久久久久2018| 日韩精品xxx| 另类亚洲自拍| 国产精品12p| 麻豆一区二区麻豆免费观看| 国产精品网址在线| h片在线观看| 中文字幕精品一区二区精品| 草草视频在线播放| 在线观看亚洲成人| 青青草原国产视频| 久久精品人人做人人爽人人| 性一交一黄一片| 久久精品欧洲| 久久这里只有精品8| blacked蜜桃精品一区| 99在线视频免费观看| 日韩免费va| 欧美精品激情在线| 免费av网站在线观看| 日韩成人av在线| 99国产精品99| 欧美最新大片在线看| 日本三级视频在线| 亚洲人成在线观看一区二区| 99久久久久久久久久| 国产成人免费视频网站高清观看视频| 国产裸体舞一区二区三区| 午夜日韩电影| www.午夜色| 精品视频亚洲| 精品国产一区二区三| 日韩精品久久久久久久软件91 | 无人区乱码一区二区三区| 国产精品久久久久久久天堂| a毛片不卡免费看片| 美女久久久久久久久久久| 成人性爱视频在线观看| 亚洲精品日韩久久久| 老牛影视av牛牛影视av| 91精品婷婷国产综合久久竹菊| 国产污视频网站| 午夜精品福利在线| 九九热精彩视频| 亚洲天堂福利av| 日韩精品久久久久久久的张开腿让 | 欧美色欧美亚洲高清在线视频| 久艹在线观看视频| 国产精品成人免费在线| 精品国产av无码| 久久亚洲影视婷婷| 久久精品女同亚洲女同13| 国产成人在线电影| 性生活在线视频| 国产精品综合视频| 亚洲综合中文网| 国产99一区视频免费 | 久久久久久久电影| jizz欧美性20| 久久久99精品免费观看不卡| 少妇精品一区二区三区| 久久亚洲一区二区三区四区| 黄色正能量网站| 91色porny在线视频| 黄色国产在线观看| 久久人人97超碰com| 久久久精品人妻无码专区| 91色乱码一区二区三区| 黄色正能量网站| 欧美国产视频在线| 精品伦精品一区二区三区视频密桃| 欧美高清在线一区二区| 免费看一级黄色| 亚洲人成小说网站色在线| 在线看的片片片免费| 一区二区三区产品免费精品久久75| 欧美三级在线免费观看| 亚洲线精品一区二区三区八戒| 国产真实乱偷精品视频| 婷婷一区二区三区| 91丝袜一区二区三区| 欧美午夜寂寞影院| 国产精品久久久久久久免费| 日韩欧美第一区| 天天干天天爱天天操| 国产一区二区三区精品久久久 | 韩国日本不卡在线| 裤袜国产欧美精品一区| 国产精品极品尤物在线观看| 国产精品一区二区精品视频观看| a级国产乱理论片在线观看99| 嫩草国产精品入口| 亚洲国产欧美日韩| 综合国产精品| 日韩黄色片视频| 久久99久国产精品黄毛片色诱| wwwxxx色| 国产视频在线观看一区二区三区| 成人黄色短视频| 亚洲国产精品麻豆| 日本成人一级片| 日韩三级高清在线| 男女视频在线观看| 久久国产加勒比精品无码| 欧亚av在线| 91九色国产在线| 一区二区三区韩国免费中文网站| 在线一区日本视频| 国产日韩欧美一区二区三区在线观看| 亚洲性生活网站| 丰满亚洲少妇av| 亚洲毛片亚洲毛片亚洲毛片| 亚洲va在线va天堂| 97精品人妻一区二区三区| 亚洲国产精品99久久| 日韩子在线观看| 欧美在线视频一区| 久久视频免费| 欧美一区二区三区在线播放| 午夜欧美精品久久久久久久| www日韩在线观看| 从欧美一区二区三区| 五月天色婷婷丁香| 91久久精品一区二区三| 丰满人妻一区二区三区无码av| 中文字幕欧美视频在线| 老司机深夜福利在线观看| 亚洲a在线观看| 成人在线免费观看91| 丰满爆乳一区二区三区| 国产激情一区二区三区| 成人免费视频入口| 欧美午夜xxx| 国产成人手机在线| 美女视频久久黄| 伊人久久精品| 亚洲成色www久久网站| 亚洲综合好骚| 屁屁影院国产第一页| 一区二区激情视频| 国产情侣自拍小视频| 色久欧美在线视频观看| 日韩高清不卡| 欧美一区1区三区3区公司 | 五月天丁香视频| 欧美极品在线播放| 538任你躁精品视频网免费| 正在播放91九色| 久久精品国产在热久久| 极品人妻videosss人妻| 色先锋aa成人| 青青草视频在线观看| 17婷婷久久www| 久久草在线视频| www.中文字幕在线| 99国产精品久久久| 中文字幕亚洲高清| 亚洲精品久久7777777| 国产不卡123| 精品一区二区日本| 国产农村妇女精品一区二区| 中文字幕影片免费在线观看| 午夜婷婷国产麻豆精品| 天堂中文在线看| 国产91对白在线播放| 伊人久久大香线蕉综合网站 | 国产第100页| 亚洲国产精品系列| 香蕉伊大人中文在线观看| 蜜桃视频成人| 秋霞影院一区二区| 久草福利资源在线| 欧美一区日本一区韩国一区| av网址在线看| 激情欧美一区二区三区中文字幕| 在线综合视频| 中文字幕人妻一区二区三区在线视频 | 日韩精品在在线一区二区中文| 销魂美女一区二区三区视频在线| 国产精品久久久久无码av色戒| 在线观看成人小视频| 婷婷五月在线视频| 草莓视频一区| 国产精品资源| 国产综合精品久久久久成人av| 欧美日韩精品是欧美日韩精品| 米奇精品一区二区三区| 99在线观看视频网站| 亚洲欧美日本视频在线观看| 亚洲最大成人综合网| 欧美一区二区三级| 免费在线小视频| 亚洲黄色一区二区三区| 国产精品一级黄| 精品不卡一区二区| 日韩资源在线观看| 国产主播性色av福利精品一区| 国产精品wwwww| 18欧美亚洲精品| 欧美在线观看在线观看| 成人在线播放av| 国产日韩欧美| 成人涩涩小片视频日本| 亚洲国产中文字幕在线观看 | 国产精品区一区二区三在线播放| 午夜在线视频观看日韩17c| 后入内射无码人妻一区| 亚洲成人久久久久| 国产一区精品福利| aa视频在线播放| 综合分类小说区另类春色亚洲小说欧美 | 日韩一区二区三区视频在线| 国产伦子伦对白在线播放观看| 丝袜美腿玉足3d专区一区| 成人免费va视频| 国产又粗又猛又黄又爽| 日本一区二区三区在线播放| 国产一区二区中文|