精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用更一致的軌跡、更少的解碼步數「馴服」掩碼擴散語言模型,擴散語言模型的推理性能和效率大幅提升

人工智能 新聞
近期,復旦大學、上海人工智能實驗室、上海交通大學聯合研究團隊發布最新論文《Taming Masked Diffusion Language Models via Consistency Trajectory Reinforcement Learning with Fewer Decoding Step》。

擴散大語言模型得到了突飛猛進的發展,早在 25 年 2 月 Inception Labs 推出 Mercury—— 第一個商業級擴散大型語言模型,同期人民大學發布第一個開源 8B 擴散大語言模型 LLaDA,5 月份 Gemini Diffusion 也接踵而至。種種跡象表明,擴散大語言模型很可能是下一代大語言模型基礎范式的有力競爭者。但是針對于擴散大語言模型的解碼策略和強化學習算法仍然是欠探索的。

近期,復旦大學、上海人工智能實驗室、上海交通大學聯合研究團隊發布最新論文《Taming Masked Diffusion Language Models via Consistency Trajectory Reinforcement Learning with Fewer Decoding Step》。

他們提出了一套對于掩碼擴散大語言模型(Masked Diffusion Large Language Model,MDLM)的高效解碼策略 + 強化學習訓練組合,顯著提升了掩碼擴散大語言模型的推理性能與效率,為擴散大語言模型的發展開辟了新路徑。

  • 代碼倉庫:https://github.com/yjyddq/EOSER-ASS-RL
  • 論文鏈接:https://arxiv.org/pdf/2509.23924

解決了什么問題?

掩碼擴散大語言模型(MDLM)如 LLaDA 展現出與自回歸模型相媲美的能力,并具備并行解碼、靈活生成順序、潛在少步推理等優勢。然而,完全擴散式(Full Diffusion-Style)解碼策略并未被廣泛使用,取而代之的是分塊解碼(Block-wise)。因為目前的完全擴散式解碼存在一大痛點 —— 性能大幅度遜色于分塊解碼。

但令人疑惑的是,掩碼擴散大語言模型在預訓練和指令微調階段并未針對分塊解碼這種方式進行適配微調,所以這一現象背后的原因仍不為人所知。該團隊基于這點發現刨根問底,最終定位到 MDLM 的全擴散式解碼的三個特點:

  • 解碼過程中的 token 置信度變化趨勢:由平緩到陡升;
  • 解碼過程中 <EOS> token 的置信度一直顯著大于其他非 <EOS> token;
  • 以上兩點導致在早期解碼時都會有很大概率解碼出 <EOS> token,模型像是陷入了 <EOS > 的陷阱無法自拔。而分塊解碼由于塊的限制存在,則不會深陷其中。

此外,在將為 AR LLMs 定制的強化學習算法遷移到 MDLM 時,可能會遇到 rollout 軌跡和優化軌跡不一致的問題,因為 AR 模型具有因果性掩碼,獲得完整軌跡后計算得到的 token 概率與 rollout 時保持一致。而 MDLM 采用的是雙向注意力,獲得完整軌跡再計算得到的 token 概率與 rollout 時不一致。而現有的方法是(1)使用 prompt masking 近似的一步優化,或者(2)從 fully masked response 進行一步去噪優化。但是這二者都面臨 rollout 軌跡和實際優化軌跡不一致的問題,可能會引起較大的優化誤差。

基于此,該團隊將以上問題匯總為三個關鍵問題:

  • 解碼陷阱:全擴散解碼容易在早期步驟中過早生成過多的 <EOS>token,導致生成中斷,性能下降。
  • 等間隔解碼步長:根據 token 置信度的變化曲線,等間隔的解碼步長可能不是最優的,因為解碼前期對解碼置信度并不高,而解碼后期很確定。
  • rollout 軌跡和優化軌跡不一致:直接將自回歸模型的強化學習算法遷移至 MDLM 可能會面臨 rollout 軌跡和優化軌跡不一致問題,影響優化效果。

 提出了什么方法?

該團隊提出三大核心貢獻,致力于解決了上述問題:

針對于 <EOS > 陷阱!該團隊提出 <EOS > 早期拒絕機制在解碼早期主動抑制 <EOS> 的置信度,避免生成過早終止。后期逐步恢復 <EOS > 的置信度,確保句子正常結束。顯著提升全擴散式解碼性能,在部分任務上顯著超越半自回歸解碼。

基于「早期置信度低、后期急劇上升」的觀察,前期謹慎解碼,后期大膽解碼,設計冪次遞增解碼步長調度器。將推理步數從 O (L) 降至 O (logL),大幅加速推理過程。

針對 rollout 軌跡和優化軌跡不一致問題,該團隊提出一致性軌跡分組策略優化(CJ-GRPO),在 rollout 過程中存儲每一步解碼的中間狀態,逐步優化相鄰兩個狀態之間的轉變,從而有效緩解跳步優化(或者說是不一致軌跡優化)帶來的誤差,提升訓練穩定性與效果。

但是,由于過長的步數會引入較大的存儲開銷,而結合遞增步長調度器后,既能保證軌跡的一致性,同時能大大縮減中間狀態存儲開銷。于是該團隊結合 <EOS > 早期拒絕機制、遞增步長調度器和 CJ-GRPO 算法,削減訓練時 CJ-GRPO 的中間狀態存儲開銷,同時使得訓練后的模型在少解碼步數推理下甚至能達到 Baseline 方法多解碼步數時的性能 —— 一石三鳥。

模型在少解碼步數 (logL) 時仍能保持可觀的性能(與 L/2 解碼步數性能可比),真正激發擴散語言模型的推理速度優勢的潛能。 訓練時的解碼時間 / 空間復雜度從 O (L) 降至 O (logL),大幅加速訓練過程。

實驗結果

在數學推理(GSM8K、MATH500)和規劃任務(Countdown、Sudoku)上,使用 LLaDA-8B-Instruct 模型進行了廣泛的實驗,結果顯示:

  • 一致性軌跡優化在數學和規劃任務上實現了對 baseline 的全面超越。
  • CJ-GRPO + Semi-AR 在數學類任務上表現尤為突出。
  • CJ-GRPO + EOSER + ASS 在規劃類任務上表現尤為突出,某些 benchmark 的性能提升高達 2–4 倍。
  • 發現規劃任務適合并行推理,數學問題適合順序推理。

  • 在都僅使用 log (L) 步數的情況下,EOSER + ASS 性能仍優于分塊解碼和全擴散式解碼策略。
  • 一致性軌跡優化結合遞增步長調度器和 EOSER 解碼策略,在少步數推理場景下保持良好的競爭力,真正實現「又快又好」。

研究意義與未來展望

本工作探究了擴散語言模型的全擴散式解碼策略,并對其使用更一致的軌跡、更少的解碼步數進行優化,用更少的步數,越快越好地完成更復雜的推理任務,推動擴散語言模型的全擴散式解碼、少步數解碼、強化學習算法的發展。

并行推理 v.s. 順序推理:裝配了并行解碼的 MDLM 在規劃類任務中表現更佳,而數學類任務則更適合半自回歸 / 分塊解碼,這比較符合人類的直觀感受。

未來可探索混合推理模式,結合擴散與自回歸優勢,適應多樣化任務需求。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-11-03 08:40:00

2025-10-14 08:58:00

2025-11-04 01:43:00

循環語言模型架構

2025-05-28 03:30:00

AI人工智能大數據

2024-12-26 16:00:00

英特爾推理模型

2025-08-20 12:38:26

2025-03-17 11:35:36

LLaDALLM大型語言模型

2025-05-27 15:28:11

模型訓練AI

2024-04-26 12:51:48

2025-09-03 10:02:19

2024-06-05 16:22:11

2023-04-13 15:55:00

AI開源

2025-10-17 09:00:00

AI模型代碼

2024-09-10 11:21:30

2025-03-25 09:04:12

2025-09-03 13:59:34

AI模型數據

2025-04-07 08:50:00

模型AI數據

2025-02-17 12:30:00

2025-10-28 08:50:00

AI模型訓練

2025-10-23 08:50:32

點贊
收藏

51CTO技術棧公眾號

国产一区亚洲一区| 欧美~级网站不卡| 精品视频一区三区九区| 亚洲AV无码成人精品一区| 国产 日韩 欧美 精品| 日韩av网站免费在线| 久久99久久亚洲国产| 国精产品一区一区三区免费视频| 欧美一级免费| 日韩欧美在线第一页| 国产高清免费在线| 久草福利在线| 成人深夜在线观看| 国产专区精品视频| 青青国产在线观看| 希岛爱理一区二区三区| 日韩精品在线观看网站| 杨幂一区二区国产精品| 亚洲www啪成人一区二区| 亚洲一区二区精品3399| 在线观看福利一区| 久草视频在线看| 97精品久久久午夜一区二区三区 | 91精品产国品一二三产区| 中文字幕日本乱码精品影院| 欧美高清性xxxxhdvideosex| 狠狠躁夜夜躁av无码中文幕| 韩国成人在线视频| 国产精品扒开腿做爽爽爽视频 | 久久国产精品影院| 亚洲91网站| 欧美区视频在线观看| 欧洲av无码放荡人妇网站| 欧美xxxx免费虐| 亚洲久本草在线中文字幕| 亚洲国产精品一区在线观看不卡 | 欧美交受高潮1| 糖心vlog免费在线观看| 欧美精品一区二区久久| 亚洲日本aⅴ片在线观看香蕉| 挪威xxxx性hd极品| 精品国产午夜肉伦伦影院| 欧美videos大乳护士334| 天天综合成人网| **日韩最新| 欧美日本精品一区二区三区| 五月婷婷之综合激情| 成人开心激情| 欧美日韩中文一区| www.这里只有精品| 九九九精品视频| 欧美日韩国产综合视频在线观看| 在线看的黄色网址| 成人免费在线观看视频| 欧美精品在线视频| 中文字幕亚洲乱码| 亚洲日本中文| 日韩小视频在线观看专区| √天堂资源在线| 日本一区精品视频| 精品国产一二三| 免费日本黄色网址| 日韩精品社区| 亚洲一区二区久久久| 精品无码人妻一区二区免费蜜桃| 国产一区二区在线| 日韩中文字幕网址| 青娱乐免费在线视频| 亚洲精品男同| 国产精品678| 国产又粗又猛又色又| 国产成人啪免费观看软件| 国产一区二区三区四区五区在线| 无码国产伦一区二区三区视频| 91香蕉视频黄| 亚洲aⅴ天堂av在线电影软件| 欧洲日本在线| 亚洲综合免费观看高清在线观看| 热99这里只有精品| 电影久久久久久| 7777精品伊人久久久大香线蕉经典版下载 | 免费观看成人毛片| 男男视频亚洲欧美| 亚洲一区二区三区四区视频| 三级小视频在线观看| 久久精品水蜜桃av综合天堂| 中文字幕第一页亚洲| а√天堂8资源中文在线| 91久久精品一区二区| 91看片破解版| 香蕉久久夜色精品国产使用方法 | 自拍偷拍第9页| 亚洲电影成人| 国产精品欧美一区二区三区奶水| 午夜精品久久久久久久爽| 91在线免费视频观看| 致1999电视剧免费观看策驰影院| 丁香花在线高清完整版视频| 91国产视频在线观看| 国产成人精品一区二区三区在线观看| 日韩美女毛片| 欧美理论片在线观看| 日韩综合在线观看| 粉嫩av一区二区三区| 视频一区二区三| av日韩国产| 欧美高清dvd| 天天躁日日躁aaaa视频| 欧美激情亚洲| 国产日韩欧美中文| 深夜福利视频在线观看| 亚洲午夜在线视频| av在线免费看片| 免费观看不卡av| 久久久亚洲福利精品午夜| 一区二区视频免费观看| 26uuu精品一区二区三区四区在线| ijzzijzzij亚洲大全| 日本精品裸体写真集在线观看| 亚洲第一网站男人都懂| www欧美com| 青草国产精品久久久久久| 精品国产乱码久久久久久久软件| 操你啦视频在线| 欧美日韩黄视频| 一区二区三区在线观看免费视频| 一本色道久久综合亚洲精品不卡 | 久久一本综合| 国产成人精品免高潮费视频| 黄色一级大片在线免费看国产一| ...av二区三区久久精品| 成人亚洲视频在线观看| 亚洲人成亚洲精品| 5252色成人免费视频| 欧美自拍第一页| 亚洲综合一区在线| 国产精品久久久久野外| 亚洲先锋影音| 99精品99久久久久久宅男| 黄色片免费在线观看| 欧美日韩你懂的| 国产三级黄色片| 日韩福利视频导航| 日产精品高清视频免费| 老色鬼在线视频| 国产视频欧美视频| 国产原创视频在线| 国产亚洲欧美日韩在线一区| 国产成人精品无码播放| 怕怕欧美视频免费大全| 日韩女优人人人人射在线视频| 天堂资源中文在线| 色诱亚洲精品久久久久久| 国产成人av一区二区三区不卡| 午夜综合激情| 日本三级中国三级99人妇网站| 美女写真久久影院| 伊人久久男人天堂| 国产精品区在线观看| 亚洲日本在线看| 日本人妻一区二区三区| 日韩视频精品在线观看| 欧美三级网色| 欧美成人一二区| 欧美大尺度在线观看| 天天综合网天天综合| 91久久线看在观草草青青| 中文字幕在线观看二区| 国产一区91精品张津瑜| 男人插女人视频在线观看| 天堂俺去俺来也www久久婷婷| 国产成人综合亚洲| 国产三区在线观看| 亚洲第一福利网| 国产精品自拍第一页| 亚洲视频 欧洲视频| 亚洲精品第二页| 视频一区中文字幕国产| 欧美 日韩 国产 在线观看| 成人另类视频| 国产精品久久激情| sis001亚洲原创区| 中文欧美在线视频| 亚洲精品喷潮一区二区三区| 色综合久久99| 懂色av懂色av粉嫩av| 久久影视一区二区| 亚洲第一天堂久久| 亚洲一区观看| 国产又粗又长又爽视频| 九九在线精品| 99电影网电视剧在线观看| 午夜无码国产理论在线| 欧美激情中文字幕在线| av在线电影免费观看| 亚洲精品在线网站| 一级二级三级视频| 欧美日韩另类在线| 中文乱码字幕高清一区二区| a级精品国产片在线观看| 少妇一级淫免费放| 国产欧美二区| 国产91视频一区| 成人中文在线| 欧美日韩国产精品一卡| 这里视频有精品| 国产精品免费一区豆花| 欧美调教sm| 欧美成人精品影院| 色综合久久影院| 亚洲人成电影在线| 人人妻人人玩人人澡人人爽| 91麻豆精品国产91久久久更新时间| 国产精品视频免费播放| 亚洲综合色噜噜狠狠| 麻豆视频在线免费看| 日本一区二区三区四区| 国产 中文 字幕 日韩 在线| 国产成人精品一区二区三区四区 | 亚洲日本护士毛茸茸| 久久婷婷五月综合| 91看片淫黄大片一级| 怡红院一区二区| 国产成人免费视频网站| 一个色综合久久| 麻豆精品视频在线观看视频| 日本精品一区二区三区四区| 99综合在线| xxxx18hd亚洲hd捆绑| 欧美日韩mv| www.国产亚洲| 综合天堂久久久久久久| 热这里只有精品| 亚洲天堂免费| 日韩一级特黄毛片| 永久亚洲成a人片777777| 伊人色综合久久天天五月婷| 日韩欧美高清在线播放| 亚洲精品乱码久久久久久蜜桃91| 精品国产91| 婷婷亚洲婷婷综合色香五月| jvid福利在线一区二区| 日韩激情久久| 第一会所亚洲原创| 亚洲成人a**址| 日韩精品影视| 中文字幕中文字幕在线中心一区| 婷婷亚洲图片| 米仓穗香在线观看| 888久久久| 国产一级不卡视频| 亚洲福利精品| 97国产在线播放| 羞羞视频在线观看欧美| av无码精品一区二区三区| 日韩和欧美一区二区三区| 久久国产精品国产精品| 国产老肥熟一区二区三区| 美女伦理水蜜桃4| 91伊人久久大香线蕉| 中文字幕5566| 日本一二三四高清不卡| 国产真实乱在线更新| 亚洲精品va在线观看| 天天操天天射天天爽| 一本到不卡免费一区二区| 中文字幕在线播放av| 91精品国产91久久久久久一区二区| www.蜜臀av| 亚洲精品视频免费| 日本中文字幕视频在线| 九九热精品在线| 色戒汤唯在线观看| 国产精品综合网站| 97se亚洲国产一区二区三区| 国语精品免费视频| 精品一级毛片| 国产曰肥老太婆无遮挡| 天堂成人国产精品一区| 岛国av免费在线| 不卡一区中文字幕| 精品国产成人亚洲午夜福利| 国产精品国模大尺度视频| 久久久精品国产sm调教网站| 色综合中文字幕国产| 国产精品午夜福利| 亚洲精品xxx| 蜜桃视频网站在线观看| 97欧美精品一区二区三区| 黄色精品视频| 国产专区一区二区三区| 久久激情电影| 懂色av粉嫩av蜜臀av| 久久成人亚洲| 亚洲天堂2018av| 粉嫩蜜臀av国产精品网站| 国产午夜精品福利视频| 午夜久久久影院| 一区二区三区午夜| 亚洲乱亚洲乱妇无码| 羞羞网站在线看| 国产欧美日韩中文字幕| 小说区图片区色综合区| 黄色一级片av| 男人操女人的视频在线观看欧美| 污片免费在线观看| 亚洲精品菠萝久久久久久久| 中文字幕欧美人妻精品一区蜜臀 | 含羞草www国产在线视频| 欧美在线中文字幕| 福利片在线一区二区| 综合久久国产| 青娱乐精品在线视频| 国产ts丝袜人妖系列视频| 一区二区三区免费网站| 一级全黄裸体免费视频| 亚洲性无码av在线| 中文在线а√天堂| 国产伦精品一区二区| 你懂的视频一区二区| 在线看的黄色网址| 欧美国产日产图区| 久久亚洲精品石原莉奈| 亚洲福利影片在线| 欧美黑人猛交| 99精品欧美一区二区三区| 亚洲精品一区二区在线看| 日本人视频jizz页码69| 国产精品视频yy9299一区| 四虎成人在线观看| 国产视频丨精品|在线观看| 久久影院午夜精品| 精品伊人久久大线蕉色首页| 亚洲黄色大片| 日韩Av无码精品| 亚洲va国产天堂va久久en| 国产小视频免费观看| 欧美激情亚洲一区| 国产精品成人自拍| 国产精品又粗又长| 成人国产精品免费观看视频| 国产精品99无码一区二区| 亚洲福利在线视频| 九色porny丨首页入口在线| 精品一区在线播放| 老鸭窝毛片一区二区三区| 亚洲成人网在线播放| 天天操天天综合网| 男同在线观看| 国产精品极品尤物在线观看| 成人羞羞网站入口| www.国产视频.com| 亚洲欧美日本韩国| 亚洲a视频在线| 性欧美办公室18xxxxhd| 亚洲图片久久| 欧美三级午夜理伦三级富婆| 国产精品久久久久影院色老大| 在线视频欧美亚洲| 欧美日韩999| 欧美福利在线播放网址导航| 成人在线免费在线观看| 国产日韩欧美一区二区三区综合| 中文资源在线播放| 久久国产精品首页| 精品国内亚洲2022精品成人| av观看免费在线| 17c精品麻豆一区二区免费| 亚洲高清视频网站| 国产精品 欧美在线| 亚洲精品二区三区| 久久久久国产精品区片区无码| 在线观看日韩精品| free性欧美hd另类精品| 精品不卡在线| 久久99国产精品麻豆| 久久精品亚洲无码| 亚洲一区999| 香蕉免费一区二区三区在线观看 | 精品一区二区三区免费毛片爱| 69xxx免费| 亚洲精品一线二线三线 | 99九九电视剧免费观看| 国产欧美一级| 国产女人18水真多毛片18精品| 日韩成人激情在线| 电影91久久久| 999香蕉视频| 亚洲免费观看在线观看| 欧美69xxxxx| 97久久夜色精品国产九色 | 永久91嫩草亚洲精品人人| 特大黑人巨人吊xxxx| 欧美精品tushy高清| 新版的欧美在线视频| dy888午夜| 久久精品网站免费观看| 亚洲精品久久久久avwww潮水| 国产九九精品视频| 丝袜脚交一区二区|