精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

舍棄自回歸,離散擴散語言模型如何演化?NUS綜述解構技術圖譜與應用前沿

人工智能 新聞
本綜述系統梳理了離散擴散方向的研究圖譜,呈現了離散擴散語言模型(dLLMs)與離散擴散多模態語言模型(dMLLMs)的理論基礎、代表模型、訓練與推理技術,以及在推理、視覺、生物等多個領域的應用進展。

本論文共同第一作者于潤芃和李奇是新加坡國立大學 xML 實驗室博士生,指導老師為王鑫超,研究方向是多模態大模型與可信深度模型。

本文主要介紹 xML 團隊的論文:Discrete Diffusion in Large Language and Multimodal Models: A Survey。

圖片

  • 論文鏈接:https://arxiv.org/pdf/2506.13759
  • GitHub 倉庫:https://github.com/LiQiiiii/DLLM-Survey

自 GPT 引爆大語言模型熱潮以來,自回歸的大語言模型(LLMs)與多模態模型(MLLMs)已成為智能系統的基石。然而,當人們著眼于更快、更可控、更智能的生成范式時,一條新興路徑悄然浮現:離散擴散(Discrete Diffusion)。

本綜述系統梳理了離散擴散方向的研究圖譜,呈現了離散擴散語言模型(dLLMs)與離散擴散多模態語言模型(dMLLMs)的理論基礎、代表模型、訓練與推理技術,以及在推理、視覺、生物等多個領域的應用進展。

圖片

圖 1 綜述的框架結構與內容

自回歸的局限與離散擴散的崛起

傳統大模型采用自回歸(Autoregressive, AR)架構,其從左至右逐詞生成方式雖然自然,但存在顯著的性能瓶頸:無法并行解碼、難以精確控制輸出、局限于對輸入的靜態感知、對補全和逆向推理的建模能力差。這使其在需要結構化控制與動態感知的復雜場景中表現受限。

離散擴散模型打破了這一范式。它不再逐詞預測,而是將生成視為一個「掩碼 - 去噪」迭代過程,并行處理所有 Token,并借助全局注意力機制實現動態感知。這種設計帶來了三大核心優勢:

  • 推理并行性(Parallel Decoding): 并行推理是離散擴散模型最大的特點和優勢。并行推理使得離散擴散每次迭代都可以解碼出多個 Token,從而帶來解碼速度上的提升。
  • 輸出可控性(Controllability)與補全能力(Infilling): 掩碼 - 去噪的解碼機制,使得每一次回答都可以預設回答的長度、格式、結構,為回答設定一個模板。
  • 動態感知能力(Dynamic Perception): 全局注意力機制下模型對左側 Token 的處理受到右側 Token 的影響;多輪迭代的解碼機制使得對所有 Token 的處理都可以反復多次進行。這使得 dLLM 和 dMLLM 可以對長語料和多模態輸入進行多輪、有條件的動態感知,而不是如單向注意力一樣僅僅能夠感知一次。

圖片

圖 2 自回歸模型與典型離散擴散模型的對比

離散擴散語言模型的數理基礎

D3PM(Discrete Denoising Diffusion Probabilistic Models)框架是眾多離散擴散數理模型的起點。D3PM 給出了在離散時間上、離散狀態空間中的馬爾可夫模型。整個模型由兩個對偶過程構成:前向擴散過程和反向去噪過程。

在前向過程中,原始序列圖片被逐步擾動為噪聲表示圖片,其轉移機制由一系列時間依賴的轉移矩陣圖片控制,不同形式的圖片對應不同的擴散行為。例如,均勻(Uniform)轉移會將 Token 等概率擾亂;吸收態(Absorbing)轉移則將所有 Token 都映射至特定的 [MASK] Token。因此,使用吸收態轉移的擴散過程也被稱為 Masked Diffusion,是當前 dLLM 和 dMLLM 中使用最多的一類。此外,還有基于嵌入相似度的擴散矩陣、帶狀(band-diagonal)或離散高斯轉移等,增強模型在語義空間或局部結構中的建模能力。

反向過程則學習如何一步步去噪,還原出高質量文本。常見的圖片,通過一個神經網絡圖片來預測原始 Token 的概率分布,再結合前向轉移概率,從而構造出反向轉移概率圖片。訓練時的損失函數由變分下界(ELBO)導出。在 Masked Diffusion 框架下,損失函數還可以被化簡成加權的 Masked Language Modeling 損失。

在 D3PM 的基礎上,連續時間擴散模型將離散時間步泛化為連續時間步,構建了在連續時間上 離散狀態空間的馬爾可夫過程,通過引入速率矩陣圖片來建模任意時刻的狀態躍遷。Concrete Score 模型將反向過程的轉移速率矩陣圖片拆解為前向速率矩陣圖片和聯合概率比 c 的乘積,通過 Score Matching、基于 Bregman 散度的 Score Entropy 等損失函數來學習概率比 c。 Discrete Flow Matching 將流匹配思想引入到離散空間,在給定源目標分布和噪聲分布之間,構造連續變化的概率路徑。訓練過程通過定義 Token 級速度場來驅動序列生成,配合交叉熵損失優化。

離散擴散語言模型生態概覽

圖片

圖 3 離散擴散模型的發展歷程

隨著離散擴散語言模型(dLLMs)快速崛起,近年來該領域涌現出一系列代表性模型。從早期探索性的輕量模型,到近期可比肩自回歸 LLM 的離散擴散大模型,再到多模態與統一建模范式的拓展,離散擴散正逐漸演化為一條獨立而完整的技術路徑。綜述將當前模型生態大致劃分為以下四類:

1. 輕量級模型:早期的離散擴散模型參數量往往不超過 1B,代表作包括 D3PM、DiffusionBERT、RDM、Diffusion-NAT、TESS、SEDD、MDLM、MD4 等。這些模型重點在于探索基礎的建模機制與去噪策略,驗證離散擴散在文本和多模態生成任務上的可行性。

2. 大規模 dLLM:隨著技術成熟,多個工作開始將擴散架構拓展至 10 億以上參數量,構建具備完整語言理解與生成能力的「非自回歸大模型」,代表模型包括:LLaDA 系列、DiffuGPT / DiffuLLaMA 和 DREAM 等。這些工作從規模上拓展了擴散語言模型的邊界,系統性地探索了其工程可行性。

3. 多模態擴展(dMLLM):在語言能力日趨完善之后,研究者開始探索 dLLMs 在多模態任務中的適應性,典型代表有:Dimple、LaViDa 和 LLaDA-V。

4. 統一生成模型:離散擴散在圖片生成中的可行性很早就被驗證了,隨著語言生成能力的完善,MMaDA、FUDOKI 和 Muddit 等模型給出了一種統一的架構,使用離散擴散模型在一個神經網絡中同時建模文本和視覺的生成。

訓練與推理技術

方興未艾的 dLLM 與 dMLLM 正在不斷演進,伴隨而來的還有訓練與推理技術的持續創新。本綜述系統地梳理并歸納了已有模型中采用的核心方法,同時也在不斷收錄和更新該領域的最新進展。

訓練技術

離散擴散模型在訓練過程中面臨一系列獨特挑戰,包括語料利用率低、生成長度偏差(length bias)、隨機時間采樣帶來的監督信號覆蓋率低等。為解決這些問題,研究人員提出了多種創新性的訓練機制。綜述中主要歸納了以下幾類:

  • 初始化機制:使用已經訓練好的 BERT 模型或者 AR 模型作為訓練起點,或者對模型首先進行 AR 訓練再進行擴散訓練。典型的模型包括 DiffuLLaMA、DiffuGPT 和 Dimple 。這一類初始化技術化能夠加速訓練過程,保證模型性能,在資源受限的訓練時效果顯著。
  • 互補掩碼策略(Complementary Masking):為提升語料使用效率,構造一對互補的掩碼樣本,兩次掩碼的位置互斥,但是拼起來可以使所有 Token 都被覆蓋,從而解決信息利用稀疏問題。典型的模型包括 LaViDa 和 DiffuCoder。
  • 掩碼調度(Masking Scheduling)函數:掩碼調度函數決定了訓練過程中各個時間步上掩碼比例的大小。在訓練過程中既可以為所有的 Token 設置統一的調度函數,也可以針對各個 Token 設置不同的調度函數。在線性調度函數下,掩碼比例隨時間線性變化,使每一步加噪的 Token 數量大致相同。在凸(convex)調度函數下,掩碼函數斜率的絕對值先大后小,在時間步不大時就能夠掩碼大量的 Token,從而使得模型訓練時能夠接觸到更 noisy 的樣本,也鼓勵推理時從慢到快,每一步解碼出來的 Token 數量先少后多。
  • 重加權策略(Reweighting):對不同 Token 處的損失函數值進行調整,強化對特定 Token 的學習。比如,MGDM 提升損失函數大的 Token 的權重,提升對困難位置的關注,加速收斂。
  • 知識蒸餾(Distillation): 通過知識蒸餾實現對推理步數的壓縮,將多步的「教師模型」知識傳遞給步數更少的「學生模型」。

這些技術從訓練目標、數據使用到網絡初始化等方面優化了擴散訓練流程,使 dLLMs 得以在更大規模、更復雜任務上保持穩定、有效的訓練表現。

圖片

圖 4 幾種掩碼調度函數

推理技術

dLLMs 和 dMLLMs 的推理過程中的每一步都會對所有的 token 進行并行的同步預測,之后基于特定的規則來決定要保留哪些位置的預測。為兼顧生成質量與效率,研究人員提出了一系列推理技術。綜述中主要歸納了以下幾類:

  • Unmasking 策略決定「什么時候生成什么」。推理中每輪只會保留對部分 Token 的預測,Unmasking 策略負責決定解哪里、解多少。解碼的位置既可以是隨機選取,也可以是度量驅動(Metric-based),根據模型置信度、負熵等指標優先解碼「最確定」的位置。每一步解碼的 Token 數量可以設置為固定值,也可以根據訓練時的調度函數計算得到。如果使用了度量驅動的解碼策略,還可以使用 Confident Decoding 算法,通過閾值動態調整每一步解碼出來的 Token 數量。
  • Remasking 技術實現「修正」,解決吸收態擴散模型「寫完不能改」的局限。Remasking 允許將已經解碼出來的 Token 再次設置為 [Mask],從而對回答進行修改,實現 Test-Time-Scaling。
  • 緩存機制(Caching):AR 框架下的 Prefilling 和 KV-Cache 機制也被引入了 dLLM 和 dMLLM 中,通過緩存注意力計算的中間結果,并選擇性動態更新,以加速生成。
  • Guidance 技術:類比于連續擴散模型中的 Guidance 機制,Classifier-Free Guidance、Reward Guidance、Energy-Based Guidance 等技術也被應用在離散擴散模型中,實現對模型輸出的定向調整。

這些推理技術不僅提升了生成效率,更賦予了 dLLMs 修正和控制的能力,逐步構建出具備實用價值的非自回歸語言推理范式。

圖片

圖 5 對 Unmasking 策略的展示

結語

除了以上內容,綜述中也介紹了 dLLM 和 dMLLM 在生物、視覺、推理等方面的應用,探討了其未來可能的發展方向。

隨著大語言模型不斷拓展其邊界,離散擴散模型(dLLMs 與 dMLLMs)為傳統自回歸范式提供了強有力的替代路徑。并行解碼、結構控制與動態感知等優勢使它們突破了自回歸模型在效率與控制性上的瓶頸。從基礎理論到工程優化,再到多模態與跨領域應用,離散擴散范式正在逐步走向成熟。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-26 12:51:48

2024-08-05 14:36:17

大型語言模型量化

2025-07-10 14:54:13

AI模型圖像生成

2025-05-27 15:35:02

大模型技術AI

2024-03-07 12:31:29

AI技術

2025-08-12 09:08:00

2025-06-11 09:21:28

2024-10-10 08:33:06

2023-07-04 10:28:15

模型論文

2025-03-17 08:25:00

模型AI訓練

2024-03-11 09:37:01

模型圖片編輯

2024-06-05 16:22:11

2025-05-27 15:28:11

模型訓練AI

2025-02-27 13:45:00

2025-03-25 09:04:12

2024-11-12 13:10:49

2022-09-13 14:54:08

模型AI

2023-11-17 08:46:26

2024-12-23 13:30:00

2024-05-10 07:58:03

點贊
收藏

51CTO技術棧公眾號

污的网站在线观看| 中文文字幕一区二区三三| 超碰成人免费| 亚洲午夜久久久| 欧美精品一区二区三区久久| 亚洲无码久久久久久久| 合欧美一区二区三区| 亚洲国产欧美一区二区三区同亚洲| www插插插无码免费视频网站| 色婷婷av一区二区三| 欧美一级一区| 久久夜色精品国产亚洲aⅴ| 亚洲少妇中文字幕| 韩国成人在线| 亚洲国产综合色| 亚洲一区在线免费| 香蕉人妻av久久久久天天| 免费高清视频精品| 97精品伊人久久久大香线蕉| 永久免费av无码网站性色av| 9l视频自拍九色9l视频成人| 欧美综合亚洲图片综合区| 日韩亚洲欧美一区二区| 国产69精品久久app免费版| 国产一区激情在线| 国产成+人+综合+亚洲欧洲 | 免费黄色成人| 精品国产91九色蝌蚪| 成年网站免费在线观看| 自拍偷拍亚洲视频| 亚洲国产日日夜夜| 中文字幕第50页| av片在线免费观看| 久久精品一区二区三区不卡| 国产伦精品一区二区三区免| 国产乱色精品成人免费视频| 男男视频亚洲欧美| 日本成人在线视频网址| 日本一区二区欧美| 午夜视频精品| 久久这里有精品| 日本裸体美女视频| 欧美熟乱15p| 亚洲天堂男人天堂女人天堂| jlzzjizz在线播放观看| 538任你躁精品视频网免费| 欧美日韩精品一区二区三区| 精品免费国产一区二区| 午夜伦理福利在线| 五月天丁香久久| 奇米影视亚洲色图| 波多野结衣在线高清| 亚洲国产人成综合网站| 日韩欧美猛交xxxxx无码| 黄色网在线免费看| 亚洲人成网站精品片在线观看| 日韩高清av| 成人亚洲综合天堂| 欧美国产精品一区二区三区| 欧美日韩电影一区二区三区| 久草在线网址| 久久久精品免费观看| 欧美日韩国产不卡在线看| 日本一区高清| 久久久蜜桃精品| 好吊色欧美一区二区三区四区 | 亚洲天堂视频网站| 夜夜嗨网站十八久久| 91精品国产99久久久久久| 免费日韩一级片| 爽爽淫人综合网网站| 国产精品电影久久久久电影网| 无码人妻aⅴ一区二区三区有奶水| 久久蜜桃精品| 国产欧美最新羞羞视频在线观看| 国产精品呻吟久久| 福利视频网站一区二区三区| 国产亚洲欧美另类一区二区三区| 先锋av资源站| 欧美极品xxx| 美女黄色片网站| 国产不卡123| 91九色02白丝porn| 国产一区二区在线观看免费视频| 日本亚洲视频| 国产婷婷成人久久av免费高清| 国精产品一区二区三区| 99成人超碰| 久久久久久久成人| 国产午夜无码视频在线观看 | 色悠悠在线视频| 日韩高清三区| 精品精品国产国产自在线| 青青草手机视频在线观看| 免费视频一区| 亚洲精品欧美日韩专区| 无套内谢的新婚少妇国语播放| 国产欧美一区视频| 欧美a级免费视频| 欧美大片免费高清观看| 91麻豆精品国产91久久久资源速度 | 亚洲免费视频二区| 国产成人亚洲综合色影视| 鲁片一区二区三区| 高清全集视频免费在线| 狠狠色狠狠色综合日日小说| 99re精彩视频| 香蕉久久99| 欧美丰满少妇xxxxx| 波多野结衣高清视频| 国产高清不卡一区二区| 日韩欧美手机在线| 色屁屁www国产馆在线观看| 日本韩国一区二区三区视频| 日本wwww色| 日韩理论电影| 青青草原一区二区| 成人免费公开视频| 亚洲精品免费电影| 国产超碰在线播放| 日韩在线你懂的| 欧美激情免费看| 一级特黄aaa| 国产三级久久久| 国产在线精品91| 北条麻妃一区二区三区在线观看 | 日韩一级大片在线观看| 蜜桃传媒一区二区亚洲| 一区二区三区国产在线| 成人av免费在线看| 国产精品扒开做爽爽爽的视频| 色综合久久久久网| 色天使在线视频| 狠狠色丁香久久综合频道| 成人福利网站在线观看11| 国产精品麻豆一区二区三区| 欧美日韩国产精品专区| 欧美激情 亚洲| 欧美日韩亚洲一区| 亚洲一区二区三区乱码aⅴ| 中文字幕日本在线观看| 欧美三级三级三级爽爽爽| 香蕉视频黄色在线观看| 国产日韩高清一区二区三区在线| 国产精品免费一区二区三区观看| 大地资源网3页在线观看| 欧美日韩视频在线一区二区| 日本欧美一区二区三区不卡视频| 巨乳诱惑日韩免费av| 免费在线成人av电影| 黑森林国产精品av| 亚洲精品理论电影| 毛片视频网站在线观看| 91啪亚洲精品| 亚洲人成无码www久久久| 精品毛片免费观看| 国产精品盗摄久久久| 中文日本在线观看| 欧美另类久久久品| 国产美女福利视频| 国产精品18久久久久| 男人天堂手机在线视频| 日韩大胆成人| 国产精品高潮视频| 免费在线毛片网站| 欧美一区二区视频在线观看| 久草视频免费在线播放| 菠萝蜜视频在线观看一区| 日韩免费一级视频| 国产成人1区| 国产伦精品免费视频| 黄网页免费在线观看| 欧美大胆人体bbbb| 日韩精品手机在线| 中文字幕欧美区| 国内av一区二区| 亚洲网站视频| 欧美一区二区三区电影在线观看| 国产精品久久久久久妇女| 久久久精品美女| 天天操天天干天天爱| 色婷婷av一区二区三区大白胸| 丰满的亚洲女人毛茸茸| 国产成人av一区| 日本三级免费网站| 99久久婷婷| 极品日韩久久| 久久女人天堂| 97久久精品人人澡人人爽缅北| 黄色av网站在线看| 日韩一区二区影院| 丁香社区五月天| 亚洲女同一区二区| 成人手机在线免费视频| 久久www免费人成看片高清| 免费毛片网站在线观看| 青青草国产成人a∨下载安卓| 97久草视频| 日韩精选视频| 国a精品视频大全| 日韩成人影视| 国产视频精品在线| 国产黄色高清视频| 91黄色小视频| 日操夜操天天操| 日韩一区在线播放| 欧美成人午夜精品免费| 国产精品影视在线| 狠狠躁狠狠躁视频专区| 一本久道久久综合婷婷鲸鱼| 国产精品亚洲天堂| 国产精品欧美日韩一区| 波多野结衣精品久久| 久久久加勒比| 国产成人欧美在线观看| 都市激情国产精品| 大胆欧美人体视频| www.亚洲免费| 亚洲另类图片色| 欧美一级做性受免费大片免费| 欧美日韩性生活| 波多野结衣视频网址| 精品高清一区二区三区| 久久99久久久| 亚洲私人影院在线观看| 一区二区三区在线观看免费视频| 99久久精品国产毛片| 国产调教打屁股xxxx网站| 久久精品国产99久久6| 激情视频综合网| 亚洲自啪免费| 欧美 国产 综合| 亚洲欧洲另类| 9色porny| 在线播放不卡| 福利视频免费在线观看| 66国产精品| 大桥未久一区二区| 天天久久综合| 中文字幕一区二区三区四区五区人| 精品国精品国产自在久国产应用| 欧美下载看逼逼| 亚洲精品国模| 欧美日韩一区在线播放 | 亚洲欧美精品| 成人亚洲一区二区| 亚洲精品乱码久久久久久蜜桃91 | 美女网站免费观看视频| 亚洲欧美视频| 日日碰狠狠躁久久躁婷婷| 久久福利毛片| 中文字幕一区二区三区四区在线视频| 石原莉奈一区二区三区在线观看| 欧美亚洲日本在线观看| 日本aⅴ精品一区二区三区| 午夜免费福利在线| 蜜臀av一级做a爰片久久| jizz欧美性11| 国产精品正在播放| 中国特级黄色大片| 99精品欧美一区二区三区小说| 亚洲中文字幕无码av| 97久久人人超碰| 亚洲熟妇一区二区三区| 日本一区二区免费在线观看视频| 久久一级免费视频| 亚洲三级电影网站| 久久在线视频精品| 天天色综合成人网| 午夜视频网站在线观看| 欧美日韩久久一区| 精品人妻一区二区三区日产乱码 | 91小视频xxxx网站在线| 欧美黑人又粗大| 中文字幕在线视频网站| 国产精品丝袜视频| 日韩精品一区二区三区中文 | 日色在线视频| 亚洲夜晚福利在线观看| 麻豆视频在线观看免费网站| 欧美激情在线一区| 台湾佬成人网| 亚洲自拍欧美色图| 日韩深夜福利| 在线免费一区| 99精品热视频只有精品10| 日本va中文字幕| 国产99久久久久久免费看农村| 国产ts丝袜人妖系列视频| 国产精品久久久久久一区二区三区| 欧美日韩在线观看免费| 欧美午夜片欧美片在线观看| 97超碰资源站| 国产丝袜精品视频| 成人区精品一区二区不卡| 欧美亚洲第一区| 99国内精品久久久久| 久久九九视频| 欧美精品首页| 日本久久久久久久久久久久| 懂色av噜噜一区二区三区av| 性猛交ⅹxxx富婆video| 亚洲综合在线视频| 中文字幕人妻一区二区在线视频| 日韩免费看网站| 在线观看国产原创自拍视频| 午夜美女久久久久爽久久| 91精品福利观看| 日本一区二区三区视频免费看| 影音先锋久久| 国产三级生活片| 久久精品视频免费| 国产大片中文字幕| 91精品国产手机| aaa在线观看| 国产成人精品av| 国产成人福利av| 欧美美女黄色网| 麻豆成人91精品二区三区| 国产精品无码久久久久一区二区| 一区二区三区四区乱视频| 一二三区在线播放| 国产一区二区三区高清在线观看| 国产福利电影在线播放| 99re视频在线播放| 香蕉视频国产精品| 日本超碰在线观看| 欧美国产欧美亚州国产日韩mv天天看完整| 日韩精品久久久久久久| 欧美成人乱码一区二区三区| 国产在线观看a视频| 成人h猎奇视频网站| 日韩欧美精品| 另类小说第一页| 中文字幕成人在线观看| 日韩一级片中文字幕| 亚洲男人天堂网站| 周于希免费高清在线观看| 国产一区自拍视频| 亚洲伦伦在线| 在线视频 日韩| 激情成人中文字幕| 四虎永久在线精品免费网址| 国模私拍一区二区三区| 永久免费精品视频| 国产乱子伦精品视频| 国产精品香蕉一区二区三区| 欧美成人一二三区| 欧美电影免费提供在线观看| 午夜小视频福利在线观看| 99视频免费观看蜜桃视频| 午夜日本精品| 国产原创剧情av| 欧美日韩国产精品| 男人天堂亚洲二区| 国产经典一区二区| 99成人在线视频| 宇都宫紫苑在线播放| 亚洲午夜精品久久久久久久久| 人妻少妇精品无码专区久久| 91精品国产成人| 精品免费av| 成人亚洲免费视频| 一区二区三区精品视频在线| 黄色aaa大片| 欧美亚洲成人精品| 色综合五月天| 女同性αv亚洲女同志| 亚洲大片一区二区三区| 青青免费在线视频| 国产日韩专区在线| 欧美精品一卡| 亚洲国产欧美视频| 欧美日本韩国一区二区三区视频| 黄网站免费在线播放| 国精产品一区二区| 视频在线观看国产精品| 永久免费观看片现看| 日韩欧美专区在线| 日韩激情电影免费看| 亚洲区一区二区三区| 国产精品白丝jk黑袜喷水| 日韩在线观看第一页| 最近2019中文字幕mv免费看 | 国产一区二区美女视频| 亚洲三级在线| www黄色日本| 中文字幕一区二区在线观看| 亚洲第一天堂影院| 国产精彩精品视频| 国产一区激情| 欧美a在线播放| 精品成人私密视频| 岛国精品在线| 香港三级韩国三级日本三级| 国产精品久久三区| 午夜成人免费影院| 91免费在线视频网站| 久久久久久久高潮| 青娱乐av在线|