精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開源擴散大模型首次跑贏自回歸!上交大聯(lián)手UCSD推出D2F,吞吐量達LLaMA3的2.5倍

人工智能 新聞
上海交通大學(xué) DENG Lab 聯(lián)合加州大學(xué)圣地亞哥分校(UCSD)推出 Discrete Diffusion Forcing(D2F),首次使開源 dLLMs 的生成速度顯著超過同等規(guī)模的 AR 模型。

視頻 1:D2F dLLMs 與同尺寸 AR LLMs 的推理過程對比示意

在大語言模型(LLMs)領(lǐng)域,自回歸(AR)范式長期占據(jù)主導(dǎo)地位,但其逐 token 生成也帶來了固有的推理效率瓶頸。此前,谷歌的 Gemini Diffusion 和字節(jié)的 Seed Diffusion 以每秒千余 Tokens 的驚人吞吐量,向業(yè)界展現(xiàn)了擴散大語言模型(dLLMs)在推理速度上的巨大潛力。然而,當(dāng)前的開源 dLLMs 卻因一定的技術(shù)挑戰(zhàn) —— 例如缺少完善的 KV 緩存機制,以及未充分釋放并行潛力 —— 推理速度遠慢于同規(guī)模的 AR 模型。

近期的一篇工作徹底扭轉(zhuǎn)了這個局面。上海交通大學(xué) DENG Lab 聯(lián)合加州大學(xué)圣地亞哥分校(UCSD)推出 Discrete Diffusion Forcing(D2F),首次使開源 dLLMs 的生成速度顯著超過同等規(guī)模的 AR 模型。實驗顯示,D2F 模型在 GSM8K 等基準(zhǔn)上,實現(xiàn)了相比 LLaMA3 等主流 AR 模型高達 2.5 倍的吞吐量提升,同時相比于原始的 dLLMs 模型實現(xiàn)了最高達 50 倍的加速

本文作者團隊來自上海交通大學(xué) DENG Lab 與加州大學(xué)圣地亞哥分校(UCSD)。該研究由碩士生王旭、準(zhǔn)碩士生徐晨開、本科生金義杰以及博士生金佳純共同完成,指導(dǎo)教師為鄧志杰與張浩老師。DENG Lab 隸屬上海交通大學(xué),致力于高效、跨模態(tài)生成模型的研究。

  • 論文地址:https://arxiv.org/abs/2508.09192 
  • 代碼地址:https://github.com/zhijie-group/Discrete-Diffusion-Forcing 
  • 項目主頁:https://zhijie-group.github.io/Discrete-Diffusion-Forcing/
  • 模型倉庫:https://huggingface.co/SJTU-Deng-Lab/D2F_Dream_Base_7B_Lora, https://huggingface.co/SJTU-Deng-Lab/D2F_LLaDA_Instruct_8B_Lora 
  • Demo 地址:https://huggingface.co/spaces/zhijie3/D2F-LLaDA-Instruct-8B

圖 1:D2F dLLMs 實現(xiàn)了相比 LLaMA3 等主流 AR 模型高達 2.5 倍的吞吐量提升

簡單來說,D2F 賦予了 dLLMs 幾種關(guān)鍵特性:

1.  自回歸 - 擴散混合架構(gòu):引入塊級自回歸生成,塊間保持因果性,讓模型能夠有效利用 KV 緩存。

2.  塊內(nèi) + 塊間雙尺度并行:引入了塊內(nèi) token 間并行解碼和塊間并行解碼,最大化并行生成潛力

3.  雙狀態(tài)解碼:通過設(shè)計雙狀態(tài)的塊解碼流水線,最大化吞吐量。

4.  更優(yōu)的 tradeoff:相比原始 dLLMs,具有顯著更優(yōu)的性能 - 效率權(quán)衡

5.  vLLM 集成:已將 vLLM 集成到 D2F 中,讓推理速度更進一步

問題的根源:dLLMs 理論優(yōu)勢與現(xiàn)實瓶頸

擴散大語言模型(dLLMs)理論上具有并行生成 token 的能力,不必像 AR 模型一樣逐個生成,從而在推理效率上具備巨大潛力。然而,在實踐中,現(xiàn)有的開源 dLLMs 并未充分展現(xiàn)這一優(yōu)勢,其推理速度往往落后于 AR 模型,這個瓶頸主要源于兩個基礎(chǔ)性問題:

KV Cache 的不兼容性:標(biāo)準(zhǔn) dLLM 依賴雙向注意力機制來獲取全局上下文,導(dǎo)致 AR 模型中常見的 KV 緩存加速技術(shù)無法直接應(yīng)用于 dLLMs。在每次去噪迭代中,模型都需要重新計算所有 token 的 K、V 矩陣,造成了巨大的計算冗余。

塊間解碼的串行限制:為了引入緩存機制,一些工作嘗試將生成過程分塊(block-wise)。但這些方法通常要求嚴格的塊間順序,即只有前一個塊必須被完全解碼后,才能開始處理下一個塊。這種嚴格的依賴使得并行生成僅限于塊內(nèi)而無法應(yīng)用于塊之間,極大地限制了整體的并行潛力。

因此,想要釋放 dLLMs 的潛力,就必須同時解決 KV Cache 的兼容性與塊間的并行解碼問題。

D2F 的核心設(shè)計:一種自回歸 - 擴散混合范式

面對上述瓶頸,D2F 的核心思想是構(gòu)建一個融合自回歸和擴散思想的混合范式,協(xié)同設(shè)計高效的模型架構(gòu),訓(xùn)練方法以及推理策略。

架構(gòu):塊級因果注意力,兼容 KV Cache

為了讓 dLLMs 能真正兼容 KV 緩存,D2F 將 dLLMs 中標(biāo)準(zhǔn)的雙向注意力機制重塑為了塊級因果注意力。具體來說:

  • 塊內(nèi)(Intra-block):保持標(biāo)準(zhǔn)的雙向注意力,以充分利用塊內(nèi)的上下文信息。
  • 塊間(Inter-block):使用因果注意力,即任意一個塊只能關(guān)注其自身及所有在它之前的塊。

這種設(shè)計在塊的層面上建立了自回歸的順序。每個生成完成的塊的 KV 狀態(tài)被緩存并在后續(xù)復(fù)用,從而根本上解決了 KV Cache 的兼容性問題,大幅減少了冗余計算。

訓(xùn)練:非對稱蒸餾與結(jié)構(gòu)化噪聲

圖 2:D2F dLLMs 基于非對稱蒸餾實現(xiàn)訓(xùn)練

為了避免從頭訓(xùn)練 dLLMs 的高昂成本。D2F 使用了非對稱蒸餾策略,將一個預(yù)訓(xùn)練好的 dLLMs 教師模型的能力,高效地蒸餾到 D2F 學(xué)生模型上。兩者區(qū)別在于教師模型使用雙向全注意力而學(xué)生模型使用塊級因果注意力。

為了進一步解鎖學(xué)生的塊間并行能力,D2F 引入了單調(diào)遞增的結(jié)構(gòu)化噪聲調(diào)度。具體而言,訓(xùn)練數(shù)據(jù)前向加噪過程中,序列靠前的塊被施加較小的噪聲而靠后的塊被施加更大的噪聲。這種結(jié)構(gòu)化的噪聲訓(xùn)練,其目的是為了教會學(xué)生模型如何依據(jù)部分去噪、尚不清晰的前文來預(yù)測后文。

推理:流水線并行解碼

圖 3:D2F dLLMs 的推理流程示意

在上述訓(xùn)練范式的基礎(chǔ)上,D2F 設(shè)計了一套創(chuàng)新的并行解碼算法:Pipelined Parallel Decoding。

該算法維護一個動態(tài)的待解碼窗口,其中包括若干 tokens 塊。在必要時,新塊以半激活的狀態(tài)進入窗口,并在前綴去噪到一定比例后轉(zhuǎn)為全激活狀態(tài)。這種動態(tài)添加和雙狀態(tài)解碼的機制,確保了流水線的高效和質(zhì)量。

兩種狀態(tài)的區(qū)別主要在于解碼策略的激進程度:

  • 半激活狀態(tài)(Semi-activated):只接受那些預(yù)測置信度超過某一閾值 τ_conf 的 token。
  • 全激活狀態(tài)(Fully-activated):如果沒有 token 超過置信度閾值,也會選擇置信度最高的一個 token 進行解碼。

視頻 2:D2F dLLMs 推理過程中顯式地對多個塊進行并行解碼

實驗結(jié)果

速度提升,性能不降

D2F 給原始 dLLM 帶來了最高可達 50 倍的加速,同時平均性能不下降。

圖 4:D2F-LLaDA 與基線方法的對比

圖 5:D2F-Dream 與基線方法的對比

優(yōu)異的性能 - 效率權(quán)衡曲線

D2F 提供了一條遠優(yōu)于現(xiàn)有模型的性能 - 效率權(quán)衡曲線。通過調(diào)整解碼參數(shù),D2F 可以適應(yīng)各種場景,在性能和速度之間做出靈活的選擇。例如,在 MBPP 任務(wù)上,通過稍微犧牲性能,吞吐量可達 AR 模型的 4 倍以上。

圖 6:D2F dLLMs 實現(xiàn)更優(yōu)異的優(yōu)異的性能 - 效率權(quán)衡

總結(jié)與思考

D2F 的出現(xiàn)為開源 dLLMs 社區(qū)注入了新的活力,展現(xiàn)了 dLLMs 推理速度上的巨大潛力。通過開源代碼和模型,團隊希望能夠激勵社區(qū)投入更多的研究資源,共同推動并行解碼技術(shù)走向成熟,進入更廣泛的實際應(yīng)用。

此外,D2F 的成功證明了 AR 和 Diffusion 并非是兩種完全對立的范式。通過巧妙的混合框架設(shè)計,可以融合 AR 模型的緩存優(yōu)勢和 dLLMs 的并行優(yōu)勢,這為大模型推理優(yōu)化開辟了新的道路。

未來工作:目前 vLLM 的 Async Engine (for realtime serving), CUDA Graph Capture support, optimized Kernels, hybrid parallel (DP + TP + PP) 都有待實現(xiàn),歡迎感興趣的同學(xué)跟我們聯(lián)系。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2024-11-02 10:28:03

2025-10-27 09:06:00

2024-11-01 20:25:28

2025-05-27 15:28:11

模型訓(xùn)練AI

2024-04-30 08:28:44

開源大模型Llama

2024-12-27 13:59:33

數(shù)據(jù)訓(xùn)練模型

2024-11-01 13:30:56

2025-07-10 14:54:13

AI模型圖像生成

2024-04-26 07:48:45

DockerLLama3模型

2025-04-21 08:20:00

視覺模型訓(xùn)練

2025-07-30 08:40:00

AI編程模型

2025-08-19 09:14:44

2025-03-20 09:00:00

2023-12-07 06:51:18

AI模型

2024-04-26 12:51:48

2010-08-23 10:16:09

2025-04-09 10:40:32

2011-09-13 10:05:43

無線技術(shù)網(wǎng)絡(luò)

2025-07-22 10:40:00

點贊
收藏

51CTO技術(shù)棧公眾號

久久婷婷色综合| 国产大片一区| 欧美视频二区36p| 鲁丝片一区二区三区| 欧美激情一区二区三区免费观看| 成人毛片在线| 日韩三级在线观看| 久久精品午夜福利| 麻豆视频网站在线观看| 成人一级片在线观看| 国产成人一区二区三区电影| www.av免费| 亚洲宅男网av| 日韩美女一区二区三区| 日韩 欧美 高清| 性欧美高清come| 久久亚洲影视婷婷| 亚洲影院色无极综合| 波多野结衣视频网站| 91国语精品自产拍| 亚洲色图国产精品| 欧洲成人午夜精品无码区久久| 亚洲精品一级二级| 亚洲综合久久久| 亚洲综合av一区| 男人天堂综合| av在线不卡观看免费观看| 成人av在线天堂| japanese国产在线观看| 日韩午夜激情| 色综合久久天天综线观看| 中国女人特级毛片| 秋霞在线一区| 欧美大片顶级少妇| 激情五月婷婷基地| 日韩另类视频| 色综合久久中文字幕| 欧美视频在线观看视频| av软件在线观看| 成人欧美一区二区三区视频网页 | 可以免费在线观看的av| 中文字幕午夜精品一区二区三区| 在线精品国产成人综合| 精品久久久久久中文字幕人妻最新| 麻豆一二三区精品蜜桃| 欧美区视频在线观看| 超碰在线公开97| 欧美一级大片| 在线视频中文字幕一区二区| www黄色av| 激情都市亚洲| 色欧美88888久久久久久影院| 欧美亚洲一二三区| av老司机免费在线| 午夜一区二区三区视频| 真人抽搐一进一出视频| 免费在线中文字幕| 亚洲国产视频一区| 欧美久久久久久久久久久久久| 精品伦精品一区二区三区视频密桃 | 日韩一区亚洲二区| 尤物99国产成人精品视频| 无码人妻精品一区二区三区温州 | 国产午夜免费视频| 午夜精品久久| 国内精品久久久久久久久| 久青草视频在线观看| 成人福利av| 亚洲国产毛片aaaaa无费看| 久久久久久久9| heyzo在线欧美播放| 婷婷综合另类小说色区| 国产极品尤物在线| 日本免费久久| 欧美精品久久99久久在免费线 | 一区二区视频免费| 精品综合免费视频观看| 99re6在线| 网站黄在线观看| 国产婷婷一区二区| 亚洲精品无人区| 国产黄网站在线观看| 一区二区三区四区不卡视频 | 日韩激情在线观看| 日韩av片永久免费网站| 看黄色一级大片| 国产一区二区三区四| 国产精品久久7| 三级在线观看| 亚洲欧洲成人精品av97| 国产中文字幕乱人伦在线观看| 伊人久久av| 5566中文字幕一区二区电影 | 国产精品久久久久久久一区二区| 国产精品一区在线| 久久久久久久久一区| eeuss影院在线观看| 亚洲精品亚洲人成人网| 久久久久久久中文| 国产人妖一区| 精品国产免费人成电影在线观看四季| 法国伦理少妇愉情| 国产精品久久久久无码av| 亚洲3p在线观看| 91成品人影院| 91麻豆精品视频| 久久最新免费视频| 国产精品扒开腿做爽爽爽视频软件| 欧美三级电影在线看| 日本在线不卡一区二区| 久久福利综合| 久久久最新网址| 91资源在线视频| 久久夜色精品国产欧美乱极品| 91国在线高清视频| 成人自拍视频网| 日韩精品视频免费| 久久久无码一区二区三区| 美女爽到高潮91| 免费看国产精品一二区视频| 在线中文字幕-区二区三区四区| 欧美性色视频在线| 稀缺呦国内精品呦| 午夜精品视频一区二区三区在线看| 538国产精品一区二区免费视频| 国产日韩免费视频| 国产精品丝袜91| 精品99在线视频| 精品99re| 美女国内精品自产拍在线播放| 凹凸精品一区二区三区| wwww国产精品欧美| www污在线观看| 久久久精品区| 日韩中文在线中文网在线观看| 中文字幕日韩一级| 处破女av一区二区| 成年人视频大全| 成人日韩视频| 久久久精品欧美| 一级黄色免费看| 国产精品免费av| 无需播放器的av| 精品国内自产拍在线观看视频| 91干在线观看| 日本一卡二卡四卡精品| 欧美午夜精品久久久久久人妖 | 欧美激情视频在线观看| 国产特黄一级片| 亚洲欧美福利一区二区| 欧美日韩久久婷婷| 综合激情婷婷| 高清国产一区| sm久久捆绑调教精品一区| 亚洲国产成人精品女人久久久 | av在线一区不卡| 国产一区二区三区丝袜| 中国一级特黄视频| 国产精品麻豆欧美日韩ww| 美女在线视频一区二区| 999久久久91| 97netav| aa级大片免费在线观看| 日韩av在线网| 国产美女www| 亚洲欧美日韩久久精品| www.美色吧.com| 日韩视频在线一区二区三区 | 午夜影院黄色片| 久久99精品久久久| 日韩不卡视频一区二区| 丁香5月婷婷久久| 国产99在线|中文| 日本免费中文字幕在线| 日韩亚洲欧美综合| 狠狠躁夜夜躁人人爽天天高潮| 91毛片在线观看| 午夜精品免费看| 欧美日韩中文| 欧美日韩亚洲一区二区三区四区| 久久久久黄色| 欧美精品久久久久| 高清性色生活片在线观看| 91精品国产综合久久小美女| 香蕉视频一区二区| 日本一区免费视频| 中文在线字幕观看| 模特精品在线| 男女激烈动态图| 亚洲美女久久| 亚洲a中文字幕| 超碰aⅴ人人做人人爽欧美| 在线成人激情黄色| 国产成人三级在线播放| 欧美性色19p| 麻豆changesxxx国产| 久久久久国产精品免费免费搜索| 天天色天天综合网| 亚洲女人av| 狠狠干视频网站| 国产一区二区三区四区| 成人动漫视频在线观看免费| 欧美日韩五区| 91精品国产91久久| 国产日产一区二区| 亚洲色图50p| 亚洲乱码精品久久久久..| 91激情五月电影| 日韩av无码中文字幕| 成人免费在线播放视频| 亚洲av综合一区二区| 丰满岳乱妇一区二区三区| 亚洲高清免费在线观看| 午夜在线播放视频欧美| 91午夜在线观看| 久久久精品久久久久久96| 日本一区二区三区免费观看| 成人黄色av网址| 国产免费成人av| free欧美| 欧日韩不卡在线视频| 成人性生交大片免费看网站| yellow中文字幕久久| 国产福利电影在线| 亚洲国产成人精品久久久国产成人一区| 国产乱人乱偷精品视频| 欧美丝袜丝nylons| 欧美brazzers| 欧美午夜久久久| 你懂的国产视频| 亚洲一区二区三区四区在线 | 欧美性色19p| 国产成人在线播放视频| 亚洲国产视频直播| 国产在线视频99| 亚洲国产另类av| 久久久精品91| 亚洲一区二区综合| 久久久久久激情| 亚洲午夜视频在线| 国产在线观看99| 亚洲福利国产精品| 亚洲欧美在线观看视频| 亚洲成人免费在线观看| 国产在线观看免费视频今夜| 亚洲成a人片综合在线| 特级片在线观看| 亚洲一区在线视频| 精品小视频在线观看| 亚洲图片欧美一区| 香蕉免费毛片视频| 欧美性生交xxxxx久久久| 日日噜噜噜噜人人爽亚洲精品| 精品二区三区线观看| 在线观看亚洲天堂| 一本到三区不卡视频| 欧美国产成人精品一区二区三区| 色哟哟欧美精品| 欧美一级黄视频| 欧美色图第一页| 国产麻豆免费视频| 日韩女优制服丝袜电影| 天天色综合久久| 亚洲欧美在线看| 1769在线观看| 欧美理论电影在线观看| www欧美xxxx| 国产99久久久欧美黑人| 91精品亚洲一区在线观看| 99超碰麻豆| 婷婷精品在线| 亚洲欧洲一二三| 欧美成人69| 国产深夜男女无套内射| 日韩成人dvd| 最好看的中文字幕| 成人一区二区三区中文字幕| 成年人在线观看av| 国产精品乱码久久久久久| 久久成人国产精品入口| 日韩欧美亚洲一二三区| 一卡二卡三卡在线观看| 精品国产1区二区| 阿v免费在线观看| 欧美黑人巨大xxx极品| 欧美成人资源| 亚洲最大av在线| 欧美女王vk| 黄色一级视频播放| 日欧美一区二区| 久久av一区二区三| 国产婷婷色一区二区三区四区 | 欧美日韩理论| 无码内射中文字幕岛国片| 黑人精品欧美一区二区蜜桃| 少妇一级淫免费观看| 国产精品二三区| 亚洲日本韩国在线| 91精品国产综合久久香蕉的特点| 欧美在线一卡| 欧美极品欧美精品欧美视频 | 欧美一级特黄高清视频| 同产精品九九九| www.热久久| 日韩在线精品视频| 亚洲美女尤物影院| 99在线观看视频网站| 秋霞欧美视频| 欧美三级一级片| 国产99精品国产| 成人在线观看高清| 在线精品视频一区二区三四| 日日夜夜精品免费| 欧美成人激情视频免费观看| 日本.亚洲电影| 久久久一本精品99久久精品| 欧美激情综合色综合啪啪| 亚洲77777| 久久―日本道色综合久久| 精品人妻在线播放| 日韩一级二级三级精品视频| 日本在线观看www| 国产精品第一页在线| 日韩mv欧美mv国产网站| 91黄色在线看| 国产精品 日产精品 欧美精品| 欧美性生给视频| 欧美色综合影院| 成a人v在线播放| 日韩av第一页| 伊人成综合网伊人222| 国产精品裸体瑜伽视频| 国产mv日韩mv欧美| 久久久久人妻一区精品色欧美| 日韩一区二区在线看| 黄色网页在线播放| 国产一区二区丝袜高跟鞋图片| 欧美日韩激情在线一区二区三区| 亚洲人成色77777| 久久亚洲综合色一区二区三区 | 678在线观看视频| av资源一区二区| 欧美日韩一区二区三区四区在线观看| 国产成人强伦免费视频网站| 亚洲人妖av一区二区| 国产又粗又猛又爽又黄视频| x99av成人免费| 国产精品色婷婷在线观看| 日本免费黄色小视频| 国产高清一区日本| 久久艹精品视频| 日韩av在线免费| 秋霞国产精品| 亚洲人成影视在线观看| 久久99热99| 久久久久97国产| 亚洲国产欧美精品| 2022成人影院| 亚洲欧洲一区二区| 国产中文一区二区三区| 国产成人无码aa精品一区| 精品第一国产综合精品aⅴ| 美女高潮在线观看| 青青成人在线| 久久99久国产精品黄毛片色诱| 成人观看免费视频| 亚洲精品99久久久久中文字幕| 亚洲天堂资源| 亚洲精品影院| 国产成人亚洲综合a∨婷婷图片| 精品无码久久久久久久| 亚洲精品小视频| 日日夜夜亚洲| 免费视频爱爱太爽了| 久久久www成人免费毛片麻豆 | av成人老司机| 日本中文字幕在线观看视频| www.亚洲一区| 黑人久久a级毛片免费观看| 日韩亚洲在线视频| 亚洲天天做日日做天天谢日日欢 | 中文字幕久久久| 日韩视频一二区| 999香蕉视频| 一区二区三区在线播放| 欧美高清成人| 亚洲一区精品电影| 国产精品丝袜xxxxxxx| 熟女av一区二区| 精品丝袜一区二区三区| 四虎地址8848精品| 男人日女人逼逼| 亚洲欧美另类久久久精品2019| 日本又骚又刺激的视频在线观看| 成人激情在线播放| 国产日韩欧美一区| 综合五月激情网| 影音先锋日韩有码| 久久香蕉精品香蕉| 中文字幕日韩久久|