精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DPad:擴散大語言模型的中庸之道,杜克大學陳怡然團隊免訓推理加速61倍

人工智能 新聞
杜克大學陳怡然團隊另辟蹊徑,揭示了 dLLM 中實現全局規劃的「草稿紙機制」,并發現其存在高度冗余。

論文作者團隊:來自杜克大學 CEI Center,由實習生陳欣驊、黃思韜及郭聰博士共同完成,指導教師為李海教授、陳怡然教授。

擴散大語言模型(dLLMs)憑借并行解碼與獨特的全局規劃能力,有望解決自回歸(AR)大模型的效率瓶瓶頸和規劃能力缺陷。但其「全局規劃」能力依賴于其雙向注意力對所有后文的關注,這帶來了嚴重的計算冗余,從而導致現有開源模型的潛力遠遠未被釋放。

當前的 dLLM 存在「路線之爭」:一是保留全局規劃能力但推理效率極低的「全局雙向注意」(如 LLaDA),二是追求速度卻犧牲規劃能力的「塊內雙向注意」(如 Block Diffusion)。如何在這兩條路線之間調和折中,讓模型既能「著眼全局」,又能加速推理,已成為學界日益關注的問題。

針對以上問題,杜克大學陳怡然團隊另辟蹊徑,揭示了 dLLM 中實現全局規劃的「草稿紙機制」,并發現其存在高度冗余。據此,他們提出免訓練方法 DPad(Diffusion Scratchpad),通過先驗地丟棄大量無效后綴 token,既極大地降低了計算量,又保留了核心規劃能力,嘗試在兩條路線中走出一條「中間路線」。該方法與現有優化技術結合后,在幾乎無損的模型精度下,可實現高達 61.4 倍的推理加速。

  • 論文標題:DPad: Efcient Difusion Language Models with Sufx Dropout
  • 論文地址:https://arxiv.org/abs/2508.14148
  • 代碼地址:https://github.com/Crys-Chen/DPad

dLLM 獨特的「草稿紙」機制:實時記錄語義信息

不同于自回歸模型,dLLM 采用雙向注意力機制,在解碼時既能回顧前文,也能「展望」后文。基于這一點,文本序列可被清晰地劃分為三部分:

  • 前綴 token (Prefix Tokens):已完全解碼的文本,語義和位置信息完整。
  • 當前塊 token (Current Block):正在解碼的文本,擁有部分語義和完整的位置信息。
  • 后綴 token (Suffix Tokens):使用 Mask 初始化的未來文本,僅有位置信息,初始沒有語義信息。可在每層 Transformer block 執行的過程中,逐步記錄語義信息,對未來的文本進行規劃。

研究團隊通過分析雙向注意力機制后發現:dLLM 中的后綴 token 是一種獨特的「草稿紙」。模型在解碼「當前塊」時,會巧妙將這些后綴 token 作為臨時存儲空間,用于在每一層 Transformer block 中記錄自己對后文的構思。這種方法能夠實現對整個文本的規劃,使輸出的前后文更一致,提高語言模型的整體性能。

草稿紙機制示意圖。左圖顯示在淺層(Layer 0),信息從 Prefix 和 Current「寫入」(DPad Writing)到 Suffix 區域。右圖顯示在深層(Layer 1),信息被 Current Block 從 Suffix 區域「讀取」(DPad Reading)回來,輔助解碼。

如上圖所示,前綴、當前和后綴三種類型將注意力分數分為了 9 個區域,使得模型的前向過程存在一個「寫—讀」的工作流:

  • 寫入 (Write):在第 0 層 Transformer block,后綴 token 通過注意力機制,從前綴(⑦)和當前(⑧)塊中捕獲信息。這個過程相當于模型對后文的構思作為「草稿」記錄下來。
  • 讀取 (Read):在第 1 層 Transformer block,當前塊反過來從后綴 token 讀取信息(⑥)。此時的后綴 token 已不再是「白板」,而是承載了上一層寫入的「草稿」。所以從后文讀取的信息可以用于輔助當前塊的解碼。

研究團隊認為,這種「寫—讀」的行為就像一本「草稿紙」,將模型在淺層對后文的構思傳遞到深層——這正是 dLLM 具備強大全局規劃能力的關鍵。它讓模型在生成當前內容的同時,能初步構思和約束未來的生成方向,實現了前后文的協同共進。

符合直覺的發現:「草稿紙」也要詳略得當

DPad 的核心思想,源于一個非常符合直覺的類比。想象一下您在創作一部鴻篇巨制:

  • 對于當前章節,你會反復修改,精雕細琢。
  • 對于臨近幾章,你會先列好提綱,構思重點情節,確保情節自然銜接。
  • 對于后續章節,或許只是隨手記下幾個天馬行空的靈感,寥寥幾筆。

DPad 正是基于這一思想,避免讓作者(dLLM)在創作每個章節(當前塊 Token)時,對所有未來的「草稿紙」(后綴 Token)進行強行填充,從而,才能集中注意力并節省資源(降低算力和存儲)。其核心思想便是聚焦當下,展望未來,留白長遠,讓模型的每一次「下筆」都更加高效。

通過對 dLLM 注意力機制的分析,研究團隊發現了支撐這種核心思想的關鍵性數據:

  • 「草稿紙」大量冗余:離當前塊較遠的后綴 token 往往被寫入了極其相似的「草稿」,其中大部分成了無效計算。
  • 注意力隨距離衰減:對當前解碼起關鍵作用的,主要是附近少數幾頁「草稿紙」,遠處的「草稿」重要性顯著降低。

預先解碼出來的后綴 token 存在大量重復。

當前塊對后綴 token 的注意力分數圖。可以看到,注意力(綠線)在進入 Suffix 區域后迅速衰減,表明遠處 token 的影響力逐漸減小。

那么,是否可以更大膽一些呢?如下圖所示,研究人員進行了一個反直覺的實驗:強行刪除那些注意力分數最高的遠端 token。出人意料的是,準確率幾乎沒有任何損失!dLLM 似乎有「自愈能力」,會將注意力自動轉移到鄰近 token 上,補償丟失的信息。

這個「注意力遷移」現象有力地證明:比起某一張特定位置的「草稿紙」,dLLM 其實僅要求在未來某個位置區間內存在可用的「草稿紙」即可。因此,與其空耗算力確定重要 token 的位置,不如直接先驗丟棄。

左圖展示了 dLLM 中當前塊 token 對后綴 token 的注意力分布:整體隨距離衰減,遠端 token 偶爾出現「尖峰」(如 d = 362)。當刪除這些尖峰 token 后(右圖),模型的注意力并沒有消失,而是自然地轉移到了鄰近的 token 上(如,362 號 token 的注意力被轉移到 359 號)。

DPad:簡單高效的「先驗丟棄」

基于以上洞見,DPad 方法應運而生。它的核心思想是:與其等模型算完再「剪枝」,不如在解碼開始前,就先驗地丟掉一批冗余的「草稿紙」。DPad 的實現非常簡潔,主要包含兩大策略:

  • 滑動窗口 (Sliding Window):只保留當前解碼位置附近一個固定長度的后綴窗口作為「草稿紙」,遠處的直接丟棄。
  • 「近多遠少」采樣 (Distance-decay Dropout):在滑動窗口內部,根據「越近越重要」的原則,以一個隨距離遞減的概率保留后綴 token。

(a) 自回歸模型;(b) 傳統 dLLM,需要關注所有后綴 token;(c) DPad,僅關注附近少數經過篩選的后綴 token。

實驗結果:更快更準

DPad 在 LLaDA 和 Dream 系列等多個主流 dLLM 上進行了全面測試,結果喜人。

大幅提升推理效率

在現實的長輸出場景(少示例、長回答)中,DPad 可謂大放異彩:

  • 在 GSM8K 數據集上,DPad 為 LLaDA-1.5 帶來了 20.3 倍的單獨加速比。
  • 與 Fast-dLLM 等并行解碼技術結合后,綜合加速比高達 61.39 倍。
  • 在 HumanEval 數據集上,當輸出長度達到 2048 個 token 時,DPad 與 Fast-dLLM 的組合為 Dream 模型帶來了 97.32 倍的驚人加速。

圖 6 在 GSM8K(1024 tokens, 1-shot)任務上,DPad 結合其他優化技術,讓 LLaDA-1.5 實現了 61.39 倍的加速。

在 HumanEval(2048 tokens, 0-shot)任務上,DPad 結合其他優化技術,讓 Dream-Base 實現了 97.32 倍的加速。

意外之喜:顯著提升語境學習能力 (In-Context Learning)

通常,推理加速會以犧牲部分模型精度為代價。但 DPad 卻帶來了意外的驚喜:在多個任務上,尤其是在 LLaDA 系列模型上,它不僅沒有降低精度,反而顯著提升了模型的準確率,尤其是「嚴格匹配」(Strict Match)得分。

「嚴格匹配」不僅要求答案正確,還要求模型嚴格遵循輸入示例給出的格式,是衡量模型語境學習能力的關鍵指標。

在 GSM8K 任務中,原始模型(左)雖然算對了答案(通過 Flexible-Match),但未能按要求格式輸出答案,未能通過 Strict-Match。而應用了 DPad 的模型(右),則精準復刻了示例格式,同時給出了正確答案。

DPad 在 LLaDA-Instruct 上與原始模型 (Vanilla) 和 Fast-dLLM 的對比

DPad 在 LLaDA-1.5 上與原始模型 (Vanilla) 和 Fast-dLLM 的對比

DPad 在 Dream-Base 上與原始模型 (Vanilla) 和 Fast-dLLM 的對比

DPad 團隊認為,這是因為丟棄了大量冗余的后綴 token 后,模型能將更多注意力集中在信息量豐富的前綴 token(prompt)上,從而更好地理解和學習示例中蘊含的格式與規范。

總結與展望

面對當前 dLLM 的兩條路線之爭,DPad 巧妙地介于兩者之間,嘗試著開辟一條「中間路線」。它既通過「草稿紙機制」,揭示了后綴 token 對于 dLLM 全局規劃能力的重要性;又向 Block Diffusion 靠攏,通過稀疏化后綴 token 大幅提升了推理效率。

DPad 的提出預示著我們似乎并不需要在速度和規劃能力之間做出非此即彼的選擇。未來,若將 DPad 的思想引入到模型的微調甚至預訓練階段,或許能博采眾長,訓練出更高效、更強大的下一代擴散大語言模型。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-28 09:10:00

2022-04-24 10:26:38

人工智能深度學習軟件

2023-02-01 13:33:19

科學技術

2023-03-10 13:05:17

AI就職

2015-03-12 15:08:27

CIO

2025-05-27 15:28:11

模型訓練AI

2021-07-20 05:38:08

Vue 2 Vite 開發工具

2024-09-09 08:31:15

2025-06-30 08:42:00

模型訓練AI

2025-05-30 15:52:05

訓練代碼推理

2025-10-14 08:58:00

2023-01-05 09:33:37

視覺模型訓練

2025-03-28 11:59:10

2020-06-18 11:10:16

AI人工智能神經網絡

2024-07-19 09:59:31

2024-12-02 13:50:00

模型訓練

2020-06-19 09:57:24

AI 數據人工智能

2025-09-22 17:03:09

2025-01-08 13:15:02

2023-12-14 13:30:00

AI模型
點贊
收藏

51CTO技術棧公眾號

国产欧美va欧美va香蕉在| 亚洲男人的天堂在线播放| 国产成人生活片| 亚洲欧美激情另类| 在线综合亚洲| 中文字幕一区日韩电影| 99精品视频国产| 操人在线观看| 欧美激情一区二区在线| 91嫩草免费看| 99re这里只有精品在线| 99热精品久久| 日韩电影免费观看在线观看| 亚洲欧美日韩一级| 国产精品一二三产区| 国产欧美综合在线| 国产成人亚洲欧美| 中文字幕91爱爱| 亚洲精品麻豆| 久久天天躁狠狠躁夜夜av| 北岛玲一区二区| www.久久99| 色欧美片视频在线观看在线视频| 亚洲资源视频| 日本韩国精品一区二区| 国产成人av自拍| 国产精品在线看| 欧美a∨亚洲欧美亚洲| 欧美一区不卡| 自拍偷拍亚洲一区| 欧美精品黑人猛交高潮| 亚洲精品一区二区三区在线| 欧美色男人天堂| 国产91在线免费| 麻豆福利在线观看| 综合久久久久久久| 亚洲国产日韩美| 欧美孕妇性xxxⅹ精品hd| 国产福利一区在线| 亚洲www视频| 一级片在线免费播放| 国产亚洲福利| 97精品视频在线| 久久久久久久久久91| 国产精品久久久久蜜臀| 中文字幕精品久久| 中文字幕第24页| 国内精品伊人久久久| 国产视频精品久久久| 色婷婷精品久久二区二区密| 91亚洲精品视频在线观看| 91精品国产综合久久婷婷香蕉| 美女少妇一区二区| 一级黄色大片免费看| 成人看av片| 久久综合国产精品| 欧美久久在线| 男女污污视频在线观看| 久久中文娱乐网| 欧美高清视频一区| 麻豆国产在线播放| 久久久不卡影院| 日韩欧美视频第二区| 精品视频在线观看一区| 人成免费电影一二三区在线观看| 99热99精品| 久久精品国产第一区二区三区最新章节| 黄色www视频| 91美女片黄在线| 欧美三级网色| 亚洲xxxxxx| 亚洲精品国产精华液| 男女激情免费视频| 麻豆免费在线| 91精品办公室少妇高潮对白| 另类小说第一页| 羞羞视频在线观看一区二区| 日韩一级免费一区| 国产xxxx视频| 国产不卡一区| 久久成年人免费电影| 精品无码人妻一区二区三区品| 国模一区二区三区| 日本精品va在线观看| 在线视频精品免费| 国产一区二区伦理| 国产一区二区三区高清| 毛片在线免费| 亚洲国产高清在线| 国产午夜精品视频一区二区三区| 免费电影网站在线视频观看福利| 欧美日韩日本国产| 中文字幕免费高清在线| 91国内精品| 亚洲人成在线播放| 精品国产视频一区二区三区| 日韩午夜精品| 国产乱人伦真实精品视频| 成人午夜免费在线观看| 国产调教视频一区| 黄色一级大片免费| 外国成人直播| 欧美v亚洲v综合ⅴ国产v| 亚洲一区二区三区蜜桃| 999成人精品视频线3| 久久露脸国产精品| 91久久精品国产91性色69| 成人一二三区视频| 水蜜桃一区二区| 岛国av免费在线观看| 欧美日韩国产成人在线91| 97香蕉碰碰人妻国产欧美| 国产精品x453.com| 欧美又大粗又爽又黄大片视频| 国产一区二区三区视频免费观看| 99国产麻豆精品| 国产精品一区在线免费观看| 欧美一区国产| 亚洲国产美女久久久久 | 国产成人亚洲综合a∨婷婷图片 | 国产精品国产三级国产在线观看 | 国产精品自拍三区| 日韩国产欧美精品| 少妇在线看www| 欧美xfplay| 18岁成人毛片| 奇米在线7777在线精品| 精品日产一区2区三区黄免费 | 国产精品自产拍高潮在线观看| 黄色av网站免费在线观看| 亚洲丝袜另类动漫二区| 色婷婷狠狠18| 欧美日韩色图| 国产成人久久精品| 四虎成人免费在线| 午夜国产不卡在线观看视频| 麻豆tv在线观看| 欧美a级在线| 91在线高清免费观看| 中文字幕日本在线| 欧美三片在线视频观看| 色一情一交一乱一区二区三区| 日韩一区二区久久| 国产精品久久久久av福利动漫| 黄色成年人视频在线观看| 欧美色国产精品| 日本女人性生活视频| 日本在线播放一区二区三区| 欧美日韩另类综合| av在线日韩| 永久免费毛片在线播放不卡| 欧美特级黄色片| 国产欧美日韩一区二区三区在线观看| 免费黄色福利视频| 蜜臀91精品国产高清在线观看| 性色av一区二区三区| 神马久久久久久久久久| 亚洲图片欧美色图| 污污内射在线观看一区二区少妇 | 久久久久久国产精品| www.99视频| 亚洲成人综合视频| 国产激情视频网站| 午夜亚洲一区| 日韩在线三级| 伊人久久一区| 久久乐国产精品| 精品亚洲综合| 欧美日韩1区2区| 欧美精品一级片| kk眼镜猥琐国模调教系列一区二区| 妞干网在线视频观看| 希岛爱理av免费一区二区| 国产福利精品视频| 日韩伦理在线观看| 精品久久久久久最新网址| 日本一区二区三区四区五区| 久久色成人在线| www.久久91| 精品1区2区3区4区| 麻豆91av| **精品中文字幕一区二区三区| 久久999免费视频| 亚洲av激情无码专区在线播放| 日本福利一区二区| 糖心vlog免费在线观看| 成人动漫一区二区| 午夜精品久久久内射近拍高清| 日韩一区欧美| 国产一区二区中文字幕免费看| 奇米777日韩| 粗暴蹂躏中文一区二区三区| 少妇av在线播放| 欧美图区在线视频| 国产一级av毛片| 欧美激情在线免费观看| 不许穿内裤随时挨c调教h苏绵| 久久婷婷一区| 国产精品一二三在线观看| 蜜桃精品wwwmitaows| 69174成人网| 成人免费av电影| 欧美黄色三级网站| 91露出在线| 亚洲精品91美女久久久久久久| 中文字幕欧美在线观看| 亚洲国产日韩综合久久精品| www.涩涩爱| 91小视频在线观看| 精品人妻人人做人人爽夜夜爽| 美女被久久久| 国产va亚洲va在线va| 成人一区而且| 久久涩涩网站| 99国产精品免费网站| 国产美女久久久| 免费福利视频一区二区三区| 久久91亚洲精品中文字幕| 91福利在线视频| 亚洲黄色成人网| 国产av一区二区三区| 欧美视频你懂的| 国产美女激情视频| 亚洲五月六月丁香激情| 亚洲熟女少妇一区二区| 国产无人区一区二区三区| 五月天丁香社区| 国产美女在线精品| 成人日韩在线视频| 日本不卡免费在线视频| 欧美私人情侣网站| 亚洲三级毛片| 久久久久久久久久网| 欧美激情视频一区二区三区免费| 亚洲一区二区三区在线观看视频| 蜜桃成人av| 欧美日韩电影一区二区| 日韩高清一级| 精品欧美国产一区二区三区不卡| 国产精品115| 风间由美久久久| 日韩在线视频一区二区三区 | 豆花视频一区二区| 亚洲一区二区三区四区在线播放| 国产精品伦一区二区| 国产精品草莓在线免费观看| 欧美三区四区| 国产精品久久中文| а√天堂资源国产精品| 国产精品激情自拍| 成人激情视屏| 国产日韩中文字幕| 日韩毛片免费视频一级特黄| 国产欧美婷婷中文| 成人综合日日夜夜| 亚洲xxxx在线| 国产精品香蕉| 久久久久久久久久久久久久一区 | 一级黄在线观看| 欧美日韩免费一区二区三区 | 写真福利精品福利在线观看| 热99精品里视频精品| 亚洲1234区| 国产噜噜噜噜久久久久久久久| 亚洲高清国产拍精品26u| 91中文在线观看| 风间由美一区二区av101| 国产在线精品一区| 欧美人妖在线| 亚洲欧美日韩另类精品一区二区三区 | 国产在线拍揄自揄拍无码| 欧美日本二区| 黄色成人在线看| 日韩高清在线观看| 亚洲欧美日韩网站| av中文字幕亚洲| 久久精品无码一区| 亚洲另类一区二区| 亚洲另类欧美日韩| 欧美日韩不卡在线| 欧美日韩在线一| 小说区图片区色综合区| 日韩欧美一区二区视频在线播放| 久久国产电影| 日本熟妇人妻xxxx| 日一区二区三区| 成人在线短视频| 91一区二区在线| 日本美女黄色一级片| 亚洲电影在线播放| 一区二区乱子伦在线播放| 日韩欧美一区二区视频| 免费观看美女裸体网站| 午夜亚洲福利在线老司机| 中文字幕av不卡在线| 成人久久18免费网站麻豆| 国产一二三四五区| 一区二区三区日本| 伊人成年综合网| 精品少妇一区二区三区视频免付费 | 漫画在线观看av| 国产精品美女网站| 加勒比色老久久爱综合网| 视频一区视频二区视频| 激情综合自拍| 亚洲精品在线视频播放| 久久午夜电影网| 国产在线视频卡一卡二| 欧美蜜桃一区二区三区| 涩爱av在线播放一区二区| 久久夜色精品国产欧美乱| 午夜精品成人av| 国产伦一区二区三区色一情| 亚洲精品91| 波多结衣在线观看| 91免费观看视频在线| 欧美成人国产精品高潮| 欧美视频在线一区| 牛牛澡牛牛爽一区二区| 久久久日本电影| 免费观看亚洲视频大全| 亚洲欧洲一区二区福利| 免费国产自线拍一欧美视频| 精品无码av一区二区三区| 1区2区3区欧美| 中文字幕精品在线观看| 亚洲免费视频在线观看| 麻豆成全视频免费观看在线看| www.成人三级视频| 一区二区电影| 久热在线视频观看| 国产精品全国免费观看高清| 国产黄网在线观看| 亚洲男女性事视频| 免费毛片b在线观看| 国产乱码一区| 亚洲精品三级| 在线观看免费视频黄| 亚洲综合一区在线| 性一交一乱一伧老太| 九色91av视频| 亚洲国产视频二区| 日韩精品综合在线| 成人午夜视频在线| 久久精品视频国产| 欧美精品一区二区三区蜜桃视频 | 欧美视频国产精品| 亚洲欧洲精品视频| 欧美一级视频一区二区| 亚洲动漫在线观看| 国产二区视频在线播放| 26uuu精品一区二区| 亚洲va在线观看| 国产一区二区免费| 色噜噜成人av在线| 久久久成人精品一区二区三区| 激情文学综合丁香| 日韩黄色免费观看| 欧美精品一区二| 免费成人在线电影| 日本中文不卡| 精品一区二区在线看| 午夜免费激情视频| 欧美精品一区二区久久婷婷| 欧美a级在线观看| 欧美不卡在线一区二区三区| 日韩国产精品久久| 黄色录像一级片| 日韩精品影音先锋| h片在线观看视频免费| 欧美另类高清视频在线| 日本vs亚洲vs韩国一区三区| 日本黄色录像视频| 亚洲成人在线网| 中文字幕色婷婷在线视频| 色之综合天天综合色天天棕色 | 欧美在线一二三四区| 国产美女福利在线| 国产一区二区三区无遮挡 | www.色.com| 天天综合天天综合色| 国产精品久久一区二区三区不卡| 成人av电影天堂| 99av国产精品欲麻豆| 日本猛少妇色xxxxx免费网站| 欧美一卡二卡在线| 少妇淫片在线影院| 国产大尺度在线观看| 成人av片在线观看| 在线观看国产精品入口男同| 欧美精品在线免费| 欧美精品尤物在线观看| 欧美一级大片免费看| 色94色欧美sute亚洲线路二| www.欧美日本韩国| 欧美一区观看| 成人高清av在线| 国产精品国产三级国产普通话对白 | 久草中文综合在线| 在线观看中文字幕视频|