精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

擴散語言模型九倍推理加速!上海交大:KV Cache并非自回歸模型的專屬技巧

人工智能 新聞
上海交通大學EPIC Lab團隊提出了一種無需訓練、即插即用的高效推理緩存機制:dLLM-Cache。

首個用于加速擴散式大語言模型(diffusion-based Large Language Models, 簡稱 dLLMs)推理過程的免訓練方法。

上海交通大學EPIC Lab團隊提出了一種無需訓練、即插即用的高效推理緩存機制:dLLM-Cache。

其核心思想在于,在一個多步去噪過程中,復用相鄰時間步上變化較小的特征,僅更新那些變化較大的特征,從而實現了計算量的大幅降低,并保持了原有的生成質量。

圖片

圖1 不同dLLMs使用dLLM–Cache和不使用dLLM–Cache在速度和質量上的對比

dLLM-Cache具有幾個重要的亮點:

1. 訓練無關,即插即用。dLLM-Cache完全在推理過程中工作,無需修改模型參數或重訓練。dLLM-Cache可以在完全不損失模型輸出質量的前提下,帶來最高9.1倍的推理速度提升 。

2. 通用于主流dLLM架構,如LLaDA、Dream以及LLaDA-V、MMaDA、Dimple等多模態模型。

3. 在推理過程中,首次識別出了prompt部分的Transformer中間層特征(Key、Value、Attention output、FFN output)長期穩定,而response部分僅有一小部分tokens的特征變化較大,為緩存特征并后續復用提供了理論基礎。

4. 獨創了以V-verify機制為核心的選擇更新策略。以Value向量的變化為選擇基準,成功識別出了response部分變化較大的那些tokens,通過僅更新這些特征,摒棄了高達75%的冗余計算。

本論文共同第一作者劉知遠和楊奕存是哈爾濱工業大學2022級本科生,目前在上海交通大學EPIC Lab進行科研實習,師從張林峰助理教授,主要研究方向為高效深度學習,此前曾在CVPR2025上收獲滿分論文。

圖片

接下來,我們一起來看看該研究的細節。

研究動機

基于擴散的大語言模型正成為語言生成領域最受關注的新范式之一。隨著模型架構的發展、去噪算法的優化以及Masked Diffusion在語言建模中逐步展現出與自回歸模型不同的建模能力,這類模型正在逐步成為挑戰 GPT 等主流模型的重要力量。

以LLaDA、Dream為代表的擴散語言模型,基于迭代去噪的生成過程,不再依賴嚴格的自回歸因果結構,天然支持雙向建模、全局依賴和反向推理等能力,已經在“逆轉詛咒”、數學推理等任務上展現出領先性能。

然而,這種范式的優勢也伴隨著巨大的代價。為了確保生成的質量,dLLMs在推理過程中通常需要執行長達數百步的去噪迭代,每一步都需重新計算attention、FFN等所有層的特征,計算量相當于多次完整前向傳播。這為dLLMs的推理效率帶來了嚴重的瓶頸,制約了其實際部署。更重要的是,主流的加速手段如用于自回歸模型的KV Cache,由于不兼容雙向注意力架構,在dLLMs中完全失效。

與傳統的自回歸語言模型不同,dLLMs不再依賴順序生成下一個token,而是采用隨機遮蔽(mask) + 逐步還原的方式建模token分布,這種機制使得模型具備天然的雙向建模能力,理論上能夠更好地處理逆向邏輯、長距離依賴等任務。

LLaDA 等模型已經在多個基準任務中超越主流ARMs,尤其在“逆轉詛咒”上明顯勝出。

然而,這種擴散式推理帶來一個嚴重的挑戰:為了確保生成質量,dLLMs通常需要上百步的去噪迭代,每一步都需全量計算Attention、FFN等模塊,導致其推理速度相比ARMs慢一個數量級,落地成本高。同時,ARMs 通用的加速方法如KV-Cache因dLLMs的雙向注意力設計而無法兼容。這些造成了dLLMs在推理時既慢又缺乏加速手段的現象。這正是 dLLM-Cache所要破解的核心問題。

方法簡介

本文作者仔細研究了dLLMs推理的中間特征變化過程,發現如下關鍵現象:

圖片

圖2 dLLM中兩個相鄰去噪步驟之間的Key、Value、Attention Output和FFN Output的余弦相似度

Prompt tokens的特征在整個去噪過程中基本保持穩定,每一步都重新計算這些特征是完全不必要且浪費計算資源的;

Response tokens多數變化很小,僅少部分變化劇烈,全量計算所有response tokens存在冗余。

由此,問題轉化為了如何高效識別出這些變化劇烈的response tokens。

圖片

圖3 Response tokens的K或V變化與其他特征變化的相關性

本文作者首創性得提出了V-verify機制。它的提出源于另一項重要的發現:作者量化了response tokens的底層特征(Key, Value向量)的變化與其上層復雜特征(Attention Output, FFN Output)的變化之間的關系,結果顯示它們存在著極強的正相關性,皮爾遜相關系數最高可達0.944。

這意味著,一個token底層的Value向量是否發生變化,是其整體狀態是否發生改變的一個極佳的、且計算成本極低的“指示器”。

基于以上這些關鍵的觀察,本文作者提出了dLLM-Cache ,具體的框架設計如下:

圖片

圖4 dLLM-Cache方法整體pipeline

Prompt緩存:長間隔重用

對于prompt部分,作者設計了長間隔Prompt緩存,每隔Kp步(在實驗中一般設置為100)更新一次prompt的Key、Value、Attention Output、FFN Output,其余步驟全部復用先前結果。這樣避免了對穩定不變的特征的重復計算,大幅減少了計算量

Response緩存:自適應部分更新

對生成目標response區域,由于response tokens的特征并不是一直保持穩定不變的,作者設計了較短間隔的Response緩存,每隔Kr步(在實驗中一般設置為8左右)全量更新一次response的Key、Value、Attention Output、FFN Output,在其余的步驟,作者提出了基于V-verify的自適應緩存策略

  • 在每個去噪步驟,首先計算所有response tokens最新的Value向量。
  • 然后,通過計算新Value向量與緩存中舊Value向量的余弦相似度,將余弦相似度作為每個response tokens的一個“變化分”。
  • 選出“變化分”最高(即相似度最低)的極少數tokens(例如,變化最劇烈的25%),將它們標記為“待更新” 。
  • 最后,模型只對這些被標記的“待更新”tokens,進行完整的特征重計算。而其余75%的“穩定”tokens,則繼續高效地從緩存中復用其特征

通過這種“長間隔”與“自適應”相結合的緩存策略,dLLM-Cache在Transformer的每一層都實現了計算量的極致優化,且整個過程無需任何額外訓練,做到了真正的即插即用

3 實驗結果

本文在 LLaDA 8B和Dream 7B兩大代表性的開源dLLM的基礎版與指令微調版上,針對數學與科學、通用任務、代碼生成三大領域的8個主流基準測試,對dLLM-Cache的有效性進行了嚴苛的檢驗 。評估維度不僅包括推理速度(TPS)計算效率(FLOPs),更核心的是模型性能得分(Score),以確保加速不是以犧牲模型能力為代價。

本文在LLaDA 8B的基礎版和指令微調版上都部署了dLLM-Cache,下圖的實驗結果充分展示了其強大的加速能力和卓越的生成質量保持。在幾乎所有的基準測試中,達到了5倍以上的加速效果,且在絕大部分情況下,生成質量都沒有降低,甚至有輕微的提升。特別是當面對LongBench任務時,prompt的穩定性帶來了更顯著的加速效果,在HotpotQA上實現了高達9.1倍的無損加速。

圖片

圖5 dLLM-Cache在LLaDA模型上的效果

為了進一步證明dLLM-Cache的通用性和魯棒性,作者將其無縫遷移至另一款架構略有不同的dLLM——Dream 7B上。下圖的實驗結果再次印證了dLLM-Cache方法的有效性,充分說明了其通用于主流dLLM架構

圖片

圖6 dLLM-Cache在Dream模型上的效果

作者還將dLLM和主流的基于ARM的LLM進行了對比,下圖展示了LLaDA 8B與LLaMA3 8B在GSM8K任務上的比較。結果顯示,原始的LLaDA在準確率上以近20個點的巨大優勢領先于LLaMA3,但在推理速度上卻遠不及。然而,在使用了本文的dLLM-Cache之后,LLaDA的推理速度獲得了超過3.3倍的提升,首次超過了LLaMA3的推理速度。這一結果有力地證明,本文提出的dLLM-Cache能夠讓dLLMs在保持其顯著準確率優勢的同時,獲得與ARMs相當競爭力的推理速度。

圖片

圖7 使用dLLM-Cache的dLLM vs 使用KV-Cache的ARM

論文鏈接: https://github.com/maomaocun/dLLM-cache/blob/main/asset/paper.pdf
代碼已開源: https://github.com/maomaocun/dLLM-Cache

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-07-10 14:54:13

AI模型圖像生成

2024-04-26 12:51:48

2025-08-04 08:23:00

2025-06-30 08:42:00

模型訓練AI

2022-03-14 10:53:12

谷歌模型研究

2025-11-03 08:40:00

2025-04-21 09:10:00

2025-08-14 09:10:00

2025-06-18 11:16:50

大模型性能KV-Cache

2025-08-12 09:08:00

2025-09-10 09:15:00

AI模型數據

2025-10-14 08:58:00

2025-08-14 09:02:00

2025-06-16 14:41:07

模型開源AI

2019-11-17 22:45:12

谷歌Android開發者

2023-11-19 23:36:50

2024-02-29 09:28:08

自動駕駛模型

2024-09-09 08:31:15

2025-06-11 09:21:28

2025-07-09 09:25:10

點贊
收藏

51CTO技術棧公眾號

国产亚洲高清在线观看| 日本三级在线视频| 99国产精品| 亚洲精品第一页| 99视频在线免费| 黄网页在线观看| 成人av免费观看| 日韩美女主播视频| 无码人妻精品一区二区三区夜夜嗨| 成人高潮a毛片免费观看网站| 精品久久中文字幕久久av| 色婷婷精品国产一区二区三区| 国产精品嫩草影院精东| 亚洲激情婷婷| 日韩在线视频二区| 国产黄色三级网站| 国产电影一区| 色琪琪一区二区三区亚洲区| 久久免费一级片| 国产中文字幕在线看| 国产成人在线视频网站| 日本亚洲欧美成人| 免费在线观看日韩| 第九色区aⅴ天堂久久香| 欧美精品一区二区久久久| 国产视频手机在线播放| 国产精品一二三产区| **欧美大码日韩| 欧美重口乱码一区二区| 乱色精品无码一区二区国产盗| 欧美96一区二区免费视频| 2019av中文字幕| 久久网一区二区| 香蕉精品视频在线观看| 伊人av综合网| 国产精品密蕾丝袜| 亚州精品视频| 亚洲第一区第二区| 亚洲国产欧美日韩在线| 国产精品成人**免费视频| 欧美性猛交xxxxxxxx| 激情六月丁香婷婷| 老色鬼在线视频| 亚洲第一狼人社区| 久久精品无码中文字幕| 91亚洲天堂| 日韩理论片在线| 一区二区三区视频在线播放| 国产私拍精品| 久久久久国产精品免费免费搜索| 久久国产精品精品国产色婷婷| 亚洲乱色熟女一区二区三区| 国产精品一区二区在线播放| 亚洲一区二区三区乱码aⅴ| 在线免费观看一区二区| 日本欧美大码aⅴ在线播放| 国产激情久久久| 日韩一级在线视频| 美女网站久久| 国产精品久久精品| 亚洲性在线观看| 麻豆成人免费电影| 成人激情春色网| 国产www免费观看| 国产精品1024| 国内精品视频免费| 亚洲 欧美 自拍偷拍| 91浏览器在线视频| 日本精品一区二区| 在线免费看黄| 亚洲精品久久嫩草网站秘色| 黄色一级片黄色| 国产精品蜜芽在线观看| 色婷婷久久99综合精品jk白丝 | 国产人妻黑人一区二区三区| 狠狠久久伊人| 国产午夜一区二区| 狂野欧美性猛交| 欧美精品偷拍| 欧美亚洲激情视频| 中文字幕免费播放| 国产乱码精品一区二区三区忘忧草 | www.国产色| 日日夜夜精品视频天天综合网| 国产精品免费久久久| 99国产在线播放| jvid福利写真一区二区三区| 欧美日韩亚洲免费| 超鹏97在线| 狠狠色狠狠色综合日日五| 天堂社区在线视频| 亚洲视频三区| 亚洲女人被黑人巨大进入al| 国产一区二区三区四区在线| 午夜天堂精品久久久久| 欧美壮男野外gaytube| 一级特黄特色的免费大片视频| 国产福利一区二区| 欧洲成人一区二区| 18网站在线观看| 色综合久久久久综合体桃花网| 在线不卡一区二区三区| 韩国女主播一区二区三区 | 国产欧美久久久久久久久| 亚洲第一狼人社区| 五月激情五月婷婷| 台湾佬综合网| 欧美乱大交xxxxx另类电影| 亚洲日本视频在线观看| 国产一区二区三区免费播放| 蜜桃91精品入口| 特级毛片在线| 欧美日韩精品一区二区天天拍小说 | jlzzjlzzjlzz亚洲人| 久久人人爽爽爽人久久久| 日韩不卡视频一区二区| 日本在线视频一区二区| 日韩一区二区三区高清免费看看 | 一区二区三区加勒比av| 亚洲少妇久久久| 久本草在线中文字幕亚洲| www.日本久久久久com.| 精品不卡一区二区| 成人永久免费视频| 欧美一级黄色录像片| 性欧美18一19sex性欧美| 欧美videossexotv100| 亚洲一级二级片| 日韩精品国产精品| 麻豆视频成人| 欧美调教sm| 亚洲第一二三四五区| 成人观看免费视频| 国内精品国产成人| 一区二区三区四区国产| 国产极品嫩模在线观看91精品| 日韩成人中文电影| 日韩av在线播| 99在线精品免费| 每日在线观看av| 岛国av一区| 国内免费久久久久久久久久久| 精品国产999久久久免费| 中文字幕亚洲视频| 91精品无人成人www| 精品美女久久| 国产精品久久久久久久久粉嫩av| 你懂的在线观看视频网站| 欧美三级xxx| 黄色工厂在线观看| 久久久久.com| 日韩av一级大片| 天然素人一区二区视频| 在线看欧美日韩| 在线免费观看av片| 中文字幕一区二区三| 五月天丁香花婷婷| 欧美一区精品| 岛国视频一区| 女厕盗摄一区二区三区| 亚洲男人av在线| av首页在线观看| 中文字幕一区av| 中文字幕永久免费| 亚洲狼人精品一区二区三区| 久久久水蜜桃| av成人在线播放| 久久精品99久久久久久久久| 国产老妇伦国产熟女老妇视频| 亚洲精品欧美激情| 北京富婆泄欲对白| 日韩电影免费在线观看网站| 亚洲永久一区二区三区在线| 国产一区二区三区国产精品| 久久久久久久久电影| 视频一区二区三区在线看免费看| 欧美综合在线视频| 国产午夜手机精彩视频| 不卡一区在线观看| 亚洲人成无码www久久久| 91视频精品| 国产高清一区视频| 一区二区视频免费完整版观看| 久久精品国产精品| 少妇喷水在线观看| 色婷婷综合久久| 欧美第一页在线观看| youjizz久久| 青青草久久伊人| 99国产精品99久久久久久粉嫩| 先锋影音一区二区三区| 亚洲3区在线| 日本精品视频网站| 污影院在线观看| 亚洲欧洲成视频免费观看| 国产精品久久久久久在线| 亚洲国产日韩一区二区| 中文字幕欧美激情极品| 成人免费看黄yyy456| 91香蕉视频污版| 中文欧美日韩| 特色特色大片在线| 国产日产精品_国产精品毛片| 69174成人网| 日本精品另类| 91国产美女在线观看| 国产在线69| 亚洲图片欧美午夜| 欧美熟女一区二区| 欧美精品久久天天躁| 黄色在线视频网址| 亚洲午夜一二三区视频| 激情无码人妻又粗又大| 久久综合资源网| 人妻av一区二区| 国产一区二区中文字幕| 爱情岛论坛成人| 中日韩视频在线观看| 免费日韩在线观看| 99视频精品视频高清免费| 欧美日韩一区二区三区在线观看免| 一区二区三区四区高清视频 | 亚洲第一第二区| 欧美日韩不卡一区二区| 国产视频1区2区| 欧美日韩免费在线观看| 久久久久免费看| 亚洲欧美日韩中文字幕一区二区三区 | 欧美高清视频在线播放| 日韩伦理在线观看| 色一区av在线| a视频网址在线观看| 亚洲视频在线免费观看| 天堂a中文在线| 亚洲激情小视频| 人妻少妇精品无码专区| 日韩欧美一级二级三级| 国产高清视频免费观看| 欧美一级欧美三级| 国产内射老熟女aaaa∵| 337p亚洲精品色噜噜| 一本大道伊人av久久综合| 欧美午夜片在线看| 日韩熟女一区二区| 日本精品视频一区二区三区| www五月天com| 色就色 综合激情| 香蕉污视频在线观看| 日本高清不卡一区| 精品一区二三区| 欧美色综合网站| 亚洲视频中文字幕在线观看| 欧美日韩综合在线| 国产女人18毛片水18精| 3d成人h动漫网站入口| 国产人妻精品一区二区三| 91精品国产色综合久久久蜜香臀| 99热这里只有精品9| 欧美变态凌虐bdsm| 欧美一区二区三区成人片在线| 精品国产精品一区二区夜夜嗨| 殴美一级特黄aaaaaa| 日韩精品中文在线观看| 国产在线电影| 久久久91精品| 欧美人与牲禽动交com| 97热在线精品视频在线观看| 超碰高清在线| 国产成人精品在线视频| 亚洲伊人精品酒店| 999视频在线免费观看| 欧美黑白配在线| 天堂精品一区二区三区| 国产精品久久久久一区二区三区厕所 | 成人a在线视频| 天堂av一区| 欧美二级三级| 99精品在线观看| 久久这里只有精品23| 肉色丝袜一区二区| 中文字幕人妻熟女人妻a片| 不卡的av网站| 网爆门在线观看| 亚洲福利一区二区| 男操女视频网站| 欧美成人在线直播| 九色视频成人自拍| 欧美成人免费观看| 中文字幕在线看片| 91精品综合久久久久久五月天| 国产一区二区三区不卡av| 日韩欧美亚洲区| 欧美99久久| 国产成人久久婷婷精品流白浆| 精品一区中文字幕| 日韩综合第一页| 综合电影一区二区三区| 亚洲图片在线视频| 欧美一区二区成人6969| 国产大片在线免费观看| 欧美极品少妇xxxxⅹ裸体艺术| 外国成人直播| 国产日韩一区欧美| 久久久久久美女精品| 热久久精品国产| 成人一区在线观看| 伊人在线视频观看| 91久久精品网| 五月天婷婷社区| 欧美另类xxx| 欧美视频精品| 日韩av图片| 久久久久在线| 国产伦精品一区二区免费| 亚洲欧美激情插| 中文字幕精品一区二| 国产丝袜视频一区| 9999在线视频| 亚洲一区二区中文字幕| 日韩久久电影| 亚洲 中文字幕 日韩 无码| jizz一区二区| 久久亚洲av午夜福利精品一区| 欧美疯狂性受xxxxx喷水图片| 欧洲亚洲精品视频| 午夜精品久久久久久久99热 | 欧美成人高清电影在线| 在线看的av网站| 国产成人精品日本亚洲| 日韩电影在线观看完整免费观看| 日本免费成人网| 国产成人免费高清| www.99re7| 欧美一二三在线| av毛片在线| 亚洲aa中文字幕| 亚洲精品小说| 中文字幕第三区| 亚洲天堂网中文字| 国产又大又黑又粗| 久久影院资源网| 国产一区二区三区黄网站| 在线视频一二三区| 国产成人一级电影| 精品人妻在线播放| 亚洲成人国产精品| 欧美大胆a人体大胆做受| 久久99精品久久久久久水蜜桃| 亚洲福利免费| 中文字幕丰满孑伦无码专区| 精品福利免费观看| 牛牛影视精品影视| 国产狼人综合免费视频| 久久一区91| 深夜福利网站在线观看| 一区二区三区在线播| 丰满肥臀噗嗤啊x99av| 久久久久久伊人| 欧美精品国产白浆久久久久| 欧美 国产 日本| 欧美国产精品劲爆| 国产视频一二三四区| 欧美丰满少妇xxxxx做受| 成人盗摄视频| 91看片就是不一样| 亚洲国产激情av| 99视频在线观看免费| 欧美精品久久久久久久久| 亚洲精品亚洲人成在线| 国产日韩成人内射视频| 亚洲色图都市小说| 手机在线观看免费av| 国产精品99久久久久久久久| 欧美大片aaaa| 香港三日本8a三级少妇三级99| 一本大道综合伊人精品热热| 日本高清视频在线观看| 99在线观看| 日韩福利视频网| 欧美黄色免费观看| 亚洲人成网站999久久久综合| 国产a亚洲精品| 国产精品又粗又长| 国产欧美精品一区二区三区四区| 国产视频一区二区三| 777国产偷窥盗摄精品视频| 成久久久网站| 亚洲色偷偷色噜噜狠狠99网| 色av一区二区| 男女免费观看在线爽爽爽视频| 欧美日韩一区二| 国产凹凸在线观看一区二区| 久久久精品毛片| 色综合男人天堂| 欧美色网址大全| 亚洲图片综合网| 7777女厕盗摄久久久| 永久免费毛片在线播放| 韩国黄色一级大片| 久久久91精品国产一区二区精品|