精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

上交大等探索鍵值壓縮的邊界:MILLION開源框架定義模型量化推理新范式,入選頂會DAC 2025

人工智能 新聞
本文的研究者提出了 MILLION,一種基于乘積量化的鍵值緩存壓縮和推理加速設計。

本篇工作已被電子設計自動化領域頂級會議 DAC 2025 接收,由上海交大計算機學院蔣力教授與劉方鑫助理教授帶領的 IMPACT 課題組完成,同時也獲得了華為 2012 實驗室和上海期智研究院的支持。第一作者是博士生汪宗武與碩士生許鵬。

在通用人工智能的黎明時刻,大語言模型被越來越多地應用到復雜任務中,雖然展現出了巨大的潛力和價值,但對計算和存儲資源也提出了前所未有的挑戰。在以 transformer 模型為基礎的大模型中,鍵值緩存雖然用以存代算的思想顯著加速了推理速度,但在長上下文場景中成為了存儲瓶頸。例如,半精度的 LLaMA-2-7B 模型權重約 14GB,在上下文長度為 128K 時鍵值緩存占據 64GB,總和已經接近高端卡 NVIDIA A100 的 80GB 顯存容量上限。鍵值量化可被用于壓縮緩存,但往往受到異常值的干擾,導致模型性能的顯著下降。為此,本文的研究者提出了 MILLION,一種基于乘積量化的鍵值緩存壓縮和推理加速設計。

圖片

  • arxiv 鏈接:https://arxiv.org/abs/2504.03661
  • 開源鏈接:https://github.com/ZongwuWang/MILLION

整型量化的軟肋:異常值

圖片

圖 1:矩陣量化可視化。紅色代表的異常值顯著大于其他值,導致均勻量化后高位編碼被浪費。

量化中受到廣泛使用的整型均勻量化受到異常值的影響較為顯著。圖 1 展示了矩陣中的量化。在一組分布較為集中的數據中,一個顯著偏離其他值的異常值會導致其他值的量化結果全部落在較低區間,浪費了高位編碼的表示能力。

圖片

圖 2:圖中使用 「通道熵」 定量比較不同方案的量化效果,越大表明越有效地利用了通道容量,即整型的寬度。沿通道量化只能解決沿該方向分布的異常值,而在面對另一方向異常值時效果不佳。

在實際的鍵值量化中,為了更好的表示能力,通常對于每個通道(即鍵值向量的維度)或每個 token 采取不同的量化參數,這種方法被稱為沿通道量化(channel-wise quantization)或沿詞元量化(token-wise quantization)。然而,如圖 2 所示,沿特定方向量化只能解決沿該方向分布的異常值。

圖片

圖 3:實際采樣獲得的鍵值緩存分布。在 llama-2-7b-wikitext-103-v1-layer10-value 中,異常值并不遵循簡單的沿通道分布,而是呈現為較復雜的點狀和團狀。

研究團隊通過實際采樣數據發現,在鍵值緩存中,沿通道方向分布的異常值占多數,但也存在并不明顯的情況,如圖 3 所示。這表明,上述量化方案并不是一勞永逸的解決方式,仍然存在優化空間。

異常值的解決方案:乘積量化

圖片

圖 4:數軸上的均勻和非均勻量化對比。在對 8 個數據點進行 2 比特量化過程中,均勻量化浪費了 10 編碼。而基于聚類的非均勻量化則編碼更合理。

如圖 4 所示,非均勻量化通過聚類的方式允許量化區間不等長,從而更合理地分配編碼,提升量化效率。研究團隊觀察到,由于通道間的數據分布可能存在關聯(即互信息非負),將通道融合后在向量空間中聚類,效果一定不亞于獨立通道的量化,如圖 5 所示。

圖片

圖 5:左圖為兩個通道獨立進行 1 比特量化,右圖為在通道融合后進行 4 分類的 KMeans 聚類。融合通道量化的通道熵更加接近 2 比特的容量極限,展示出更好的量化效果。

由于高維空間中聚類較為困難,因此將整個向量空間劃分為多個低維子空間的笛卡爾積,可以平衡聚類復雜度和量化效果。這與最近鄰搜索中使用的乘積量化思想一致。研究團隊通過實驗發現,子空間維度為 2 或 4 是較好的平衡點。

推理加速手段:高效的系統和算子實現

圖片

圖 6:三階段的推理系統設計

圖片

圖 7:分塊注意力機制使得批量延遲量化成為可能

圖 6 展示了離線訓練、在線預填充、在線解碼三階段的量化推理系統設計。其中,碼本訓練(量化校準)屬于秒級輕量化任務,并且離線進行,不影響運行時開銷;在線預填充階段使用訓練好的碼本對鍵值緩存進行量化壓縮,達到節省顯存的目的;在線解碼階段采用分塊注意力機制的方法,將預填充階段的歷史注意力和生成 token 的自注意力分開計算(如圖 7 所示),達成批量延遲量化的目的,掩藏了在線量化的開銷,確保模型輸出的高速性。并且,在歷史注意力階段,由于歷史鍵值對數遠大于碼本長度,因此先用查詢向量與碼本計算好非對稱距離查找表(ad-LUT),可以大大減少內積距離計算量,達到加速計算的目的。

圖片

圖 8:向量化加載可有效使帶寬飽和

在算子優化方面,研究團隊在 flash decoding 的基礎上使用了寬數據(如 float4)向量化加載的方式,將多個乘積量化編碼打包為寬數據,有效使帶寬飽和(如圖 8 所示)。同時,在表查找階段,子空間之間的表具有獨立性,并且可以被放入少量緩存行中,研究團隊利用這一空間局部性極大提高了表查找的 L2 緩存命中率。此外,研究團隊還仔細掃描了不同上下文長度下可能的內核參數,找到最優配置,形成了細粒度的預設,在實際運行時動態調整,充分利用 GPU 的計算資源。具體實現可以在開源倉庫中找到。

實驗結果

實驗設置

圖片

圖 9:實驗設置

實驗采用了不同位置編碼、不同上下文長度的多種模型進行了詳細的評估。在模型性能方面,采用困惑度(Perplexity,PPL)和 Longbench 兩種指標;在系統性能方面,采用每詞元輸出間隔(Time Per Output Token, TPOT)定量分析,并給出了注意力層詳細的剖析。對比采用方案和乘積量化參數如圖 9 所示。

模型性能

圖片

圖 10:困惑度指標。其中 「-1%」 表示該方法額外存儲 1% 的異常值不參與量化。

困惑度越小表明模型輸出質量越高。實驗結果表明,MILLION 與額外處理了異常值的 SOTA 方案輸出質量保持一致,展現出對異常值良好的魯棒性。而 SOTA 方案在不處理異常值的情況下可能會遭遇嚴重的輸出質量損失。

圖片

圖 11:Longbench 問答數據集得分展示

在長對話問答任務中,不同模型在各種數據集上的得分均表明,MILLION 方案能夠在 4 倍鍵值緩存壓縮效率下保持幾乎無損的表現。

系統性能

圖片

圖 12:每詞元輸出時間。對比其他方案,MILLION 的優勢持續增長,在 32K 上下文時達到 2 倍加速比。

圖片

圖 13:注意力層時間剖析

在 TPOT 評估中,MILLION 能夠在 32K 上下文語境下同時達成 4 倍鍵值緩存壓縮比和 2 倍端到端加速比。注意力層的深入分析表明,MILLION 在訪存和內核函數方面對比 baseline 取得顯著優勢。

總結

MILLION 的主要貢獻在于:(1)深入分析鍵值緩存分布;(2)提出基于乘積量化的非均勻量化算法;(3)設計高效的推理系統及內核。研究團隊首先證實了鍵值緩存中異常值存在的普遍性,并指出異常值的不同分布是當前主流的量化方案精度不足的根本原因;然后提出通過將高維向量空間分解為多個子空間,并在每個子空間內獨立進行向量量化的方法,更有效地利用了通道間的互信息,并且對異常值展現出極強的魯棒性;接著通過 CUDA 異步流和高效的算子設計,充分利用了 GPU 的并行計算能力和內存層次結構,以支持乘積量化的高效執行。實驗表明,對比主流框架 transformers 的半精度實現,MILLION 在 32K 上下文場景中同時達成 4 倍壓縮率和 2 倍加速比,并且在多種語言任務中精度表現幾乎無損。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-23 09:00:24

2025-01-23 12:30:00

2022-07-12 10:37:08

阿里巴巴達摩院機器學習

2025-11-14 08:43:45

2025-05-30 02:00:00

獎勵模型RRMAI

2022-12-19 14:39:29

機器人論文

2025-11-04 01:43:00

循環語言模型架構

2023-12-29 13:19:43

視頻AI

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-02-26 16:55:27

2025-06-26 09:06:59

2021-12-09 08:50:35

Kubernetes增強功能版本更新

2024-06-12 11:48:55

2025-07-14 08:42:00

開發模型圖像生成

2025-05-16 08:44:01

2025-07-07 08:56:00

2025-09-04 11:58:42

2025-07-08 03:11:00

2021-09-02 10:15:50

計算平臺MaxCompute 阿里云

2025-06-09 09:32:35

點贊
收藏

51CTO技術棧公眾號

黄色欧美视频| 国产免费视频在线| 99日韩精品| 亚洲人成免费电影| 成年人三级黄色片| 欧美1—12sexvideos| xnxx国产精品| 成人啪啪免费看| www.日本精品| 久久精品欧美一区| 亚洲精品一区二三区不卡| 亚洲第一狼人区| gogo久久| 中文字幕一区不卡| 欧美不卡三区| 国产手机精品视频| 狂野欧美一区| 欧美激情一二三| av片在线免费看| 日韩精品免费一区二区三区竹菊| 欧美人妇做爰xxxⅹ性高电影| 成人性生活视频免费看| 香蕉视频网站在线观看| 97精品电影院| 成人一区二区在线| 伊人久久一区二区| 蜜桃av综合| 欧美—级a级欧美特级ar全黄| 色婷婷国产精品免| 偷拍视屏一区| 精品av综合导航| 无码人妻一区二区三区在线视频| 日本少妇一区| 欧美日韩中国免费专区在线看| 日本xxxxx18| 9191在线| 亚洲国产精华液网站w| 久久99精品久久久久久久久久| 国产av一区二区三区精品| 免费观看日韩av| 国产成人精品视频| 国内精品福利视频| 亚洲深爱激情| 韩国福利视频一区| 久久久久性色av无码一区二区| 亚洲综合激情在线| 日韩在线精品一区| 东京热无码av男人的天堂| 欧洲亚洲成人| 亚洲精品成人网| 日本一卡二卡在线| 大香伊人久久精品一区二区| 日韩天堂在线观看| 人妻体体内射精一区二区| **日韩最新| 欧美精品123区| 一区二区三区四区毛片| 日韩成人综合网站| 56国语精品自产拍在线观看| 亚洲这里只有精品| 亚洲国产91视频| 欧美二区三区91| 国产美女视频免费看| 国产精品视频首页| 日韩欧美色综合| 2025中文字幕| 久久精品66| 日韩av综合中文字幕| 亚洲精品在线视频免费观看| 日韩精品免费一区二区三区竹菊| 亚洲日韩第一页| 手机毛片在线观看| 亚洲电影在线一区二区三区| 欧美大成色www永久网站婷| 久草福利资源在线观看| 在线亚洲激情| 国产精品∨欧美精品v日韩精品| 亚洲国产精品无码久久久| 另类人妖一区二区av| 91最新在线免费观看| 亚洲xxxx天美| 久久夜色精品国产噜噜av| 欧美一进一出视频| 黄网站免费在线播放| 亚洲精品大片www| 欧美亚洲一二三区| 日韩漫画puputoon| 日韩免费性生活视频播放| 国产麻豆剧传媒精品国产av| 国内精品视频在线观看| 久久综合九色九九| 中文字幕一区二区三区精品 | 国产黄色91视频| 国产精品免费一区二区| 九色网友自拍视频手机在线| 成人免费在线观看入口| 欧洲精品一区二区三区久久| 精品无人乱码一区二区三区 | 午夜影院免费视频| 日本一区二区综合亚洲| 亚洲高潮无码久久| 色尼玛亚洲综合影院| 日韩一区国产二区欧美三区| 国产黑丝一区二区| 91精品综合久久久久久久久久久| 久久久久久一区二区三区| 久久久久久久亚洲| 成人午夜伦理影院| 一区二区三区我不卡| 黄在线观看免费网站ktv| 欧美特级限制片免费在线观看| 国产精品99久久久精品无码 | 一本色道久久综合亚洲精品婷婷 | 五月天婷婷激情视频| 97人人澡人人爽91综合色| 色综久久综合桃花网| 日韩免费一级片| 久88久久88久久久| 日产精品高清视频免费| 51漫画成人app入口| 欧美三级中文字幕| 亚洲av无码专区在线播放中文| 欧美日韩亚洲在线观看| 69av在线视频| 亚洲毛片欧洲毛片国产一品色| 国产精品午夜免费| 99福利在线观看| 动漫av一区| 欧美高清不卡在线| 国产精品无码久久久久成人app| 91蜜桃网址入口| av在线播放天堂| 日本免费一区二区三区视频| 日韩中文在线观看| 国产字幕在线观看| 99久久精品99国产精品| av网站手机在线观看| 麻豆一区在线| 久久精品91久久香蕉加勒比 | 蜜臀av在线| 91精品国产乱| 蜜桃av.com| 美国一区二区三区在线播放 | 日本中文字幕在线不卡| 久久资源中文字幕| 国产精品视频男人的天堂| 欧美成人综合在线| 一本色道久久综合亚洲91 | 国产美女www爽爽爽视频| 国产人久久人人人人爽| 手机看片福利盒子久久| 欧美精品久久久久久| 国产精品久久久久久久久久免费| 日韩欧美在线观看一区二区| 欧美性极品xxxx娇小| 国产精品一级黄片| 噜噜噜躁狠狠躁狠狠精品视频| 国产伦精品一区二区三区视频黑人 | 亚洲男人的天堂在线| 99超碰在线观看| 国产喂奶挤奶一区二区三区| www黄色在线| 青青草原综合久久大伊人精品| 国产精品欧美日韩一区二区| 在线日本中文字幕| 51精品秘密在线观看| 日日骚一区二区三区| 国产成人午夜高潮毛片| 久久99中文字幕| 伊人久久大香线蕉综合网站| 国产精品电影在线观看| 免费在线观看av网站| 91精品国产综合久久福利软件 | 欧美性高潮在线| 免费在线观看a视频| 极品少妇xxxx精品少妇偷拍| 51xx午夜影福利| 欧美日韩看看2015永久免费| 日本中文字幕成人| 欧美日韩在线看片| 精品国产一区二区三区久久久蜜月| 日韩精品无码一区二区| 国产欧美日韩视频一区二区| 欧美xxxxxbbbbb| 亚洲少妇在线| 国产日韩视频在线播放| 高潮久久久久久久久久久久久久| 人人澡人人澡人人看欧美| 日本在线观看www| 亚洲成av人影院在线观看 | 日韩一区二区电影网| jizz国产免费| 中文字幕欧美日本乱码一线二线| 原创真实夫妻啪啪av| 亚洲欧美日韩视频二区| 正在播放91九色| 欧美男人操女人视频| 成人夜晚看av| 天堂av中文在线观看| 久久久国产影院| 婷婷丁香花五月天| 91精品欧美综合在线观看最新| 亚洲精品国产精品乱码| 中文字幕一区免费在线观看| 久久久久久久久免费看无码| 极品销魂美女一区二区三区| 国产91在线视频观看| 欧美阿v一级看视频| 日韩欧美一区二区三区四区五区| 日韩欧美一级| 国产精品视频一区二区高潮| av在线中出| 欧美理论片在线观看| 国产高清视频在线| 日韩精品免费在线视频| 国产男男gay网站| 欧美午夜一区二区| 欧美激情亚洲综合| 亚洲另类在线制服丝袜| 日韩av片在线免费观看| 久久久久久久久久久久久久久99 | 91看片淫黄大片一级在线观看| 北条麻妃亚洲一区| 美女脱光内衣内裤视频久久影院| 国产l精品国产亚洲区久久| 欧美精品福利| 青青草免费在线视频观看| 日韩欧美网址| 日本不卡二区高清三区| 日韩高清在线免费观看| 国产精品免费在线播放| 国产亚洲精aa在线看| 国产在线精品播放| 成人国产精品一区二区免费麻豆| 欧美一级在线播放| 亚洲优女在线| 午夜精品久久久久久久白皮肤 | 婷婷六月综合| 色播亚洲婷婷| 欧美日一区二区| 日韩尤物视频| 日韩久久电影| 一区二区三区|亚洲午夜| 欧美日韩精品在线一区| 日韩欧美国产二区| 欧洲乱码伦视频免费| 久久影视中文粉嫩av| 欧美日韩看看2015永久免费| 狠狠综合久久av| 天天做夜夜做人人爱精品| 久久伊人一区二区| 国产精选一区| 亚洲欧美日韩不卡一区二区三区| 久久在线视频| 日韩精品一区二区三区电影| 一个色综合网| 日本福利视频网站| 亚洲激情影院| 久久精品免费一区二区| 久久久久中文| 久久久久国产一区| 久久er99精品| 97超碰免费在线观看| 成人免费高清在线| 国产男女猛烈无遮挡a片漫画| 久久精品在线免费观看| 亚洲一二三精品| 亚洲免费av网站| 日本网站在线免费观看| 欧美日韩国产一区二区三区| 无码人妻丰满熟妇区五十路 | 欧美在线播放视频| 日韩三区免费| 91精品在线影院| ccyy激情综合| 日韩中文字幕一区| 欧美一区成人| 国产男女无遮挡| 麻豆91在线看| 亚洲av无码专区在线播放中文| 91视频免费观看| 四虎影视一区二区| 亚洲高清免费视频| 亚洲精品毛片一区二区三区| 欧美一区二区观看视频| 欧美在线观看在线观看| 日韩在线观看av| 麻豆免费在线| 91老司机精品视频| 偷拍自拍一区| 大片在线观看网站免费收看| 亚洲综合三区| 国产xxxxhd| 国产日韩v精品一区二区| jizz亚洲少妇| 色婷婷久久久亚洲一区二区三区| 国产熟女一区二区三区五月婷| 精品一区精品二区| 在线午夜影院| 国产精品户外野外| 风间由美中文字幕在线看视频国产欧美 | 国产一区二区三区四区大秀| 糖心vlog在线免费观看| 久久久久久久尹人综合网亚洲| 久久黄色一级视频| 亚洲国产精品ⅴa在线观看| 久久亚洲国产成人精品性色| 欧美午夜精品电影| 五月天婷婷社区| 色综合久久88色综合天天看泰| 成人国产精品| 日本不卡一区二区三区在线观看| 欧美日韩 国产精品| jizz18女人| 久久一区二区视频| 久久免费黄色网址| 91精品中文字幕一区二区三区| 成人综合影院| 45www国产精品网站| 日韩欧美中文在线观看| 亚洲欧美日韩不卡| 免费不卡在线观看| 一二三不卡视频| 午夜电影网亚洲视频| www.看毛片| 麻豆乱码国产一区二区三区| 久久亚洲精品人成综合网| 免费成人深夜夜行视频| 99成人免费视频| 粗大的内捧猛烈进出视频| 最新中文字幕一区二区三区 | 日韩一区二区三区电影在线观看 | 国产精品网站在线| 久草视频一区二区| 日韩av影视综合网| 1区2区3区在线| 国产视频一区二区不卡| 国产精品激情电影| 91porn在线| 一区二区三区在线观看动漫| 99国产精品一区二区三区| 久久av.com| 经典三级久久| 少妇久久久久久被弄到高潮| 国产精品888| 久久久久噜噜噜亚洲熟女综合| 日韩午夜在线观看视频| 久久一卡二卡| 国产欧美欧洲| 亚洲影音一区| 全黄一级裸体片| 91福利视频在线| 8888四色奇米在线观看| 成人国内精品久久久久一区| 婷婷综合久久| 亚洲av无码成人精品区| 亚洲超碰精品一区二区| 亚洲区小说区图片区| 欧美一区二区三区艳史| 亚洲精品国产动漫| 人人干人人视频| 日韩毛片高清在线播放| 国产高清视频免费| 国内精品久久影院| 少妇精品久久久一区二区三区| a在线观看免费视频| 亚洲婷婷综合色高清在线| 成 人片 黄 色 大 片| 97国产精品视频| 精品日韩毛片| 99久久综合网| 狠狠爱在线视频一区| 色综合久久久久综合一本到桃花网| 91精品久久久久久久久久久久久久| 中文字幕免费一区二区| 中文字幕三级电影| 色噜噜狠狠成人网p站| 免费黄色在线看| 国产一区二区在线观看免费播放| 亚洲欧美bt| 三级黄色录像视频| 亚洲国产毛片完整版| av成人亚洲| 国产精品久久久久9999爆乳| 久久久蜜桃精品| 国产绿帽一区二区三区| 97热在线精品视频在线观看| 欧美性感美女一区二区| 国产精品熟妇一区二区三区四区| 日韩欧美成人精品| 黄色视屏免费在线观看| 精品综合久久| 黄色资源网久久资源365| 好吊操这里只有精品| 色噜噜狠狠狠综合曰曰曰88av | 亚洲国产日韩欧美在线动漫| 91大神在线观看线路一区| 久久手机在线视频| 欧美韩日一区二区三区| 秋霞网一区二区|