精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

10倍吞吐提升無損性能:多模態適用的KV cache量化策略來了,即插即用無需改原模型

人工智能 新聞
作者提出了CalibQuant,一種簡單卻高效的視覺KV cache量化策略,能夠大幅降低顯存和計算開銷。

在InternVL-2.5上實現10倍吞吐量提升,模型性能幾乎無損失。

最新1-bit多模態大模型KV cache量化方案CalibQuant來了。

通過結合后縮放和校準方法,可顯著降低顯存與計算成本,無需改動原模型即可直接使用。

圖片

即插即用、無縫集成

多模態大語言模型在各種應用中展現出了卓越的性能。然而,它們在部署過程中的計算開銷仍然是一個關鍵瓶頸。

雖然KV cache通過用顯存換計算在一定程度上提高了推理效率,但隨著KV cache的增大,顯存占用不斷增加,吞吐量受到了極大限制。

為了解決這一挑戰,作者提出了CalibQuant,一種簡單卻高效的視覺KV cache量化策略,能夠大幅降低顯存和計算開銷。具體來說,CalibQuant引入了一種極端的1比特量化方案,采用了針對視覺KV cache內在模式設計的后縮放和校準技術,在保證高效性的同時,不犧牲模型性能。

作者通過利用Triton進行runtime優化,在InternVL-2.5模型上實現了10倍的吞吐量提升。這一方法具有即插即用的特性,能夠無縫集成到各種現有的多模態大語言模型中。

動機

當前的多模態大語言模型在實際應用中常常需要處理大尺寸、高分辨率的圖像或視頻數據,KV cache機制雖然能提升效率,但其顯存占用與輸入長度(如視覺幀數、圖像尺寸等)成正比。

當輸入數據的規模增大(例如更多的視覺幀、更高的圖像分辨率)時,KV緩存的顯存使用量迅速增加,成為限制吞吐量的瓶頸。盡管當前有些針對LLM KV cache量化的方法可以將其壓縮至2比特,但這些方法沒有針對多模態問題中特有的視覺冗余做分析優化,導致其無法在極限情況1比特下被使用。

本文通過分析多模態大語言模型中的視覺KV cache的冗余,設計了適合多模態模型特有的KV cache量化方案。

方法

本文在通道維度量化的基礎上提出了針對反量化計算順序的后縮放優化方案和針對注意力權重優化的校準策略。

1、通道維度KV cache量化

一種廣泛使用的方法是均勻整數量化。給定一個比特寬度b>0和一個輸入值x,它位于某個范圍[α,β]內,則將其映射到一個離散整數圖片,計算過程為:


圖片

這里的???表示取整運算符。最樸素的方法是使用全局統計量來計算這些極值,但是模型性能會受較大影響,作者選擇在通道維度上細化統計范圍。具體來說,令圖片表示一個K cache,其中n和d分別表示token的數量和head的維度。定義兩個向量圖片如下:

然后,通過上述過程對K中的每一行向量進行量化,其中乘法操作是逐元素進行的。作者同樣將這種按通道的量化方法應用于V cache。

2、后縮放KV cache管理策略

量化后的K cache可以用離散化的整數值、一個縮放因子(scale factor)和一個偏置項(bias term)來表示。在解碼階段,這些值被用于對K cache進行反量化,并隨后與Q相乘。然而,通道維度的量化需要為每個通道分別指定不同的縮放因子和偏置向量,這將導致產生大量不同的數值,增加了反量化過程中的計算開銷。此外,這種方式也使得CUDA內核中的計算效率降低。作者觀察到量化后的K僅具有有限數量的離散取值(例如,對于2比特量化,其取值僅為0、1、2、3),于是提出利用簡單的計算順序重排來減少存儲需求,并提高計算效率。具體過程如下:

圖片是K cache矩陣圖片中的任意一行向量,為其進行b比特整數量化后的結果,并伴隨有逐通道的縮放因子α,β。給定一個查詢向量圖片,在生成token過程中注意力計算如下:

圖片

其中,符號?和⊙分別表示向量之間的內積和逐元素乘積。通道維度上的反量化操作圖片被延遲執行,并高效地集成到后續的向量乘法運算中。因此,這種方法僅存儲經過b比特整數量化后的數值,并且避免了全精度反量化計算過程。這種方法確保了低比特反量化執行的高效性。這種后縮放方法也可以自然地應用到V cache的反量化過程中。

3、量化后的校準

1比特量化的一個限制是經過反量化之后的數值往往會包含大量的極端值。這是因為1比特量化的碼本總是包含了最小值和最大值,導致那些接近邊界的輸入值在反量化后直接映射到了極端值。

因此,重建后的KV cache通常包含過多的大絕對值,最終導致注意力分數產生明顯的失真。為了解決這個問題,作者提出了一種量化后校準方法,用于調整softmax之前注意力分數的峰值。具體來說,假設圖片中的所有元素都位于區間圖片內。給定圖片,定義一個線性變換g將區間圖片映射到圖片,其表達式如下:圖片

隨后對注意力分數進行如下調整:

圖片

如下圖所示,校準方法(Quant-C,紅色)有效減輕了極端值的影響,使調整后的注意分數分布相較于未經校準的量化方法(Quant,藍色)更接近全精度(Exact)分布。

圖片

實驗結果

作者將提出的量化方法分別應用在LLaVA和InternVL model上,測試了其在captioning,VQA,Video QA三個不同的任務上的性能。以captioning任務為例,下圖展示了本文所提出的方法在cococaption benchmark下和其他方法如KIVI,VLCache的對比。

在不同比特數(8,4,2,1)下,本文提出的方法在大部分測試指標上都優于其他兩種方法。例如對于llava-1.5-7b,本文的方法在8比特下達到最高的CIDEr 分數 1.105,與全精度持平,并在1比特下提升至1.109,超過了VLCache(1.053)。同樣地,對于InternVL-2.5-26B,本文的方法在4比特和2比特下分別取得了最高的CIDEr分數1.32和1.313,均優于VLCache和KIVI。

圖片

Runtime分析

為了展示本文提出的量化方法對解碼效率的影響,作者使用InternVL-2.5系列模型,將所提出的1比特量化方法與16比特基線進行了吞吐量評估(即每秒生成的token數)。作者考慮了兩種視覺token長度的情況:n=3328和8192。作者將GPU最大內存從5GB變化到30GB,并在每種內存限制下,尋找能夠容納的最大batch size,測量解碼階段的吞吐量。

如下圖展示,1比特量化方法在所有顯存預算下始終優于基線方法。例如,當n=3329且使用80億參數模型時,本文的方法在5GB顯存下實現了126.582tokens/s的吞吐量(基線為11.628tokens/s),在30GB下提升至459.016tokens/s(基線為40.816tokens/s)。這意味著相比基線,本文方法的吞吐量提升約為9.88×到11.24×,充分展示了該方法在受限顯存條件下顯著提升解碼速率。

圖片

總結

本文探討了多模態大語言模型中視覺KV cache的壓縮方法。簡單地將量化應用到極低比特數常常會引發分布偏移,導致模型性能下降。為了解決這一問題,本文提出了一種新穎的校準策略,作用于softmax之前的注意力分數,有效緩解了量化帶來的失真。此外,本文還引入了一種高效的通道維度后縮放技術以提高計算和存儲效率。

作者在InternVL和LLaVA模型系列上,針對COCO Caption、MMBench-Video和DocVQA等基準任務進行了實驗,結果驗證了所提出方法的有效性。作者利用Triton實現了本文所提出的方法,runtime分析表明本文提出的方法相較于全精度模型有大約10倍的吞吐量提升。

論文標題:CalibQuant:1-Bit KV Cache Quantization for Multimodal LLMs
論文地址:https://arxiv.org/abs/2502.14882
代碼地址:https://github.com/insuhan/calibquant

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-18 11:16:50

大模型性能KV-Cache

2024-11-12 10:20:00

模型數據

2025-06-30 08:42:00

模型訓練AI

2020-03-13 10:36:19

KV存儲性能

2011-07-01 10:11:39

2025-06-16 14:41:07

模型開源AI

2024-12-27 09:30:00

AI數據訓練

2014-03-26 10:00:06

RailsRails性能

2024-10-21 12:30:52

2024-11-11 09:00:00

2025-09-28 09:00:00

2020-03-26 12:38:15

代碼節點數據

2025-05-27 01:55:00

TypeScript開發者項目

2020-07-21 15:40:55

NginxJava服務器

2024-12-26 00:51:38

2025-09-23 12:48:36

AGI模型框架

2022-01-21 15:33:56

架構模型AI

2024-10-29 08:21:05

2009-06-30 19:12:16

云計算SOAIT

2025-08-19 09:12:00

AI模型訓練
點贊
收藏

51CTO技術棧公眾號

日本中文字幕在线视频| 中文字幕在线播出| 色愁久久久久久| 日韩人体视频一二区| 亚洲成人第一| www国产在线| 久久xxxx精品视频| 中文字幕日韩精品在线| 韩国三级hd中文字幕有哪些| 日韩伦理在线一区| 自拍偷拍亚洲激情| 久久亚洲综合网| 中文字幕网址在线| 亚洲少妇自拍| 久久久精品在线| 91超薄肉色丝袜交足高跟凉鞋| 国产精品xx| 国产精品乱码人人做人人爱| 九九九九久久久久| av天堂一区二区三区| 欧美专区一区二区三区| 欧美激情乱人伦| 激情五月深爱五月| 无码日韩精品一区二区免费| 欧美成人高清电影在线| 免费看污黄网站| 超碰在线公开| 一区二区欧美在线观看| 亚洲国产一区二区精品视频| 亚洲日本中文字幕在线| 国产成人鲁色资源国产91色综| 国产精品69久久| 1级黄色大片儿| 欧美日韩亚洲国产精品| 精品国产欧美一区二区三区成人| 大又大又粗又硬又爽少妇毛片| 日韩护士脚交太爽了| 色88888久久久久久影院野外| 加勒比成人在线| 在线欧美三级| 最新热久久免费视频| 色一情一乱一伦一区二区三欧美| 无套内谢的新婚少妇国语播放| 国产成人自拍网| 91夜夜揉人人捏人人添红杏| 中文字幕av无码一区二区三区| 亚洲欧美日韩综合国产aⅴ| 久久91精品国产91久久跳| 三级黄色录像视频| 国产精品久久久久一区二区三区厕所| 伊人男人综合视频网| 亚洲av综合一区二区| 啪啪激情综合网| 亚洲黄色成人网| 免费成人蒂法网站| 精品国产乱子伦一区二区| 精品国产乱码久久久久久浪潮| 日韩精品xxx| 一区二区三区在线免费看 | 羞羞色院91蜜桃| 日韩国产欧美在线视频| 国产精品久久久久久久午夜 | 欧美夫妻性生活| 污视频网址在线观看| 亚洲伊人精品酒店| 欧美一区二区高清| 五月综合激情婷婷六月色窝| 国产日韩在线视频| 99久久婷婷国产一区二区三区| 国内精品伊人久久久久影院对白| 91精品视频网站| 国产精品乱码一区二区| 国产黄人亚洲片| 国产欧美日韩在线播放| 青青草视频在线观看| 国产亚洲午夜高清国产拍精品| 欧洲国产精品| 拍真实国产伦偷精品| 亚洲黄色免费电影| 国产视频九色蝌蚪| jizz亚洲女人高潮大叫| 91精品国产综合久久婷婷香蕉| 中文字幕人妻熟女人妻a片| 国产美女撒尿一区二区| 亚洲天堂一区二区三区| 很污很黄的网站| 怡红院精品视频在线观看极品| 欧美亚洲成人精品| 国产又粗又长视频| 99在线视频精品| 色狠狠久久av五月综合|| 在线网址91| 91久久国产综合久久| 在线免费看v片| 麻豆成人入口| 中文字幕欧美国内| 日韩成人免费在线观看| 美女网站在线免费欧美精品| 96久久精品| 国产在线观看免费网站| 有坂深雪av一区二区精品| 农村妇女精品一二区| 亚洲欧美专区| 日韩精品欧美激情| 中国一级片在线观看| 在线亚洲欧美| jizz欧美性11| 一区二区www| 粉嫩aⅴ一区二区三区四区 | 欧美乱大交做爰xxxⅹ性3| 久久国产精品系列| 狠狠久久亚洲欧美| 蜜桃狠狠色伊人亚洲综合网站| 久操视频在线播放| 色婷婷激情一区二区三区| 亚洲av无一区二区三区久久| 国产精品一国产精品| 欧美精品video| 欧美 亚洲 另类 激情 另类 | 国产三级精品在线不卡| 18视频免费网址在线观看| 亚洲福利视频导航| 999热精品视频| 欧美在线色图| 欧美与欧洲交xxxx免费观看| 亚洲国产中文字幕在线| 成人免费在线播放视频| 激情五月亚洲色图| 任你弄精品视频免费观看| 欧美国产日韩二区| 99热这里只有精品在线观看| 国产精品无遮挡| 玩弄japan白嫩少妇hd| 理论片一区二区在线| 色在人av网站天堂精品| 国产毛片久久久久| 国产精品久久久一本精品| 国产一级片黄色| 日韩成人av在线资源| 久久久久久久久91| 精品女同一区二区三区| 日韩理论片在线| 日本国产一级片| 999久久久国产精品| 国产欧美久久久久久| av网站无病毒在线| 欧美三级三级三级爽爽爽| a天堂中文字幕| 丝袜美腿成人在线| 日韩一区二区电影在线观看| 天天免费亚洲黑人免费| 亚洲午夜色婷婷在线| 99re国产在线| 欧美激情一区三区| 黄色手机在线视频| 婷婷伊人综合| 亚洲japanese制服美女| 日本天码aⅴ片在线电影网站| 日韩一级免费观看| 国产精久久久久久| 成人av午夜影院| 亚洲自偷自拍熟女另类| 精品中文一区| 国产欧美va欧美va香蕉在| aiai在线| 日韩一区二区在线免费观看| 精品无码av在线| 97精品国产露脸对白| 人妻无码视频一区二区三区| 成人激情诱惑| 亚洲最大福利网站| 爱啪视频在线观看视频免费| 亚洲天天在线日亚洲洲精| 18国产免费视频| 一区二区三区日韩欧美| 国产一级伦理片| 日本网站在线观看一区二区三区 | 欧美日本一区二区三区| 九九精品视频免费| 成人av手机在线观看| 东京热加勒比无码少妇| 色综合咪咪久久网| 成人在线视频电影| 亚洲成人人体| 蜜臀久久99精品久久久久久宅男 | 免费精品一区二区三区在线观看| 欧美极品少妇与黑人| 暖暖视频在线免费观看| 777xxx欧美| 日韩精品一区二区三| 亚洲国产精品成人久久综合一区| 青青草原播放器| 午夜一区不卡| 91九色国产ts另类人妖| 亚洲美女15p| 成人午夜两性视频| 肉色欧美久久久久久久免费看| 久久天堂电影网| 日韩a级作爱片一二三区免费观看| 欧美日韩亚洲综合在线| 亚洲视频免费播放| 亚洲欧洲综合另类| 9.1成人看片免费版| 国产伦精品一区二区三区免费| 国产精品97在线| 亚洲精品久久| 三区精品视频观看| 老司机精品在线| 5g国产欧美日韩视频| 91大神在线观看线路一区| 欧美精品videos| 超碰在线无需免费| 在线视频精品一| 视频三区在线观看| 91精品蜜臀在线一区尤物| 老熟妇仑乱一区二区av| 亚洲国产中文字幕| 日韩精品一区二区三区在线视频| 91蜜桃在线免费视频| 日本xxxx免费| 国产自产视频一区二区三区| 日本三级免费观看| 一本一本久久| 黄网站色视频免费观看| 外国成人免费视频| 亚洲免费视频一区| 国产影视精品一区二区三区| 精品国产免费一区二区三区| 日本一区二区乱| 成人在线激情视频| 日本午夜免费一区二区| 国产精品久久91| 波多野结衣亚洲| 18性欧美xxxⅹ性满足| 手机av免费在线| 久久中文字幕一区| 国产cdts系列另类在线观看| 精品国产欧美成人夜夜嗨| 色大18成网站www在线观看| 国产小视频国产精品| 久草在线青青草| 日韩高清欧美高清| 亚洲日本在线播放| 国产视频欧美视频| 日本在线丨区| 亚洲乱码国产乱码精品精| 亚洲欧美一区二区三| 日韩成人高清在线| 欧美zozo| 国产亚洲成精品久久| 国产黄在线观看| 中文字幕欧美日韩精品| 在线观看av的网站| www.欧美三级电影.com| 麻豆91在线| 欧美wwwxxxx| 日韩成人伦理| 8050国产精品久久久久久| 欧美激情20| 日本伊人精品一区二区三区介绍| 欧洲一级精品| 国产精品自产拍在线观看| 96视频在线观看欧美| 99久久99| 欧美日韩另类图片| 日韩精品久久一区二区三区| 久久激情电影| 久久久久福利视频| 一本一本久久| 中文字幕第38页| 国产乱码精品一区二区三区av | 国产亚洲婷婷免费| 日韩在线观看免| 亚洲一二三专区| 欧美激情黑白配| 欧美日韩国产首页在线观看| 国产一区二区三区黄片| 亚洲精品一区二区三区影院| 日本电影一区二区在线观看| 色妞色视频一区二区三区四区| 1stkiss在线漫画| 欧美在线xxx| 久久久久久久性潮| 国产精品久久久一区二区三区| 深爱激情综合| 亚洲小视频在线播放| 校园激情久久| 国产精品久久久久久久av福利| 成人av在线资源网站| 日本少妇xxxxx| 亚洲在线观看免费视频| 国产日韩久久久| 精品久久久久久久久久久久久久久久久| 五月婷婷免费视频| 久久久精品2019中文字幕神马| 极品美鲍一区| 成人观看高清在线观看免费| 欧美日韩看看2015永久免费 | 亚洲激情电影中文字幕| 777电影在线观看| 欧美激情亚洲激情| 国产伊人久久| 美国av一区二区三区| 一级毛片免费高清中文字幕久久网| 日本国产在线播放| 国产乱妇无码大片在线观看| 偷拍夫妻性生活| 亚洲国产毛片aaaaa无费看 | 亚洲欧美国产va在线影院| 亚洲小说区图片区都市| 国产精品高清网站| 日韩精品免费一区二区夜夜嗨| 手机成人av在线| 日本不卡视频在线观看| 亚洲天堂av网站| 中文字幕佐山爱一区二区免费| 亚洲色成人www永久网站| 精品国产sm最大网站| а√天堂8资源在线官网| 国产精品久久91| 国产欧美一区| 成人在线免费观看av| 成人免费高清视频在线观看| 成人免费毛片xxx| 欧美日韩精品电影| 北岛玲一区二区三区| 青青草一区二区| 国产精品1luya在线播放| 中文字幕在线中文| 国产乱色国产精品免费视频| 日韩精品无码一区二区三区久久久| 精品久久久久久久大神国产| 亚洲精品国产精品乱码不卡| 操91在线视频| 在线视频成人| 中文字幕久久一区| 九九久久精品视频| а天堂中文在线资源| 欧美视频第二页| a天堂中文在线88| 国产精品人成电影| 久久在线免费| 五月婷婷丁香色| 国产精品伦一区二区三级视频| 中文字幕在线视频免费| 中文字幕欧美日韩| 日日狠狠久久| 午夜久久久久久久久久久| 狠狠色2019综合网| 日本精品人妻无码77777| 欧美一区二区精品在线| 尤物视频在线看| 国产二区一区| 999亚洲国产精| 蜜桃精品成人影片| 在线视频一区二区三区| yw193.com尤物在线| 91精品久久久久| 欧美国产精品| 给我免费观看片在线电影的| 狠狠做深爱婷婷久久综合一区| 日韩大胆人体| 91精品久久久久久久久久另类| 久久久久电影| 亚洲熟女一区二区三区| 大荫蒂欧美视频另类xxxx| 免费在线稳定资源站| 国产免费一区二区三区在线观看| 天天天综合网| 逼特逼视频在线观看| 日韩欧美在线免费| av福利在线播放| 99精品99久久久久久宅男| 中文一区二区| 欧美日韩生活片| 精品国产一区二区三区久久久蜜月 | 中文字幕在线观看国产| 欧美大奶子在线| 六月丁香久久丫| 中文字幕av不卡在线| 夜夜精品视频一区二区| 四虎影视精品成人| 国产精品专区一| 91久久在线| 国产精品情侣呻吟对白视频| 日韩欧美卡一卡二| 不卡一二三区| 国产免费一区二区三区四在线播放| 波多野结衣视频一区| 中文字幕在线观看高清| 国内偷自视频区视频综合| 日韩av在线播放网址| 欧美图片自拍偷拍| 欧美色倩网站大全免费| wwwww亚洲| 一区二区三区在线视频111| 99久久国产综合色|国产精品| 97在线公开视频| 欧美综合激情网| 黄色在线一区|