精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

把注意力計算丟給CPU,大模型解碼吞吐量提高1.76~4.99倍

人工智能 新聞
MagicPIG是將經典的哈希算法和高維向量估計用到LLM解碼上的嘗試。

CPU+GPU,模型KV緩存壓力被緩解了。

來自CMU、華盛頓大學、Meta AI的研究人員提出MagicPIG,通過在CPU上使用LSH(局部敏感哈希)采樣技術,有效克服了GPU內存容量限制的問題。

圖片

與僅使用GPU的注意力機制相比,MagicPIG在各種情況下提高了1.76~4.99倍的解碼吞吐量,并在檢索和推理任務中實現了更高的下游準確率,優于Quest等現有技術。

概括而言,這項研究主要貢獻有兩點:

1、相比于其他的稀疏注意力(Sparse Attention),MagicPIG基于采樣/估計而非搜索,提升了推理質量。

2、研究把解碼階段注意力模塊的計算和哈希表卸載到CPU上,探索了異構計算的可能性,并且提升了吞吐量,有望降低實際模型部署成本。

下面具體來看。

KV緩存限制了GPU高效利用

在長上下文大模型(LLM)的推理過程中,KV緩存(Key-Value Cache)成為關鍵瓶頸。KV緩存主要用于存儲中間的注意力鍵和值,從而避免重復計算。

然而,其顯存占用隨著批量大小和序列長度的線性增長而迅速增加,這嚴重限制了GPU的批量處理能力,導致計算資源無法被充分利用。

NVIDIA A100-40GB GPU為例,在處理Llama-3.1-8B模型且上下文長度為128k時,僅支持單個請求,且近一半的解碼時間都消耗在訪問KV緩存上,GPU利用率明顯不足。

此外,推理過程中采用的一些策略,如多樣性生成(Best-of-N)和長鏈式推理(Long Chain-of-Thoughts),會進一步增加生成的Token數量,加劇顯存壓力,導致推理效率進一步下降。

TopK Attention的問題

眾所周知,注意力機制本質上具有稀疏性,因此動態稀疏注意力和基于TopK的近似方法得到了廣泛研究。

然而,這些方法往往伴隨著顯著的質量下降問題。

目前已有的KV緩存壓縮技術,如Quest、H2O和Loki,主要通過篩選出KV緩存中注意力得分最高的子集來提高效率。然而,盡管這些方法在實踐中表現出一定的效果,基于TopK的注意力依然是一種存在偏差的近似方法,且缺乏理論上的嚴格保障。

這種不足限制了其在高精度場景中的廣泛應用。

下圖顯示,即使是精確的TopK注意力機制也會導致顯著的估計誤差和下游任務性能下降。

這一問題在需要高上下文利用率的復雜任務中尤為突出,例如聚合任務、常用詞提取(CWE)、高頻詞提取(FWE)以及邏輯推理任務。在這些場景中,基于TopK近似方法的性能下降尤其嚴重。

圖片

以下幾點觀察揭示了為何TopK注意力機制無法始終有效工作

這些觀察不僅解釋了注意力機制的行為,還可能對模型訓練具有重要意義:

1、首個輸入token(注意力匯聚點,sink)的隱藏狀態(包括但不限于鍵和值狀態)幾乎不隨輸入變化而改變。(見左圖, 在采樣的輸入中,其最小相似度均高于0.99)

2、鍵狀態的中心方向在不同輸入句子中保持穩定。(見中圖, 相似度均高于0.9)

3、鍵狀態的中心與匯聚點token的鍵狀態幾乎相反。(見右圖, -0.9至-0.8之間)

圖片

這些現象為理解注意力機制提供了新的視角,同時也表明傳統的TopK近似方法在某些場景下可能存在局限性。

為了解決這一問題,研究提出了一種基于采樣而非搜索TopK鍵值緩存的新方法。

算法:基于采樣的注意力估計

與僅依賴注意力分數最高的鍵值對相比,融入基礎分布信息可以顯著提高估計的準確性。

研究將這一問題視為采樣中的偏差校正問題。在生物學、社會學和機器學習等領域,無偏且高效的采樣技術已被廣泛研究,并具有堅實的理論保障。

如圖所示,基于注意力分數按比例進行采樣(即所謂的Oracle Sampling,研究把注意力模塊的輸出看成value向量的期望值,對應的分布是注意力得分)相比于傳統的TopK選擇方法,其估計誤差要小得多,最多可降低4倍。

圖片

這表明采樣技術在注意力近似中的潛力。

從注意力得分??中采樣,在實際中不可行。重要性采樣(Importance Sampling)允許從一個已知分布??中抽取樣本??1,??2,…,??B,來估計未知分布??的期望。

最終的輸出由下式給出:
圖片
重要性采樣要求??和??的峰值對應以降低估計方差,為此,研究使用局部敏感哈希(LSH) 來生成采樣概率??。

需要指出的是,因為存在Softmax(注意力得分需要歸一化), 所以研究實際上試圖近似的是自歸一化重要性采樣。

圖片

系統:將注意力計算和哈希表放在CPU上

除了精度下降的問題外,受限的GPU顯存容量也限制了現有動態KV緩存壓縮方法(如Quest和Loki)在許多場景中的適用性。

與此同時,像DeepSpeed-Zero-Inference和FastDecode這樣的技術展示了將KV緩存和注意力計算卸載到CPU上的潛力。

CPU的內存帶寬大約是GPU顯存帶寬的10%-20%,這引出了一個自然的問題:

能否在不犧牲精度的前提下,將注意力計算中的內存訪問量減少10倍?

通過利用采樣算法,例如MagicPIG中基于LSH(局部敏感哈希)的采樣技術進行注意力估計,研究大幅降低了內存訪問量。這種方法等效地提升了CPU的內存帶寬,使得在維持精度的情況下實現高效的注意力計算。

論文的系統設計擴展了以往的工作,將大語言模型(LLM)的解碼分為以下四個部分:

  • 參數計算:包括所有線性投均在GPU上運行。
  • 注意力計算:涉及公式圖片,該部分在CPU上運行。
  • 隨機投影:在生成過程中,對于每個??執行K x L次隨機投影以生成哈希碼。由于所有注意力頭可以共享相同的隨機投影器,內存開銷較小(在實際實現中約為400KB)。實驗中K=9或10,而L為數百,因此該步驟主要受計算限制,放置在GPU上運行。
  • 檢索:需要在L個哈希表中查找q的哈希碼。這部分計算開銷非常輕量,但預構建的哈希表占用的內存較大,因此更適合放置在CPU上運行。通過上述任務分區,可以支持更大規模的K和L哈希表,而無需擔心哈希碼計算和哈希表存儲的開銷。

圖片

實驗

研究從準確率推理速度兩個方面來評估MagicPIG系統的能力。

圖片中的百分比為實際采樣的KV cache的數量,對于MagicPIG而言,K10L150≈2%, K10L170≈2.5%。

長文本RULER

以Llama-3.1-8B-Instruct為例,MagicPIG在檢索和推理任務中比Quest(稀疏注意力的SOTA基線)實現了更高的下游準確率。

圖片

推理速度和吞吐量

在L20 + Intel 8563C上測試吞吐量,MagicPIG與僅使用GPU的注意力機制相比,在各種情況下提高了1.76~4.99倍的解碼吞吐量。

圖片

整體而言,MagicPIG是將經典的哈希算法和高維向量估計用到LLM解碼上的嘗試。

接下來,研究將支持更加高效的局部敏感哈希算法,并希望進一步降低LLM部署成本,探索異構計算的可能性。

論文:https://arxiv.org/abs/2410.16179
項目地址:www.lsh-ai.com

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-07-01 12:17:54

2024-11-02 10:28:03

2023-02-09 08:57:11

Callable異步java

2024-11-01 20:25:28

2013-04-25 10:38:40

思科存儲交換機

2023-12-07 06:51:18

AI模型

2024-09-12 15:24:29

2024-09-09 14:12:38

2024-06-28 08:04:43

語言模型應用

2024-06-03 10:56:53

2024-11-01 13:30:56

2024-12-09 00:00:10

2025-05-09 02:00:00

代碼接口吞吐量

2024-12-13 13:58:53

2025-10-22 08:52:23

2025-07-16 10:15:51

2023-05-05 13:11:16

2025-10-16 09:00:00

大模型

2024-05-23 16:41:40

2013-04-19 09:45:20

AMPLabHadoopHDFS
點贊
收藏

51CTO技術棧公眾號

在线播放日韩导航| 国产精品美女久久久久久久久| 久久久久国产精品免费| 国产精品福利导航| 素人一区二区三区| 亚洲一区二区美女| 日产精品一线二线三线芒果| 国产露脸91国语对白| 亚洲看片一区| 久久天天躁狠狠躁夜夜躁| 女同性恋一区二区三区| 久久精品黄色| 五月天丁香久久| 综合操久久久| 日韩电影在线观看完整版| 久久av中文字幕片| 久久久久久久一区二区| jizzjizzjizz国产| 外国成人在线视频| 日韩视频不卡中文| 中文字幕 日韩 欧美| 高潮在线视频| 亚洲男人都懂的| 日韩国产精品一区二区| 一本色道久久综合| www.成人网.com| 国产精品久久久久免费a∨大胸| 日本高清一二三区| 国产一区二区三区四区五区传媒 | 日韩欧美国产综合在线一区二区三区| 少妇高清精品毛片在线视频| 国产免费av在线| 免费一级欧美片在线播放| 久久五月天综合| 2019男人天堂| 欧美精美视频| 欧美一区二区三区另类| 日本韩国欧美一区| 2018国产在线| 爱爱免费小视频| 国产麻豆一区二区三区| 精品久久久久久亚洲国产300| 亚洲精品高清视频| 蜜臀av免费在线观看| 久久综合伊人| 青青草一区二区| 日韩手机在线观看| 亚洲激情女人| www.久久撸.com| 污网站免费观看| 影音先锋欧美激情| 91精品国产色综合久久不卡电影| 黄色手机在线视频| 亚洲成av在线| 欧美午夜精品久久久| 亚洲中文字幕无码中文字| 国产在线拍揄自揄拍视频| ...av二区三区久久精品| 亚洲精品日韩精品| 在线免费看黄| 中文字幕视频一区二区三区久| 天天好比中文综合网| 国产无套粉嫩白浆在线2022年| 91香蕉视频mp4| 韩日午夜在线资源一区二区| 先锋av资源站| 久久色.com| 免费观看成人在线| 国产在线黄色| 中文字幕精品三区| 在线观看欧美亚洲| 天堂亚洲精品| 亚洲欧美日韩久久| 精品少妇人欧美激情在线观看| 波多野结衣乳巨码无在线观看| 亚洲一二三区不卡| 青青艹视频在线| 麻豆精品蜜桃| 欧美一区二区啪啪| 亚洲一区二区三区四区av| 美女视频亚洲色图| 亚洲美女精品成人在线视频| 精品无码人妻一区二区免费蜜桃| 久久一区二区三区电影| 欧美大片欧美激情性色a∨久久| 日韩无码精品一区二区三区| 日韩高清欧美激情| 国产在线精品一区免费香蕉| 91影院在线播放| 国产精品白丝av| 国产日韩欧美一区二区| 日本一卡二卡四卡精品| 国产女主播一区| 久久精品在线免费视频| 欧美办公室脚交xxxx| 在线观看成人免费视频| 午夜诱惑痒痒网| 亚欧洲精品视频在线观看| 日韩在线精品一区| 日本熟妇成熟毛茸茸| 欧美a级一区二区| 欧美一区二区久久久| 日本一卡二卡在线| 日本不卡高清| 久久免费国产视频| 在线观看中文字幕码| 不卡视频在线看| 五码日韩精品一区二区三区视频| 日本在线观看大片免费视频| 91国偷自产一区二区三区观看 | 成人美女视频| 91精品在线观看入口| 无码人妻精品一区二区三区温州| 97精品视频| 欧美一区亚洲一区| 性中国古装videossex| 中文字幕精品一区二区三区精品| 久久这里只有精品23| 9999在线精品视频| 亚洲欧美日韩视频一区| 国产在线拍揄自揄拍无码视频| 日本在线不卡一区| 精品久久中出| 免费在线看污片| 51精品国自产在线| 亚洲天堂岛国片| 一区二区激情| 91香蕉视频在线下载| 欧美另类极品| 欧美性大战久久| 午夜一区二区三区免费| 伊人久久亚洲热| 99久久无色码| 国产在线一区二区视频| 欧美午夜寂寞影院| 高清国产在线观看| 久久久久久夜| 久久精品一二三区| 成入视频在线观看| 亚洲国产精品va在线看黑人动漫 | 国产一区二区视频在线观看免费| 亚洲第一二区| 久久韩剧网电视剧| 亚洲中文一区二区三区| 欧美激情在线一区二区| 国产成人无码一二三区视频| 欧美巨大xxxx| 7777免费精品视频| 婷婷五月综合久久中文字幕| 亚洲成人激情综合网| 亚洲精品乱码久久久久久9色| 91成人超碰| 91视频免费在线观看| 69xxx在线| 日韩午夜在线观看视频| 欧美黄片一区二区三区| 国产**成人网毛片九色 | 新版中文在线官网| 日韩亚洲欧美一区二区三区| 免费在线黄色片| 高清不卡在线观看av| 国产中文字幕二区| 外国成人在线视频| 国产精品高潮呻吟视频| 天堂地址在线www| 欧美精品电影在线播放| 日韩a级片在线观看| 成人激情文学综合网| 免费看又黄又无码的网站| 亚洲福利网站| 国产日本欧美一区二区三区| 国产精品久久麻豆| 精品国产露脸精彩对白| 二区视频在线观看| 中文字幕精品三区| 中文写幕一区二区三区免费观成熟| 国内精品亚洲| 欧美一区二区在线视频观看| 欧美xxxx性| 欧美国产日本高清在线| 男人的天堂在线| 欧美高清性hdvideosex| 国产一国产二国产三| 久久日一线二线三线suv| 欧美美女一级片| 国内自拍一区| 色噜噜色狠狠狠狠狠综合色一| 香蕉久久一区| 91国产一区在线| 视频三区在线| 亚洲国产精彩中文乱码av| 天天干天天插天天射| 一区二区三区精密机械公司| 国产熟妇久久777777| 国产一区二区电影| 中文字幕日本最新乱码视频| 欧美超碰在线| 久久久久久a亚洲欧洲aⅴ| 欧美电影在线观看网站| 97视频在线观看免费| 看电影就来5566av视频在线播放| 91精品国产综合久久精品| 亚洲不卡视频在线观看| 亚洲欧美电影院| 偷拍夫妻性生活| 国产不卡高清在线观看视频| www.xxx亚洲| 亚洲激情一区| www.-级毛片线天内射视视| 久久99久久人婷婷精品综合| 成人欧美一区二区三区视频| 国产69精品久久| 5566成人精品视频免费| 羞羞的视频在线观看| 中文字幕精品在线视频| 手机亚洲第一页| 欧美成人精品高清在线播放| 亚洲在线视频播放| 色综合久久中文字幕| 精品成人久久久| 一区二区在线免费观看| 日韩av网站在线播放| 久久久亚洲欧洲日产国码αv| 性活交片大全免费看| 久久精品99国产精品日本| 成人小视频在线看| 亚洲高清毛片| 成人在线免费观看视频网站| 日韩精品91| 天堂av一区二区| 国产中文字幕一区二区三区| 精品视频在线观看| 成人涩涩网站| 91av免费看| 疯狂欧洲av久久成人av电影| 国产视频观看一区| 日韩漫画puputoon| 国产成人精品在线播放| 精品国产免费人成网站| 羞羞色国产精品| 阿v视频在线| 国外成人在线视频| 超碰在线97国产| 久久久午夜视频| av中文在线资源| 欧美韩日一区二区| 国产精品69xx| 国内精品小视频| 2021中文字幕在线| 韩国视频理论视频久久| а_天堂中文在线| 久久久免费观看视频| 国内小视频在线看| 91国内免费在线视频| 黄视频网站在线观看| 538国产精品一区二区在线| 中文在线аv在线| 日本久久久久久久久久久| 亚洲国产福利| 国产成人久久久精品一区| 成人在线视频播放| 国产欧美va欧美va香蕉在线| 伊人久久综合网另类网站| 成人午夜一级二级三级| 国产午夜久久av| 粉嫩av免费一区二区三区| 国产精品白浆| 麻豆av一区二区三区久久| 欧美猛男同性videos| 亚洲欧洲日本国产| 欧美一区网站| 亚洲熟妇无码一区二区三区导航| 日韩午夜精品| 超碰在线97免费| 国产一区二区三区av电影 | 欧美综合在线播放| 久久国产日本精品| 久久久久国产一区| 国产aⅴ综合色| 一级性生活大片| 国产精品欧美一级免费| 日韩在线观看视频一区二区| 亚洲国产精品嫩草影院| 欧美亚洲另类小说| 8x8x8国产精品| 欧美一级性视频| 亚洲深夜福利在线| h片在线观看网站| 91国在线精品国内播放 | 亚洲影视中文字幕| 欧美黑人做爰爽爽爽| 天堂va久久久噜噜噜久久va| 欧美日韩国产综合网| 日本中文字幕片| 国产一区二区三区四区在线观看| 中文字幕 日本| 成人欧美一区二区三区| 国产视频91在线| 欧美美女bb生活片| 午夜在线视频免费| 久久精品视频在线观看| 校园春色亚洲| 亚洲综合在线做性| 久操国产精品| 91亚洲精品国产| 免费看精品久久片| 91黄色免费视频| 亚洲色图欧美激情| 国产女主播喷水视频在线观看 | 成人做爰69片免费| 国产日韩欧美制服另类| 日本学生初尝黑人巨免费视频| 欧美日韩在线免费视频| 亚洲人视频在线观看| 久久999免费视频| 激情中国色综合| 欧美亚州在线观看| 日韩午夜精品| 亚洲无人区码一码二码三码| 国产精品成人一区二区三区夜夜夜| 精品欧美一区二区三区免费观看| 欧美一三区三区四区免费在线看| 久蕉依人在线视频| 久久久最新网址| 免费一级欧美在线大片 | 国产专区一区| 九九九九九伊人| 国产精品污网站| 夜夜爽妓女8888视频免费观看| 日韩av在线一区二区| 国模雨婷捆绑高清在线| 99久久久精品免费观看国产| 久久精品亚洲人成影院 | 欧洲亚洲精品久久久久| 日本黑人久久| 午夜在线a亚洲v天堂网2018| 久久久久久婷婷| 亚洲一级二级三级| 亚洲成熟女性毛茸茸| 久久久精品网站| 亚洲影视资源| 大桥未久一区二区| 韩日av一区二区| 视频国产一区二区| 欧美理论电影在线| 秋霞午夜在线观看| 成人免费网视频| 欧美精品一区二区三区中文字幕| 无码人妻h动漫| 成人动漫一区二区| 国产97免费视频| 欧美一级日韩免费不卡| 国产cdts系列另类在线观看| 成人精品一区二区三区电影免费| 91久久夜色精品国产按摩| 欧美xxxxx在线视频| 91色在线porny| 亚洲s码欧洲m码国产av| 亚洲视频在线观看免费| 嗯~啊~轻一点视频日本在线观看| 国产一区精品在线| 午夜亚洲伦理| 亚洲一区二区三区日韩| 精品视频全国免费看| 里番在线观看网站| 7777精品伊久久久大香线蕉语言 | 亚洲免费看av| 中文字幕日本不卡| www.国产.com| 国内成人精品一区| 婷婷成人综合| 一本岛在线视频| 亚洲美女视频在线观看| 黑人精品一区二区| 欧美怡红院视频一区二区三区| 精品国产91久久久久久浪潮蜜月| 黄色在线视频网| 亚洲另类一区二区| 亚洲 另类 春色 国产| 国产精品美女免费| 欧美日韩第一区| 醉酒壮男gay强迫野外xx| 欧美日韩亚洲综合| 青青青国内视频在线观看软件| 久久国产精品久久| 美女网站色91| 豆国产97在线 | 亚洲| 亚洲日韩中文字幕在线播放| 高清精品久久| 一本大道熟女人妻中文字幕在线 | 日本精品不卡| 一区一区视频| 99精品1区2区| 亚洲影院一区二区三区| 国内精品久久久| 日韩欧美高清| 97精品人妻一区二区三区蜜桃| 欧美自拍偷拍午夜视频| 污污视频在线看| 五月婷婷综合色|