精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

KVSharer:基于不相似性實現跨層 KV Cache 共享

發布于 2024-10-29 11:47
瀏覽
0收藏

一、背景

本文中我們介紹一種最新的 KV Cache 共享論文 KVSharer,與之前常見的層內共享不同,KVSharer 主要關注跨層共享,并且是整個層的共享。

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

對應的論文:[2410.18517] KVSharer: Efficient Inference via Layer-Wise Dissimilar KV Cache Sharing

對應的代碼庫:????https://github.com/yangyifei729/KVSharer/tree/main??

二、摘要

LLM 推理過程中對 GPU 內存的需求不斷增加,而其中 Attention 的 KV Cache 占據了超過 80% 的空間。當前,大多數現有的 KV Cache 壓縮算法主要集中在單個 Transformer 層內的壓縮,而較少有研究涉及層間壓縮(PS:其實我們之前介紹過的 Character.AI 方案和 MixAttention 都是層間共享)。

本文中,作者提供了一種即插即用的方案,稱為 KVSharer,通過在層間共享 KV Cache 來實現層間壓縮。作者發現一個反直覺的現象:共享相似性較低的 KV Cache 更能保持模型性能(PS:這里實現時其實有個約束,要同時避免對 LM head 之前的 Hidden State 的影響過大)。實驗表明,KVSharer 能夠在減少 30% 的 KV Cache 計算,以及內存開銷,而對模型性能影響不大,同時還能實現至少 1.3x 的生成加速。此外,作者實驗表明,KVSharer 與現有的層內 KV Cache 壓縮方案兼容,兩者結合可進一步節約內存。

三、方案

3.1 概述

如下圖 Figure 2 所示為本文方案的示例,其主要包含幾個步驟:

  • 校正集上推理,并記錄 KV Cache。
  • 計算任意兩層的歐式距離。
  • 排序,按相似性從低到高排列。
  • 從排序的組合中依次篩選可以共享的層。
  • 在整個后續推理中保持離線搜索的共享策略。?

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

3.2 搜索策略

如下圖 Algorithm 1 為詳細的搜索算法,其大體包含兩個階段:

KV Cache 相似性計算和初始化(1-4):

  • 首先使用校準集所有樣本進行推理,獲得所有 Layer 的 KV Cache。
  • 在每一層,對所有樣本的 KV Cache 求平均。
  • 將每一層的 KV Cache 拉平為一維 Embedding。
  • 計算任意兩層 KV Cache Embedding 的歐式距離(距離越大越不相似),構成 S。
  • 按照距離降序排列(距離越大,越不相似),得到 R。

共享策略搜索(5-18):

  • 初始空的共享策略 Z 和空的共享 Layer 個數 P。
  • 依次遍歷排序后的候選共享層 R:

將當前候選 r 添加到共享策略 Z。

替換候選共享策略 Z 中的所有相關層(保留靠近輸入的層,靠近輸出的層共享靠近輸入的層),然后使用校準集驗證最后一層 Hidden Stage 和未替換時的相似度。

如果相似度小于閾值 T,表示替換后影響較大,則從 Z 中刪除當前后續 r。

如果相似度大于等于閾值 T,則可以作為候選。

如果候選集容量滿足 C,則直接結束。?

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

PS:需要說明的是,以上是基于貪心搜索策略,這種逐步判斷并添加的方式往往只能找到局部最優解,并不一定是全局最優的。要想找到全局最優,通常需要進行全局搜索,比如窮舉所有可能的共享組合,或者產生更復雜的搜索算法,但是往往會大幅增加計算成本,因此這種貪心搜索是計算效率和效果的折衷。

3.3 推理

如下圖 Figure 3 所示,在推理階段直接使用離線階段搜索出來的共享策略,可以看出其實是會存在多個 Layer 共享一個 Layer 的。但是圖中似乎有問題,論文中并沒有討論共享的傳遞性,比如Layer 2 和 3 共享 Layer 1,而 Layer 4 共享 Layer 3,Layer 5 共享 Layer 4,那豈不是 Layer 2,3,4,5 都共享 Layer 1?

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

如下圖所示為代碼中的注釋(KVSharer/llama_real_share/modeling_llama_kvsharer.py#L364-L371):

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

四、實驗&結果

4.1 精度

如下圖 Table 1 所示,作者測試幾個常見模型 LLaMA2-7B/13B(PS:如果有 LLaMA3 的結果更有說服力)、InternLM2-7B/20B(中英文能力不錯)和 Mistral-7B 在一些主要任務上的精度。其中 Layer 表示實際計算的層數,Layer 越小,表示共享的越多。Percent 表示共享后的平均精度相比原始平均精度的比例。可以看出,共享越多效果越差,并且各個模型表現各不相同,比如在 LLaMA2-13B(40->30) 和 Mistral-7B(32->24) 在共享 25% 時,平均精度就不到 90% 了。

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

其實,從困惑度(PPL)上來看,影響也是挺大的,尤其是與 H2O 和 PyramidInfer 這些層內壓縮結合后:

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

4.2 推理

如下圖 Table 2 所示,作者以 LLaMA2-13B-Chat 模型為例,對比了不同方案對 Memory 的開銷以及推理的加速比。其中的 KVSharer(25%)表示 25% 的壓縮比,也就意味著 40 層只計算 30 層的 KV Cache。(PS:這里的結論很奇怪,25% 的壓縮比理論上最多節約 25% 內存,最多吞吐提升 25%?更何況 Q 和 Attention 還要正常計算,而實際上 1024+4096 時節約了 36% 的內存,吞吐提升 1.53x。)

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

4.3 消融實驗

如下圖 Figure 6 所示,作者實驗表明:共享相似性較低的 KV Cache 更能保持模型性能。

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

如下圖 Table 3 所示,使用 Wikipedia 或 BookCorpus 作為校準集對精度的影響不是特別大:

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

如下圖 Table 4 所示,隨機共享相比本文的 KVSharer 會導致精度下降比較多,證明本文方法的有效性:

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

如下圖 Table 5 所示,KVSharer 在幾個模型的 Base 模型和 Chat 模型上的精度影響比較類似,證明了方法的通用性。(PS:不過 PPL 確實影響挺大的)

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

五、參考鏈接

本文轉載自 ??AI閑談??,作者: AI閑談

收藏
回復
舉報
回復
相關推薦
大尺度做爰床戏呻吟舒畅| 亚洲一区二区三区涩| aaa人片在线| 激情婷婷综合| 欧美一区二区视频免费观看| 男人添女荫道口女人有什么感觉| 日韩精品一二| 久久精品国产免费| 久久免费国产视频| 精品日韩在线视频| 视频在线观看免费影院欧美meiju| 亚洲大型综合色站| 亚洲在线视频一区二区| 天堂中文网在线| 蜜臀av性久久久久蜜臀aⅴ | 欧美一级电影网站| 看av免费毛片手机播放| 国产盗摄在线观看| 久久久精品综合| 国产高清精品一区二区三区| 做爰无遮挡三级| 日韩视频一区二区三区在线播放免费观看| 综合欧美国产视频二区| 亚洲精品女人久久久| 99国内精品久久久久| 日本高清成人免费播放| 日本香蕉视频在线观看| 视频三区在线| 久久精品视频在线看| 国产成人精品一区二区三区福利| 中文字幕人妻色偷偷久久| 一区二区三区高清视频在线观看| 久久99精品国产99久久6尤物| www.黄色在线| 亚洲第一论坛sis| 亚洲成年人在线| 日本xxxx免费| 麻豆视频久久| 91精品国产综合久久蜜臀| 成人在线观看黄| 性欧美18~19sex高清播放| 亚洲成a人片在线不卡一二三区| 在线丝袜欧美日韩制服| 尤物网在线观看| 国产日韩精品一区二区三区| 欧美日韩在线精品| 日韩成人黄色| 久久日韩精品一区二区五区| 国产伦精品一区二区三区视频孕妇| 国产日韩欧美一区二区东京热 | 永久av免费在线观看| 国产69精品久久| 欧美日韩在线播放一区| 成年人在线观看视频免费| 免费亚洲电影| 在线观看视频91| 国产精品入口免费软件| av在线一区不卡| 欧美日韩中字一区| 国产又大又黄又猛| av在线亚洲一区| 欧美一区二区在线观看| 一级网站在线观看| 欧美在线在线| 精品成人在线观看| 在线免费播放av| 在线日韩一区| 在线观看中文字幕亚洲| 欧洲美女女同性互添| 综合视频在线| 久久免费福利视频| 7799精品视频天天看| 日韩中文字幕一区二区三区| 国产精品偷伦视频免费观看国产 | 日韩色妇久久av| 在线观看免费黄视频| 18涩涩午夜精品.www| 欧美另类videosbestsex日本| 日本片在线看| 欧美日韩免费一区| 九热视频在线观看| 成人免费91| 亚洲国产精品免费| 国产亚洲精品熟女国产成人| 国产精品99在线观看| 久久久噜噜噜久久中文字免| 国产日产精品一区二区三区| 免费在线观看不卡| 超碰在线97av| 国产高清视频在线| 亚洲蜜臀av乱码久久精品| 成人性生活视频免费看| 日韩精品三区| 欧美一区二区三区爱爱| 国产精品一区二区人妻喷水| 日本一区二区在线看| 国模私拍一区二区三区| 中文字幕精品无码亚| 成人妖精视频yjsp地址| 日韩欧美国产二区| 免费在线观看av电影| 色综合天天做天天爱| 手机精品视频在线| 免费欧美一区| 欧美寡妇偷汉性猛交| 五月激情丁香网| 成人美女视频在线观看| 亚洲国产欧美日韩| 亚洲国产成人二区| 日韩免费一区二区三区在线播放| 3d动漫精品啪啪一区二区下载 | 精品按摩偷拍| www.日韩视频| 亚洲国产精品无码久久久| 国产成人免费高清| 亚洲欧美日韩精品综合在线观看| 美女在线视频免费| 精品日韩欧美一区二区| 一区二区三区在线播放视频| 国产精品久久久久久模特| 成人羞羞国产免费| 成人午夜影视| 欧美性生活大片免费观看网址| 欧美色图校园春色| 色天天久久综合婷婷女18| 91成人在线观看国产| 不卡的日韩av| 亚洲天堂久久久久久久| 久久午夜夜伦鲁鲁一区二区| 香蕉久久99| 97久久超碰福利国产精品…| 国产丰满美女做爰| 综合网在线视频| 做a视频在线观看| 欧美午夜精彩| 国产大片精品免费永久看nba| 色噜噜一区二区三区| 亚洲另类色综合网站| 91日韩精品视频| 91亚洲一区| 国产精品狼人色视频一区| 欧美色18zzzzxxxxx| 亚洲成av人片一区二区| 国产成人av片| 伊人激情综合| 国产日韩三区| www.色在线| 亚洲国产成人一区| 国产福利拍拍拍| va亚洲va日韩不卡在线观看| www.射射射| 蜜桃一区av| 欧美亚洲视频在线看网址| 午夜激情小视频| 一本一本久久a久久精品综合麻豆 一本一道波多野结衣一区二区 | 久久国产尿小便嘘嘘| 亚洲国产欧洲综合997久久 | 毛片视频免费播放| 麻豆成人久久精品二区三区小说| 一区二区三区在线视频111| 久久91视频| 欧美成人亚洲成人| 神马一区二区三区| 色婷婷亚洲综合| 日本人亚洲人jjzzjjz| 久久99最新地址| 少妇高潮大叫好爽喷水| 亚洲天堂av资源在线观看| 国外成人在线播放| 男生女生差差差的视频在线观看| 91福利国产精品| 欧美风情第一页| 成人毛片在线观看| 日av中文字幕| 91精品亚洲| 精品视频高清无人区区二区三区| 成人性生交大片免费观看网站| 亚洲视频视频在线| 国产又粗又猛视频| 性做久久久久久| 免费网站在线高清观看| 国产在线国偷精品免费看| 日韩成人三级视频| av伊人久久| 91久久精品一区二区别| 亚洲精品一区| 久久久精品国产网站| 天堂在线视频免费| 欧美日韩在线播| 伊人国产在线观看| 国产精品免费久久久久| 人妻av一区二区| 免费观看久久久4p| 91丨porny丨探花| re久久精品视频| 国产一区在线观| 少妇精品视频在线观看| 91av视频导航| 日韩成人影视| 国产视频精品在线| 精品国自产拍在线观看| 色噜噜狠狠一区二区三区果冻| 青娱乐91视频| 欧美国产精品久久| 在线免费看黄色片| 精品一区二区三区在线播放视频| 免费av观看网址| 亚洲最大黄网| 日韩在线三区| 日本亚洲不卡| 99国产视频在线| 91视频成人| 国产精品久久久久久久久久99| 久草成色在线| 久久久精品在线观看| 国产福利小视频在线| 亚洲福利视频专区| 国产成人精品毛片| 欧美日韩国产系列| 亚洲 小说区 图片区| 亚洲不卡av一区二区三区| 国产精品三区在线观看| 日本一区二区不卡视频| 少妇按摩一区二区三区| 暴力调教一区二区三区| 国产麻豆剧传媒精品国产| 国产一区二区三区视频在线播放| 最近中文字幕一区二区| 石原莉奈一区二区三区在线观看| 久艹视频在线免费观看| 欧美日韩一视频区二区| 在线观看污视频| 91精品国产成人观看| 亚洲在线观看一区| 欧美激情电影| 亚洲在线色站| 999国产精品| 在线成人av电影| 久久电影院7| 亚洲视频sss| 日韩欧美1区| 一区二区日本伦理| 日韩在线观看| 吴梦梦av在线| 亚洲一级淫片| 久久久久久久久久伊人| 在线成人激情| 成人在线视频一区二区三区| 牛夜精品久久久久久久99黑人| 国产制服91一区二区三区制服| 2023国产精品久久久精品双| 男人草女人视频| 欧美日韩免费观看一区=区三区| 可以在线看黄的网站| 欧美久久成人| 18禁网站免费无遮挡无码中文| 国产午夜精品一区二区三区欧美 | 国产激情一区二区三区| 成人三级做爰av| 国产成人av电影在线观看| 中国特级黄色大片| 99国产精品久久久久久久久久久| 日韩成人av一区二区| 久久久久久亚洲综合| 成人性生交大片免费看无遮挡aⅴ| 国产精品不卡一区二区三区| 欧美第一页在线观看| 一区二区三区成人| 日操夜操天天操| 欧美午夜视频一区二区| 最近中文字幕av| 欧美成人猛片aaaaaaa| 日本黄色一区二区三区| 在线a欧美视频| 午夜影院免费在线| 欧美专区福利在线| 久久精品国产福利| 国产精品对白一区二区三区| 亚洲激情播播| 青春草在线视频免费观看| 精品动漫3d一区二区三区免费| 欧美精品色婷婷五月综合| 麻豆国产精品视频| 手机免费看av片| 欧美激情中文字幕一区二区| 欧美成人综合色| 色播五月激情综合网| av中文字幕免费| 亚洲男人天堂2024| av片在线观看免费| 国产成人精品在线| 成人搞黄视频| 欧美日韩在线一二三| 欧美日韩国产免费观看| 亚欧在线免费观看| 国产sm精品调教视频网站| 亚洲色成人网站www永久四虎| 亚洲欧美日韩在线播放| 日日夜夜狠狠操| 欧美变态tickling挠脚心| 九色在线观看视频| 久久久久国产视频| 免费视频观看成人| 免费看污久久久| 欧美日韩ab| 亚洲一区精品视频在线观看| 99久久99精品久久久久久| 欧美日韩精品一区二区三区视频播放 | 亚洲免费在线精品一区| 国产情侣一区| 亚洲欧洲日韩综合| 国产精品福利影院| av一级在线观看| 亚洲国产第一页| 亚洲第一图区| 成人黄色短视频在线观看| 女人av一区| 日本日本19xxxⅹhd乱影响| 国产麻豆精品theporn| 免费看91的网站| 色婷婷精品久久二区二区蜜臂av| 狠狠人妻久久久久久综合麻豆| 精品国产一区二区三区四区在线观看 | 国产一区高清视频| 欧美日韩精品免费观看视频完整| 色戒在线免费观看| 久久精品网站免费观看| 国产精品777777| 亚洲精品www| 国产美女情趣调教h一区二区| 成人有码在线视频| 欧美jizz| 国产女同无遮挡互慰高潮91| 国产精品天干天干在线综合| 黄色片视频免费| 亚洲精品日韩久久久| 中文字幕高清在线播放| 国产一区再线| 国产精品久久久久久久久久妞妞| 国产xxxxxxxxx| 亚洲成av人在线观看| 国 产 黄 色 大 片| 久久久久久国产精品久久| 91精品尤物| 欧洲精品一区二区三区久久| 丁香桃色午夜亚洲一区二区三区| 久久精品一区二区三| 日韩精品在线一区| 免费男女羞羞的视频网站在线观看| 91成人免费看| 禁久久精品乱码| 色噜噜在线观看| 色婷婷综合五月| av黄色在线观看| 成人在线观看视频网站| 中文字幕一区二区精品区| 亚洲国产综合av| 亚洲国产wwwccc36天堂| 天天综合天天综合| 日韩av电影在线播放| 欧美熟乱15p| 天堂在线一区二区三区| 亚洲综合色网站| 天天干天天色天天| 国产不卡精品视男人的天堂| 日本一区二区三区视频| 亚洲女人在线观看| 午夜不卡av在线| 国产香蕉在线| 成人午夜在线视频一区| 欧美在线精品一区| 男男做爰猛烈叫床爽爽小说| 91久久精品日日躁夜夜躁欧美| 在线观看的av| 亚洲在线免费视频| 国产模特精品视频久久久久| 日本黄色激情视频| 亚洲白虎美女被爆操| 快播电影网址老女人久久| 吴梦梦av在线| 99久久免费精品| 在线观看一二三区| 久久久亚洲国产| 精品美女久久久| 国产精品偷伦视频免费观看了| 欧美日韩午夜剧场| 免费在线毛片网站| 精品免费一区二区三区蜜桃| 免费观看成人鲁鲁鲁鲁鲁视频| 精品深夜av无码一区二区老年| 亚洲精品小视频| 久久精品一级| 国产免费视频传媒| 亚洲图片自拍偷拍| 成年人在线免费观看| 黄色91av| 国产精品乡下勾搭老头1| 无码免费一区二区三区| 欧美黑人性生活视频| 日韩免费看片|