精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

階躍公開了自家新型注意力機制:KV緩存消耗直降93.7%,性能不減反增

人工智能 新聞
MFA 用最簡潔的設計帶來了最顯著的提升,在不增加額外工程復雜度的前提下,優雅地解決了 LLM 的高效推理顯存瓶頸問題,并能無縫集成到現有的 Transformer 生態中。

隨著當前大語言模型的廣泛應用和推理時擴展的新范式的崛起,如何實現高效的大規模推理成為了一個巨大挑戰。特別是在語言模型的推理階段,傳統注意力機制中的鍵值緩存(KV Cache)會隨著批處理大小和序列長度線性增長,儼然成為制約大語言模型規模化應用和推理時擴展的「內存殺手」。

雖然業界已有 MQA、GQA、MLA 等多種注意力機制變體試圖解決這一問題,但這些方案要么難以在嚴格的顯存限制下保持理想性能,要么在模型結構上引入額外復雜度,帶來巨大的工程挑戰和生態兼容性問題。

在近期由階躍星辰、清華大學等機構完成的論文《Multi-matrix Factorization Attention》中,研究人員提出新型注意力機制架構 —— 多矩陣分解注意力(MFA)及其變體 MFA-Key-Reuse,在大幅降低語言模型推理成本的同時,還實現了性能的顯著提升。

圖片

鏈接:https://arxiv.org/abs/2412.19255

實驗中,MFA 和 MFA-KR 不僅超越了 MLA 的性能,還在減少了高達 93.7% 的 KV Cache 使用量的情況下,與傳統的 MHA 性能相當。于此同時,MFA 實現簡單,容易復現,對超參敏感度低,且兼容各種 Pos-embedding。

圖片

圖片

MFA 方法與分析

研究團隊通過研究 Attention 機制的一般性設計和容量分析,明確了 Attention 機制的容量最相關的兩個維度,并且提出了一系列的分析方法和設計原則。

圖片

為了更好地理解注意力機制的本質,研究團隊提出了廣義多頭注意力(GMHA)的概念框架,為理解不同的 MHA 變種注意力機制提供了一個統一的視角。進一步地,研究團隊分別從推理角度研究鍵值的計算和存儲方式,從分解角度探討模型的容量特征。這種創新的分析方法為理解不同策略如何在模型性能和計算效率之間取得平衡提供了全新視角。

在此基礎上,研究者們確立了完全參數化雙線性注意力(FPBA)作為理論上的性能上限標準。他們發現,目前廣泛使用的 MHA 及其各種變體實際上都可以被視為 FPBA 的低秩分解版本。研究團隊在分析現有解決方案時,重點考察了兩個代表性的改進方案:多查詢注意力(MQA)和多頭潛在注意力(MLA)

對于 MQA,研究人員發現它采用了一種更激進的參數共享策略。不同于 MHA 在頭部之間保持獨立的參數,MQA 讓所有注意力頭共享同一組鍵值參數。這種設計雖然將內存使用降到了極低的水平,但可能會影響模型的表達能力。研究團隊指出,這種權衡實際上反映了一個更普遍的設計困境:如何在保持模型性能的同時減少資源消耗。

而對于更新的 MLA 方案,研究人員發現它采用了更為復雜的架構設計。MLA 引入了一個共享的潛在空間,通過在這個空間中進行參數壓縮來節省內存。雖然這種設計看似提供了更大的靈活性(因為中間維度可以設置得更大),但研究團隊的理論分析揭示了一個關鍵問題:模型的實際表達能力仍然受限于最小維度的約束,這意味著 MLA 的設計中增加中間維度并不能真正提升模型的性能上限。

在深入分析現有方案的基礎上,研究團隊提出了一個雄心勃勃的目標:開發一種新的注意力機制,既能最大限度地節省資源,又能盡可能接近理論性能上限。這個目標促使他們開發出了多矩陣分解注意力(MFA)。

MFA 的設計體現了研究團隊的三個關鍵創新:

  • 首先,他們突破傳統設計的局限,顯著增加了注意力頭的數量和維度,極大增加了注意力模塊的模型容量。
  • 其次,研究團隊在矩陣分解方面實現了創新性突破,采用激進的低秩分解策略,成功地在擴展模型注意力頭的數量和維度時保持了極高的參數效率。
  • 最后,研究團隊采用單鍵值頭設計,這個設計確保了即使在增加模型復雜度的情況下,內存使用仍然保持在最低水平。

 圖片

為了進一步分析 MFA 和其他注意力機制的不同,研究團隊提供了一個清晰的對比表格。研究人員首先引入兩個關鍵指標來度量 GMHA 系列模型的容量:模型總有效秩 TER ( Total Effective Rank ) 和 共享隱空間維度 SLSD(Shared latent subspace dim)。總有效秩 TER 定義為注意力頭數量與每個頭部分解秩(Factorization rank per head,簡稱 FRH)的乘積,而共享隱空間維度 SLSD 則代表了所有注意力頭共同使用的隱空間維度,注意到 TER 和  SLSD 越大,模型具有更高的容量。同時注意到每個頭的分解秩(FRH)不超過 SLSD,而 KV Cache 的占用受制于 FRH 和 SLSD 之間的較大值,這構成了容量和效率之間的關鍵權衡。

通過這個框架進行分析,可以發現與 MQA 相比,MFA 同時實現了更高的 SLSD 和更高的 TER;與 MLA 相比,在相似的參數預算下,MFA 不僅達到了更小的 KV cache 尺寸,還實現了更高的 TER,同時保持了相當的 SLSD;與傳統的 MHA 相比,雖然 MFA 的 SLSD 較小,但它的 TER 更高,這解釋了為什么在實驗中 MFA 能夠獲得更好的性能。

實驗結果

為了研究新架構在可能的更大規模上的表現,研究團隊開展了一系列深入的擴展性實驗,系統地測試了從 1B 到 7B 參數的不同規模的模型,訓練數據量從 10B 擴展到 1T。在性能擴展方面,研究團隊的 MFA 方案展現出與傳統 MHA 完全相當的擴展能力。這意味著,即使在更大規模下,MFA 依然能保持其優異的性能。而 MFA-KR 雖然在性能上略有降低,但其擴展趨勢與 MHA 保持一致。而隨著模型規模的增加,MFA 和 MFA-KR 在內存節省方面的優勢不僅得到保持,還呈現出進一步擴大的趨勢。在最大規模模型上,MFA 實現了 87.5% 的內存節省,而 MFA-KR 更是將內存使用降低到原來的 6.25%。

 圖片

研究人員還進行了一系列的消融實驗,證明 MFA 和 MFA-KR 的設計的有效性,并在其他的主流的位置編碼上也驗證了 MFA 和 MFA-KR 的性能優勢。

圖片

圖片

展望

MFA 用最簡潔的設計帶來了最顯著的提升,在不增加額外工程復雜度的前提下,優雅地解決了 LLM 的高效推理顯存瓶頸問題,并能無縫集成到現有的 Transformer 生態中。這種簡單而強大的創新,必將加速大語言模型在更多場景中的落地應用。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-25 10:21:15

2025-07-23 09:05:00

2024-12-04 09:25:00

2018-08-26 22:25:36

自注意力機制神經網絡算法

2023-12-26 12:03:52

AI模型

2024-09-19 10:07:41

2025-09-29 18:51:01

2024-12-17 14:39:16

2025-05-16 10:17:54

2024-10-31 10:00:39

注意力機制核心組件

2024-06-28 08:04:43

語言模型應用

2024-12-05 09:00:00

2025-02-19 09:18:04

2024-12-09 00:00:10

2020-09-17 12:40:54

神經網絡CNN機器學習

2024-12-05 16:19:14

2024-08-28 17:36:35

AI模型開發

2024-11-04 10:40:00

AI模型

2025-10-16 09:00:00

大模型

2023-05-05 13:11:16

點贊
收藏

51CTO技術棧公眾號

日韩欧美国产成人精品免费| 中文视频一区视频二区视频三区| 久久久久亚洲av成人毛片韩| 国产一区不卡| 日韩一区二区三区三四区视频在线观看| 8x8x华人在线| 国产一二三区在线视频| 国产尤物一区二区在线| 91av福利视频| 美女的奶胸大爽爽大片| 羞羞答答一区二区| 日韩西西人体444www| 国产精品动漫网站| 中文字幕中文字幕在线十八区| 久久夜色精品国产噜噜av| 91麻豆国产语对白在线观看| 黄色在线免费观看| 欧美ab在线视频| 一区二区三区视频观看| 性折磨bdsm欧美激情另类| 99久久婷婷国产综合精品首页 | 69174成人网| 无码人妻丰满熟妇精品| 狠狠入ady亚洲精品| 中文字幕欧美视频在线| 国产精品无码永久免费不卡| 欧美高清hd| 欧美日本免费一区二区三区| 激情综合网婷婷| а√天堂中文在线资源8| 中文字幕中文字幕在线一区| 日韩精品久久一区| 香蕉视频成人在线| 成人免费视频播放| 5566av亚洲| 99精品免费观看| 精品一区二区免费看| 国产mv久久久| 日韩综合在线观看| 国产一区二区你懂的| 欧美黑人国产人伦爽爽爽| av成人免费网站| 99久久久久国产精品| 在线观看视频99| 先锋影音av在线| 激情综合网五月| 日韩电影第一页| 黄色录像a级片| 女同久久另类99精品国产| 精品免费视频一区二区| 久草免费资源站| 亚洲日本va午夜在线电影| 4hu四虎永久在线影院成人| 伊人成人222| 国产精品麻豆| 欧美一区二区三区视频在线| 看看黄色一级片| 日韩福利影视| 日韩一区二区三区在线| 亚洲制服中文字幕| 久久久久久亚洲精品美女| 日韩亚洲欧美中文三级| 网站在线你懂的| 亚洲3区在线| 亚洲福利视频网| 欧美一区二区三区成人精品| 激情五月综合网| 久久精品久久久久久| 欧美日韩中文字幕在线观看| 亚洲手机视频| 琪琪亚洲精品午夜在线| 91视频在线视频| 久久国产精品露脸对白| 91最新国产视频| 免费激情视频网站| 久久久久久久综合| 在线观看福利一区| 日本一本在线免费福利| 精品久久香蕉国产线看观看亚洲| 18禁免费无码无遮挡不卡网站| 中文字幕永久有效| 欧美制服第一页| 免费日韩av电影| 天天干,天天操,天天射| 2021国产精品久久精品| 亚洲ai欧洲av| 性xxxxfjsxxxxx欧美| 午夜久久久久久电影| 亚洲人成色77777| 日韩国产大片| 亚洲国产精品久久久久| 亚洲午夜久久久久久久国产| 欧美在线91| 日本韩国在线不卡| 97精品人妻一区二区三区在线 | 91美女福利视频高清| 精品捆绑美女sm三区| 潘金莲一级淫片aaaaa免费看| 成人在线影视| 午夜av区久久| 中文字幕欧美国产| 国产精品国语对白| 国产强伦人妻毛片| 91看片淫黄大片一级在线观看| 五月天色一区| 国产福利片在线观看| 欧美日韩视频在线第一区| 久久黄色一级视频| 欧美偷拍自拍| 国内揄拍国内精品| 国产又粗又大又爽| 久久夜色精品国产欧美乱极品| 国产成人三级视频| 都市激情亚洲一区| 精品美女在线播放| 男人晚上看的视频| 免费看亚洲片| 成人在线免费观看一区| 欧洲日本在线| 日本高清视频一区二区| 日本性生活一级片| 一区二区电影在线观看| 国产精品激情自拍| 日韩私人影院| 亚洲成人黄色影院| 最好看的中文字幕| 亚洲91视频| 国产精品久久一区| 免费一级在线观看播放网址| 亚洲国产日韩a在线播放性色| 污污的视频免费观看| 欧美日韩国产传媒| 国产成人精品国内自产拍免费看| 色偷偷在线观看| 亚洲国产欧美在线人成| 91亚洲一线产区二线产区| 亚洲欧美日韩高清在线| 91精品国产综合久久香蕉最新版 | 极品少妇xxxx偷拍精品少妇| 欧美日韩在线高清| 中文字幕资源网在线观看免费| 精品av久久707| 九九热精彩视频| 国产精品一区免费视频| 国产免费xxx| 国产专区精品| 久久网福利资源网站| 中文字幕在线播放日韩| 国产午夜亚洲精品午夜鲁丝片| 少妇性饥渴无码a区免费| 欧美亚洲色图校园春色| 97在线视频一区| 欧美套图亚洲一区| 欧美午夜精品久久久久久人妖| 亚洲一区二区三区综合| 99精品国产一区二区青青牛奶| 国产精品免费在线 | 一区二区三区四区五区视频在线观看| 污污的视频免费| 欧美影视一区| 国产精品免费在线| 国产精品论坛| 亚洲免费视频网站| 免费看污视频的网站| 国产欧美一区二区精品性| 四季av一区二区| 久久精品国产www456c0m| 成人av在线网址| caoporm免费视频在线| 日韩欧美精品在线视频| 国产午夜精品无码| 久久这里只有精品6| 美女黄色片视频| 97国产精品| 亚洲成a人v欧美综合天堂下载| 免费无码不卡视频在线观看| 亚洲人成网亚洲欧洲无码| 国产精品久久一| gogogogo高清视频在线| 日韩av中文在线| 中文字幕免费观看视频| 亚洲精品中文在线观看| 性色av蜜臀av色欲av| 人人爽香蕉精品| 国产在线观看欧美| 免费成人av| 亚洲直播在线一区| 性孕妇free特大另类| 日韩激情视频在线| 欧美国产一级片| 一区二区三区在线观看国产 | 久久久精品国产99久久精品芒果| 三级视频中文字幕| 激情综合亚洲| 亚洲永久一区二区三区在线| 97成人在线| 国产精品久久久久久久久免费看| 18视频在线观看网站| 亚洲热线99精品视频| 国产精品久久久久久无人区| 欧美日韩亚洲成人| 日日噜噜夜夜狠狠久久波多野| 99久久精品免费| 特级黄色片视频| 久久精品网址| 成人免费在线网| 99久久影视| 欧美精品一区二区三区在线看午夜 | 无人码人妻一区二区三区免费| 国产亚洲毛片| 777久久精品一区二区三区无码 | 91黄色在线看| 久久国产亚洲| 日本免费高清一区| 精品三级在线观看视频| 91亚洲精品视频| 国产极品久久久久久久久波多结野 | 欧美黑人3p| 精品少妇3p| 成人av播放| 91嫩草国产线观看亚洲一区二区| 日韩av观看网址| 国产精品一区二区日韩| 欧美高清在线视频观看不卡| 在线免费看a| 国产亚洲欧洲高清| 久草在现在线| 亚洲黄色片网站| 久久91超碰青草是什么| 欧美午夜激情影院| 99精品欧美一区二区三区综合在线| 久久久久久久久久一区| 天堂在线一区二区| 国产超级av在线| 日韩视频中文| 男人日女人视频网站| 欧美激情91| 国产日韩欧美大片| 一本一道久久综合狠狠老| 在线看成人av电影| 99久久精品费精品国产| 在线视频不卡一区二区| 欧美激情电影| 一本久道久久综合| 欧美丰满老妇| 亚洲欧美丝袜| 久久香蕉国产| 在线免费一区| 久久精品欧美一区| 777久久精品一区二区三区无码 | 午夜精品视频在线观看一区二区| 成午夜精品一区二区三区软件| 91视频88av| 国产一区二区三区免费观看在线| 成人中文字幕在线观看| 精品午夜av| 国产精品区一区| 久久1电影院| 久久av一区二区| 亚洲丝袜啪啪| 亚洲人久久久| 欧美一区二区三区免费看| 欧美与动交zoz0z| 欧美午夜a级限制福利片| 人体内射精一区二区三区| 亚洲一区二区三区免费在线观看 | 国产乱码精品一品二品| wwwxxxx在线观看| www.成人网.com| 久久只有这里有精品| 国产精品理论在线观看| 天天看片中文字幕| 天天操天天干天天综合网| 五月天激情国产综合婷婷婷| 欧美在线免费观看亚洲| 国产精品一区二区黑人巨大| 精品成人a区在线观看| 牛牛澡牛牛爽一区二区| 色偷偷9999www| 182在线视频观看| 国产精品吹潮在线观看| 日本精品在线观看| 久久综合色一本| 91精品高清| 毛片在线视频播放| 久久狠狠亚洲综合| 美女扒开腿免费视频| 国产视频一区二区三区在线观看| 中国毛片直接看| 懂色aⅴ精品一区二区三区蜜月| 日韩美一区二区| 日韩一区二区三| 九色视频在线观看免费播放| 欧美成人精品不卡视频在线观看| 自拍视频在线看| 91亚洲一区精品| 禁果av一区二区三区| 亚洲乱码日产精品bd在线观看| 久久九九国产| 激情综合激情五月| 国产精品色哟哟| 国产成人在线免费观看视频| 欧美男男青年gay1069videost| 无码精品视频一区二区三区| 日韩中文字幕视频在线观看| 人在线成免费视频| 亚洲a∨日韩av高清在线观看| 美女少妇全过程你懂的久久| 97久久国产亚洲精品超碰热| 日韩av一级片| 免费成人深夜夜行p站| 一区二区免费在线| 亚洲影院一区二区三区| 亚洲人在线视频| caoprom在线| 亚洲综合色激情五月| 色狮一区二区三区四区视频| 毛片一区二区三区四区| caoporm超碰国产精品| 1024手机在线视频| 欧美另类变人与禽xxxxx| 欧洲亚洲在线| 91精品国产沙发| 国产精品中文字幕制服诱惑| 亚洲成人av动漫| 人人狠狠综合久久亚洲| 88久久精品无码一区二区毛片| 午夜伊人狠狠久久| 欧洲成人一区二区三区| 欧美精品午夜视频| 成人污版视频| av电影一区二区三区| 久久er99热精品一区二区| 免费看裸体网站| 91黄色在线观看| 欧美女同网站| 日本精品中文字幕| 免费看av成人| 日韩 欧美 高清| 国产欧美一区二区三区鸳鸯浴| 亚洲GV成人无码久久精品| 日韩电影中文字幕一区| 樱花草涩涩www在线播放| 精品视频高清无人区区二区三区| 一本不卡影院| 人妻大战黑人白浆狂泄| 在线视频综合导航| 成av人电影在线观看| 国产精品美女呻吟| 欧美第一精品| 久草福利在线观看| 亚洲午夜精品在线| 人妻无码一区二区三区久久99| 欧美激情在线有限公司| 超碰97成人| 欧美视频在线播放一区| 久久久.com| 亚洲天堂2021av| 久久中文字幕视频| y111111国产精品久久久| jizzjizz国产精品喷水| 国产亚洲污的网站| 在线观看国产黄| 欧美精品在线视频观看| 好吊妞视频这里有精品| 免费观看日韩毛片| 国产精品女人毛片| 国产黄色片免费| 77777亚洲午夜久久多人| 国产一区二区观看| www,av在线| 午夜视频一区二区| 国产高清在线| 亚洲精品日韩av| 一本一本久久| 国产第一页精品| 精品国产亚洲在线| av激情成人网| 久操手机在线视频| 91麻豆视频网站| 一级淫片免费看| 久久人人爽人人爽人人片av高请 | 人妻有码中文字幕| 国产精品高潮呻吟久久| 亚洲欧美另类日韩| 国产成人激情视频| 欧美国产日本| 欧美做受高潮6| 日韩一区二区三区电影在线观看| 欧美久久天堂| 在线观看成人免费| 国产无人区一区二区三区| 国产黄a三级三级看三级| 日本亚洲欧美成人| 欧美日韩调教| 国产真人真事毛片视频| 亚洲黄色www| 91久久青草| 亚洲精品视频导航| 午夜电影网一区|