精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek的MLA,任意大模型都能輕松遷移了

人工智能 新聞
復旦 NLP 實驗室、華東師大、上海 AI Lab、??低暵摵咸岢?MHA2MLA 框架。

復旦 NLP 實驗室博士后紀燾是這篇文章的第一作者,研究方向為大模型高效推理、多模態大模型,近期代表工作為首個NoPE外推HeadScale、注意力分塊外推LongHeads、多視覺專家大模型MouSi,發表ACL、ICLR、EMNLP等頂會頂刊論文 20 余篇。

DeepSeek-R1 作為 AI 產業顛覆式創新的代表轟動了業界,特別是其訓練與推理成本僅為同等性能大模型的數十分之一。多頭潛在注意力網絡(Multi-head Latent Attention, MLA)是其經濟推理架構的核心之一,通過對鍵值緩存進行低秩壓縮,顯著降低推理成本 [1]。

然而,現有主流大模型仍然基于標準注意力架構及其變種(e.g., MHA, GQA, MQA),推理成本相比 MLA 呈現顯著劣勢。使預訓練的任意 LLMs 快速遷移至 MLA 架構而無需從頭預訓練,這既有重大意義又具有挑戰性。

復旦 NLP 實驗室、華東師大、上海 AI Lab、??低暵摵咸岢?MHA2MLA 框架,通過部分 RoPE 保留(Partial-RoPE)鍵值聯合表示低秩近似(Low-rank Approximation)兩個關鍵步驟,成功將任意 MHA/GQA 架構遷移到 MLA。

圖片

目前,MHA2MLA 已位列??alphaXiv 熱度榜??

復旦 NLP 實驗室博士后紀燾為第一作者,副研究員桂韜為通訊作者。

圖片

論文概覽

本文聚焦如何將預訓練的基于 MHA/GQA 的大語言模型高效遷移到 DeepSeek 提出的經濟推理架構 —— 多頭潛在注意力(MLA)。

MHA 與 MLA 在多處存在差異,使得 MHA2MLA 極具挑戰:

  1. 位置編碼不同:MHA 采用全維度位置編碼(PE),MLA 僅少量維度采用 PE,剩余維度則 PE 無關
  2. 緩存對象不同:MHA 緩存分離的鍵向量及值向量,MLA 緩存帶 PE 的鍵向量及 PE 無關的鍵值聯合低維表示向量
  3. 參數矩陣不同:MHA 包含查詢、鍵、值三個線性變換矩陣,MLA 則更加復雜、多達七個目的不同的線性變換矩陣
  4. 運算形式不同:MHA 的運算受限于訪存瓶頸,MLA 則能通過矩陣吸收等優化實現更高的訪存效率

本文提出的 MHA2MLA 為了最大化利用 MHA 預訓練參數矩陣并對齊 MLA 的緩存對象和運算形式,首先通過部分 RoPE 保留(Partial-RoPE)分離出 PE 相關表示(少量維度,如 1/8)和 PE 無關表示(大量維度),其中 PE 相關的鍵向量對齊 MLA。其次拼接值的變換矩陣(W_v)和 PE 無關的鍵的變換矩陣(W_{k, nope}),并進行 SVD 分解得到降維變換矩陣和升維變化矩陣,中間的鍵值聯合低秩表示對齊 MLA,完成了緩存對象的對齊以及運算形式的對齊。

圖片

在 135M~7B 上的實驗表明,僅需使用預訓練數據的 0.3% 到 0.6% 進行高效微調,即可基本還原架構遷移帶來的性能損失。并且 MHA2MLA 還能結合其他高效推理技術,例如結合 4-bit KV 緩存量化,Llama2-7B 減少了 92.19% KV 緩存,而 LongBench 上的性能僅下降 0.5%。

部分 RoPE 保留(Partial-RoPE)

為了實現從標準的 MHA(多頭注意力機制)到 MLA(多頭潛在注意力機制)的遷移,作者提出了部分 RoPE 微調(partial-RoPE finetuning)策略,該策略通過從大量維度中移除 RoPE(旋轉位置編碼)并將其轉換為 NoPE(無位置編碼)來解決 MLA 和 RoPE 沖突的問題。

圖片

作者主要嘗試了四種移除 RoPE 的策略:1)保留高頻位置信息 S_high,該方法最簡單直接,保留了局部語義特征相關的高頻特征 [2];2)保留低頻位置信息 S_low,與保留高頻位置信息的策略形成對比,檢驗低頻成分在語義理解任務中的潛在作用;3)均勻采樣策略 S_uniform,等間隔均勻采樣頻率保留位置頻率;4)使用查詢、鍵向量范數乘積 (2-norm) 近似注意力貢獻值 [2] 的篩選策略 S_{2-norm},針對每個注意力頭,計算所有頻率的平均 2-norm 分數,隨后選擇得分較高的頻率保留位置信息。該策略能自適應識別對模型性能關鍵的特征頻率。

圖片

圖片

Partial-RoPE 的消融實驗表明:1)保留低頻位置信息的 S_low 導致了最大的性能損失,保留高頻位置信息的 S_high 導致的性能損失明顯小于保留低頻,說明了高頻維度的重要性;2)S_uniform 和 S_{2-norm} 均展現出更優的性能,分別在 135M 模型和 1.7B 模型上取得了最少的性能損失。最終作者選擇 S_{2-norm} 作為默認配置,是因為注意力貢獻分數較低的維度在結合低秩近似時損失更少。

鍵值聯合表示低秩近似

圖片

圖片

移除了大量維度的 RoPE 之后,MHA2MLA 就可以對值向量和 PE 無關的鍵向量進行低秩近似,從而大幅減少緩存空間。為最大化保留預訓練知識,本文提出兩種基于奇異值分解 (SVD) 的投影矩陣初始化策略:1)SVD_split,分別對矩陣進行低秩分解,保持各自的表征特性;2)SVD_joint,考慮鍵值矩陣之間的關聯性,參數矩陣拼接后整體進行低秩分解。

消融實驗表明:無論是在 GQA 基座還是 MHA 基座上,SVD_joint 方法始終優于 SVD_split 方法。

實驗結果

作者在多種規模的語言模型(SmolLM-135M/360M/1B7 和 Llama2-7B)以及不同壓縮比例的配置下評估了所提出的方法。實驗表明:1)相同微調設置下,壓縮比例越高,性能損失越大,特別是對于兩個 GQA 模型;2)相同壓縮比例下,原始模型參數越多,性能損失越小,揭示了 MHA2MLA 的潛在 scaling law。3)MHA2MLA 的微調數據量僅需預訓練數據的 0.3%~0.6%,避免了從頭預訓練 MLA 模型的高昂成本。

作者在 LongBench 長文本生成任務中評估了結構遷移后的 Llama2-7B 模型,將 KV 緩存量化作為基準對比方案。實驗表明,MHA2MLA 能在 d_{kv}=16 的情況下實現與 2-bit 量化相同的壓縮比例(87.5%),同時僅損失一半的性能(-3.0% vs. -6.2%);進一步結合 4-bit 量化后,不僅壓縮比例超過 2-bit 量化,性能損失也都優于所有 2-bit 的基線方法,例如 92.19% 壓縮比例僅掉 0.5%,96.87% 壓縮比例僅掉 3.2%,證明了 MHA2MLA 能顯著減少推理時的訪存瓶頸。

總結與展望

本文主要研究如何將基于 MHA 的預訓練 LLMs(或其變體)適配為 KV 緩存高效的 MLA 架構,以顯著降低推理時的訪存瓶頸。通過精心的架構設計,MHA2MLA 僅需 0.3% 至 0.6% 預訓練數據。該框架展現了與現有壓縮技術的強兼容性,同時保持了常識推理和長上下文處理能力,為部署資源高效的 LLMs 提供了一條實用路徑。

作者提到該研究受限于硬件條件,當前實驗未能覆蓋 Llama3 等需 128K 長上下文微調的模型,也未突破 7B 參數規模的驗證瓶頸。擴展至更多的基座將作為未來工作之一。作者還計劃結合參數高效微調策略,進一步降低架構遷移過程中的參數更新規模。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-10 00:00:55

MHAValue向量

2025-02-24 11:31:33

2014-04-08 15:27:57

Windows Ser

2025-05-08 08:10:25

大模型DeepSeekAPI

2025-03-06 07:28:31

DeepSeek大模型人工智能

2025-02-13 08:30:11

2025-02-26 13:45:00

2022-02-28 17:57:44

云遷移云計算

2022-02-28 22:58:04

云遷移IT開發

2025-02-25 10:03:20

2025-02-20 09:27:46

2025-09-08 08:49:00

2025-02-28 12:32:42

2024-08-13 15:40:00

2025-07-04 16:50:07

工具AI模型

2023-11-30 08:15:58

模型結構化

2025-03-03 10:00:00

2025-04-03 15:40:41

機器學習大模型DeepSeek

2020-08-28 10:01:08

AndroidPC手機屏幕

2025-02-24 11:32:57

點贊
收藏

51CTO技術棧公眾號

韩国精品视频在线观看 | 91精品国产乱码久久久久久蜜臀| 欧美老少配视频| 男人添女人下面高潮视频| 麻豆网址在线观看| 一呦二呦三呦精品国产| 成人av高清在线| 欧美乱人伦中文字幕在线| 漂亮人妻被黑人久久精品| 久草免费在线观看| 波多野结衣在线观看一区二区三区| 国产亚洲一区字幕| 国自产精品手机在线观看视频| 欧美图片激情小说| 国产精品主播一区二区| 日韩av密桃| 色偷偷成人一区二区三区91| 久久久亚洲综合网站| 日韩欧美高清在线观看| 大奶在线精品| 亚洲国产一二三| 国产精品.com| 日韩成年人视频| 欧美xxxx在线| 色94色欧美sute亚洲线路一久| 国产精品永久免费观看| 精品人妻无码一区| 国产精品久久久久77777丨| 中文字幕免费不卡在线| 国产欧美一区二区三区久久人妖| 亚洲制服在线观看| 婷婷在线视频观看| 国内精品伊人久久久久影院对白| 亚洲激情视频在线播放| 激情深爱综合网| 日本a一级在线免费播放| 久久久亚洲人| 日韩在线观看你懂的| 999久久久精品视频| 老司机在线永久免费观看| 久久99精品久久久久久国产越南| 亚洲精品电影网| 6080国产精品| 91高清视频在线观看| 91丨九色丨蝌蚪丨老版| 日本久久精品视频| jizzjizzjizz国产| 日韩一区网站| 日韩欧美国产激情| 久久免费看毛片| 乱色精品无码一区二区国产盗| 国产精品国产三级国产在线观看| 天天影视涩香欲综合网| 欧美大香线蕉线伊人久久| 久久久久久国产精品免费播放| 97成人超碰| 色综合天天综合色综合av | 三区在线视频| youjizz国产精品| 国产成人在线精品| www色aa色aawww| 伦理一区二区| 欧美精选在线播放| 欧美视频免费看欧美视频| 精品av中文字幕在线毛片| 国产一区二区91| 国产福利视频一区二区| 精品国产xxx| 欧美国产91| 亚洲免费精彩视频| 亚洲国产欧美91| 精品视频在线播放一区二区三区| 中文字幕一区二| 精品国产_亚洲人成在线| 中文字幕人妻丝袜乱一区三区| 日韩三区视频| 欧美日韩视频一区二区| 国产真实老熟女无套内射| 人妖欧美1区| 国产精品色哟哟| 久久久久久久久久久一区 | 免费成人在线观看视频| 久久精品视频亚洲| 熟女俱乐部一区二区| 麻豆一区在线| 日韩av影院在线观看| 国产农村妇女精品久久| 欧美视频二区欧美影视| 亚洲国产精品人人爽夜夜爽| 黄色aaa视频| 国产电影一区二区在线观看| 午夜精品国产精品大乳美女| 中文字幕在线观看2018| 欧美日韩国产精品一区二区亚洲| 日韩欧美综合一区| 男女视频在线看| 国产丝袜视频在线播放| 亚洲欧美日韩国产另类专区| 免费毛片一区二区三区久久久| 精品国产区一区二| 六月丁香综合在线视频| 国产成人一区二区| 国产精品久久久久久久久毛片| 日本视频在线一区| 青青a在线精品免费观看| 五月天婷婷丁香| 日本不卡一区二区| 国产精品一区视频| 精品国自产拍在线观看| 久久综合色播五月| 久久99精品久久久久久久青青日本| 精品久久久久久亚洲综合网站| 美国欧美日韩国产在线播放| 国产精品国产精品国产专区不卡| a天堂中文在线观看| 久草热8精品视频在线观看| 精品日本一区二区三区在线观看| 三级网站在线看| 成人一级视频在线观看| 97免费高清电视剧观看| 精品国产免费无码久久久| 久久先锋影音av| 妞干网视频在线观看| 欧美hdxxx| 欧美精品九九99久久| 在线免费观看黄色小视频| 欧美日韩播放| 日韩在线视频二区| 一级片视频在线观看| 成人av在线一区二区三区| 色呦呦网站入口| 女人天堂av在线播放| 欧美日韩国产123区| 午夜不卡福利视频| 精品免费av| 日韩在线观看免费| 久久久久黄色片| 精品一区二区免费在线观看| 日产精品高清视频免费| 欧美激情免费| 欧美性猛片xxxx免费看久爱| 爽爽爽在线观看| 波多野结衣在线观看一区二区三区| 久久成人国产精品| 九九免费精品视频| 亚洲欧美成人综合| 国产日韩精品在线播放| 成年在线观看免费人视频| 亚洲色图另类专区| 免费拍拍拍网站| 亚洲综合色婷婷在线观看| 国产丝袜一区二区三区免费视频 | 亚洲国产精品午夜在线观看| 国产高清不卡一区| 久久综合给合久久狠狠色| 川上优av中文字幕一区二区| 日韩欧美主播在线| 中文字幕在线1| 欧美jjzz| 高清国产在线一区| 国产不卡123| 亚洲美女久久久| 中国黄色一级视频| 最新国产精品久久精品| 免费国产黄色网址| 久久99精品久久久久久欧洲站| 色哟哟亚洲精品一区二区| 中文字幕男人天堂| 亚洲视频精选在线| 国产国语老龄妇女a片| 精品一区三区| 国产精品久久91| 日本精品一二区| 中文字幕日韩av资源站| 日本黄色一级网站| 亚洲国内欧美| 91在线视频一区| 色欲av伊人久久大香线蕉影院| 国产欧美日韩在线| 久久久天堂国产精品| 日韩a**中文字幕| 久久精品国产亚洲7777| 免费观看a视频| 欧美视频专区一二在线观看| 日本黄区免费视频观看| 国产成人精品一区二区三区网站观看| 亚洲春色在线视频| 国产乱码精品一区二三赶尸艳谈| 欧美精品 国产精品| 久久久久久久中文字幕| 国产亚洲精品aa| 欧美日韩久久婷婷| 午夜影院日韩| 日本女人高潮视频| 亚洲国产aⅴ精品一区二区三区| 欧美剧情片在线观看| 青青草精品在线视频| 久久激情综合网| 人体内射精一区二区三区| 欧美在线电影| 91一区二区三区| 久久久一本精品| 亚洲欧美日韩第一区| 91精品视频免费在线观看| 中文字幕的久久| 永久免费未满蜜桃| 精品夜夜嗨av一区二区三区| 欧美日韩一道本| 欧美成人一品| 亚洲精品一区二区三区蜜桃久 | 5g影院天天爽成人免费下载| 天堂av在线| 精品无人区太爽高潮在线播放| 欧美片一区二区| 欧美国产国产综合| 99re久久精品国产| 午夜亚洲精品| 被灌满精子的波多野结衣| 久久免费精品视频在这里| 91精品免费久久久久久久久| 高清全集视频免费在线| 日韩情涩欧美日韩视频| 中文字幕一区二区在线视频| 性做久久久久久免费观看| 国产日韩视频一区| 精品一区二区国语对白| 日韩无套无码精品| 水蜜桃精品av一区二区| 欧美另类视频在线| 欧美天堂社区| 国产无套精品一区二区| 成人做爰视频www网站小优视频| 影音先锋欧美精品| 国产精品特级毛片一区二区三区| 亚洲欧美日韩国产一区二区三区 | 精品黑人一区二区三区| 国产日韩欧美高清| 北岛玲一区二区| 粉嫩在线一区二区三区视频| 欧美 丝袜 自拍 制服 另类| 精品成人在线| 日韩激情视频| 久久不见久久见免费视频7| 精品一区久久| 全球av集中精品导航福利| 国产日韩欧美综合精品| 精品深夜福利视频| 久久青青草原| 精品国产91| 日本一区二区精品| 亚洲精品aⅴ| 亚洲自拍偷拍第一页| 136国产福利精品导航网址应用| 欧美最猛性xxxx| 亚洲欧洲高清| 国产成人免费91av在线| 欧美videos粗暴| 亚洲va久久久噜噜噜| 久久精品一级| 国产伦精品一区二区三区免| 国产精品中文字幕制服诱惑| 精品婷婷色一区二区三区蜜桃| 欧美一区=区三区| 成人精品久久久| 日韩中文字幕无砖| 国产精品免费一区二区三区| 激情小说亚洲色图| 日本一区高清不卡| 久久视频精品| 精品国产av无码一区二区三区| 99精品视频精品精品视频| 最新欧美日韩亚洲| 欧美久久成人| 波多野结衣乳巨码无在线| 日韩成人一区二区三区在线观看| 日韩资源av在线| 高清不卡一区| 国产suv精品一区二区| 91成人抖音| 亚洲自拍偷拍色图| 日韩高清三区| 亚洲人成网站在线播放2019| 亚洲另类av| 精品日韩欧美| 日韩综合网站| 超碰成人免费在线| 日日骚欧美日韩| 久草视频福利在线| 欧美高清在线视频| 久久午夜鲁丝片午夜精品| 色婷婷国产精品综合在线观看| 日本午夜视频在线观看| 亚洲国产精品影院| 久久久久久久久97| 91福利国产精品| 国产a级免费视频| 亚洲日本欧美日韩高观看| 欧美一区二区视频| 欧美成aaa人片在线观看蜜臀| 天天色天天操天天射| 国产一区二区三区免费视频| 青青青草原在线| 久久久精品美女| 波多视频一区| 国产精品成人免费视频| 精品久久免费| 亚洲成人网上| 噜噜噜91成人网| 啊啊啊国产视频| 日本v片在线高清不卡在线观看| 久久久久狠狠高潮亚洲精品| 在线观看日韩av电影| www.夜夜爽| 久久久精品天堂| 欧洲美熟女乱又伦| 亚洲成年人影院| 国产麻豆免费观看| 欧美本精品男人aⅴ天堂| 色婷婷av一区二区三区之红樱桃 | 黄视频在线播放| 久久久久久久成人| av电影免费在线看| 91九色国产视频| 欧美电影一区| 一区二区三区免费播放| thepron国产精品| 久久av高潮av无码av喷吹| 6080亚洲精品一区二区| 国产黄色免费大片| 精品国内产的精品视频在线观看| 成人在线免费看黄| 国产精品日韩在线播放| 日韩欧国产精品一区综合无码| 成人午夜在线视频一区| 日本一区二区高清不卡| 国产精品亚洲αv天堂无码| 成人h动漫精品一区二| 久久国产露脸精品国产| 欧美一区二区观看视频| 人妻少妇精品无码专区| 欧美激情高清视频| av电影一区| 久久久久久久有限公司| 一区二区三区四区五区精品视频| 亚洲一区 在线播放| 一区二区三区国产在线| 女同性恋一区二区三区| 五月天视频一区| 性感美女福利视频| 日韩网站免费观看高清| 免费在线成人激情电影| 国产欧美亚洲日本| 日韩亚洲精品在线| 波多野吉衣中文字幕| 在线一区二区视频| 理论片中文字幕| 久久久久久久一区二区| 大奶在线精品| 美女福利视频在线| 欧美经典一区二区| 国产一区二区自拍视频| 欧美精品性视频| 欧美a大片欧美片| 欧美一级片中文字幕| 国产不卡视频在线播放| 日韩欧美激情视频| 国产亚洲精品久久久久久777| 国内老司机av在线| 国产高清自拍一区| 亚洲欧美网站| 久久久久久久久久97| 精品免费国产二区三区| 亚洲风情在线资源| 艳色歌舞团一区二区三区| 国产一区二区精品久久99| 丰满少妇乱子伦精品看片| 最近中文字幕2019免费| 中文在线综合| 日本成人中文字幕在线| 亚洲精品免费电影| 一区二区精品视频在线观看| 欧美裸体xxxx极品少妇| 伊人久久大香线蕉无限次| www.国产视频.com| 中文字幕国产精品一区二区| av加勒比在线| 日本aⅴ大伊香蕉精品视频| 综合激情视频| 久久出品必属精品| 天天综合色天天综合色h| 91高清在线| 国产精品久久久久免费a∨大胸 | 精品亚洲porn| 一级片免费网址| www.日韩.com| 欧美美女黄色| 色黄视频免费看| 在线免费亚洲电影| 丁香花在线影院| 亚洲欧洲在线一区|