精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek-R1秘籍輕松遷移,最低只需原始數據0.3%

人工智能 新聞
他們提出了MHA2MLA這種數據高效的微調方法,使基于MHA(多頭注意力)的大語言模型(LLMs)能夠順利轉換到MLA架構。

DeepSeek-R1背后關鍵——多頭潛在注意力機制(MLA),現在也能輕松移植到其他模型了!

而且只需原始數據的0.3%~0.6%。

這項研究由復旦大學、華東師范大學、上海AI Lab等聯合提出,復旦教授邱錫鵬(Moss大模型項目負責人)也在作者名單之列。

他們提出了MHA2MLA這種數據高效的微調方法,使基于MHA(多頭注意力)的大語言模型(LLMs)能夠順利轉換到MLA架構。

以Llama2-7B為例,MHA2MLA在降低推理成本(如減少KV緩存大小92.19%)的同時,能將性能損失控制在較小范圍(如LongBench性能僅下降0.5%)

具體咋回事,下面我們接著看。

掌握DeepSeek核心秘訣

多頭注意力MHA(Multi-Head Attention)是Transformer架構中的一個核心組件,允許模型同時關注輸入的不同部分,每個注意力頭都獨立地學習輸入序列中的不同特征。

然而,隨著序列長度的增長,鍵值(Key-Value,KV)緩存的大小也會線性增加,這給模型帶來了顯著的內存負擔。

為了解決MHA在高計算成本和KV緩存方面的局限性,DeepSeek突破性地引入了多頭潛在注意力機制MLA。

簡單說,MLA最大創新之處在于:

利用低秩聯合壓縮鍵值技術,減少了推理時的KV緩存,從而在保持性能的同時顯著降低內存占用。

這一技術也被視為DeepSeek-V3、DeepSeek-R1等當紅炸子雞模型背后的關鍵。

而現在,為了進一步降低其他LLMs的推理成本,研究人員開發了一種能將采用MHA的模型快速適配MLA架構的方法——MHA2MLA

這一數據微調方法包含兩個關鍵部分:

  • partial-RoPE,即從對注意力分數貢獻較小的查詢和鍵的維度中移除旋轉位置嵌入(RoPE);
  • 低秩近似,基于預訓練的鍵和值參數引入聯合奇異值分解(SVD)近似。

先說第一個。Transformer架構中,RoPE(旋轉位置編碼,Rotary Position Embedding) 通過旋轉操作將位置信息融入查詢向量Q和鍵向量K ,幫助模型捕捉序列位置關系。

但研究發現,在計算注意力分數時,并非所有維度的RoPE對結果貢獻相同。

換句話說,即使去除那些對注意力分數影響較小的部分維度的RoPE,理論上不會對模型理解上下文的能力造成關鍵影響。

基于此,研究人員通過計算敏感度指標來確定哪些維度的RoPE貢獻較小。

具體而言,對于每個維度,計算RoPE變化時注意力分數的變化程度。一旦變化程度低于特定閾值的維度,即被判定為對注意力分數貢獻小。在后續計算中,這些維度將不再應用RoPE。

最終實驗證明,partial-RoPE這一策略在不顯著影響模型性能的前提下,減少了計算量。

再說低秩近似策略。

該方法基于預訓練的鍵和值參數,引入聯合奇異值分解(SVD)近似。

SVD是一種矩陣分解技術,通過對鍵值矩陣進行SVD分解,可以用低秩矩陣近似原始矩陣,從而減少參數數量。

具體實現中,研究人員首先提取預訓練模型中的鍵和值參數矩陣,對這些矩陣進行聯合SVD分解;然后根據模型的性能和壓縮需求,構建低秩近似矩陣,用這些低秩近似矩陣替代原始的鍵值矩陣參與后續計算。

最終結果顯示,此舉有效降低了模型推理時的計算量和內存占用。

性能幾乎不變,將Llama2 KV緩存減少90%以上

實驗環節也驗證了MHA2MLA方法的有效性。

能在顯著降低推理成本的同時,保持甚至提升模型性能。

研究人員選取了用MHA或GQA預先訓練的不同規模(135M-7B)的LLMs,然后設置了對照組。

一組是基于傳統MHA的原始模型,用于直接對比MHA2MLA方法在相同任務和數據集上的性能表現;另一組是采用分組查詢注意力(GQA)的模型,GQA作為MHA的變體,在一定程度上優化了計算成本,將其與MHA2MLA對比,能更清晰地展現MHA2MLA的優勢。

在評估其常識性推理能力的六個基準測試中,研究發現:

與原始LLMs性能相比,四個基礎模型的性能變化極小,135M模型性能下降0.25%,360M、1B7和7B模型分別有0.03% 、0.03%和0.37%的性能提升或保持。

這表明微調數據未顯著影響原模型性能,MHA2MLA能有效實現架構遷移,而且微調數據僅需預訓練數據的0.3%-0.6%

甚至,較大模型在轉換到MLA架構時性能下降更少,這說明這一方法對規模更大的模型更有效。

此外,在長文本生成能力評估中,以LongBench為基準,MHA2MLA相比訓練后量化方法,在壓縮率和精度平衡上表現出色。

當dkv=16時,MHA2MLA可實現87.5%的壓縮率,精度損失僅3%;與4-bit量化結合后,壓縮率可達92.19%(dkv=64 + Int4HQQ)和96.87%(dkv=16 + Int4HQQ),精度損失分別為-0.5%和-3.2%,優于所有2-bit量化的基線模型

這也反映了MHA2MLA方法能夠與量化技術良好兼容。

綜合以上實驗,可以看到以Llama2-7B為例,MHA2MLA在降低推理成本(如減少KV緩存大小92.19%)的同時,能將性能損失控制在較小范圍(如LongBench性能僅下降0.5%)

不過,論文也提到了研究局限性。

受計算資源限制,未在更大、更多樣化的開源大語言模型上驗證MHA2MLA;且由于Deepseek未開源MLA的張量并行推理框架,難以探索大于7B的模型。

下一步,研究人員計劃在更多模型上進行驗證。

感興趣的童鞋可以查看原論文~

論文:https://arxiv.org/abs/2502.14837
代碼:https://github.com/JT-Ushio/MHA2MLA

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-19 08:00:00

2025-02-19 08:33:18

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-06-12 09:48:27

2025-05-30 06:57:53

2025-03-05 03:00:00

DeepSeek大模型調優

2025-06-06 03:11:00

LangGraphDeepSeek-RRAG

2025-03-27 09:34:42

2025-05-06 09:09:37

2025-02-08 09:44:11

DeepSeekAI模型

2020-11-23 10:25:44

tcpdump數據包Linux

2025-03-17 12:13:26

AI模型生成

2025-02-03 14:17:27

2025-02-13 08:51:23

DeepSeek大模型

2025-02-06 10:18:45

點贊
收藏

51CTO技術棧公眾號

中中文字幕av在线| 国产又大又黑又粗| 欧美精选视频在线观看| 欧美系列一区二区| 大桥未久一区二区| 婷婷久久久久久| 青青草97国产精品免费观看| 久久精品国产久精国产思思| 亚洲精品国产成人av在线| 中文字幕人成乱码在线观看| 亚洲欧洲国产日本综合| 精品高清视频| 国产色片在线观看| 久久精品女人| 欧美激情按摩在线| 麻豆视频免费在线播放| 好吊妞视频这里有精品| 欧美视频中文一区二区三区在线观看| 99热都是精品| 国产无套粉嫩白浆在线2022年| 国产一二精品视频| 2024亚洲男人天堂| www青青草原| 欧美天天综合| 精品视频偷偷看在线观看| 午夜视频在线观| 韩国成人在线| 欧美性猛交xxxxx免费看| 久久久久久久久影视| 福利在线午夜| 久久在线观看免费| 国产99午夜精品一区二区三区 | 国产成人av一区二区三区| 波多野结衣在线观看一区| 亚洲精品123区| 欧美丰满少妇xxxx| 天天鲁一鲁摸一摸爽一爽| 欧美女优在线视频| 亚洲欧美日韩国产中文| 中文视频在线观看| 91综合精品国产丝袜长腿久久| 欧美无砖砖区免费| 欧美日韩在线成人| 伊伊综合在线| 欧美性猛交xxxx免费看漫画| 日韩xxxx视频| 男女羞羞视频在线观看| 亚洲免费观看高清完整版在线| 一区二区三区|亚洲午夜| 国产在线视频网址| 国产日韩一级二级三级| 麻豆亚洲一区| 亚洲 欧美 自拍偷拍| 99在线精品免费| 黄色99视频| 天天干天天干天天干| 本田岬高潮一区二区三区| 成人久久18免费网站漫画| 精品久久久久中文慕人妻| 国产成人av资源| y111111国产精品久久婷婷| 国产黄色av片| www.在线欧美| 欧美精品免费观看二区| 国产主播福利在线| 国产精品美女久久久久久2018| 亚洲高清视频在线观看| 香蕉视频在线看| 伊人性伊人情综合网| 亚洲色欲久久久综合网东京热| 青草影视电视剧免费播放在线观看| 一区二区三区在线视频观看 | 精品久久久久久一区| 少妇高潮一区二区三区69| 91在线小视频| 日韩成人在线资源| 麻豆影视国产在线观看| 一区二区三区免费在线观看| 欧美午夜性视频| 欧美电影免费观看网站| 欧美日韩一区二区三区不卡| 亚洲天堂网2018| 国产成人一二片| 亚洲免费av片| 性欧美疯狂猛交69hd| 伊人精品在线| 国产国语videosex另类| 国产精品伊人久久| 成人av网站在线| 日本在线播放不卡| 午夜dj在线观看高清视频完整版| 午夜成人免费电影| 嫩草视频免费在线观看| youjizz亚洲| 中文字幕日韩欧美| www.99re7.com| 奇米在线7777在线精品| 91丨九色丨国产| 男女视频在线观看免费| 亚洲欧洲日韩综合一区二区| 真人抽搐一进一出视频| jizz亚洲女人高潮大叫| 精品处破学生在线二十三| 亚洲精品国产精品国自产网站| 亚洲九九在线| 国产精品18久久久久久首页狼 | 亚洲欧美国产一区二区三区 | 日韩欧美aⅴ综合网站发布| 一个色综合久久| 首页亚洲中字| 九九久久久久99精品| 伊人中文字幕在线观看| 国产盗摄一区二区三区| 亚洲看片网站| 成人一区福利| 精品国产一区二区国模嫣然| av片在线免费看| 先锋亚洲精品| 国产精品久久久久久久天堂第1集| 都市激情一区| 大伊人狠狠躁夜夜躁av一区| 深夜视频在线观看| 91欧美大片| 国产精品欧美亚洲777777| 日韩在线观看视频一区二区三区| 亚洲毛片av在线| 欧美女同在线观看| 欧美日韩水蜜桃| 欧美最近摘花xxxx摘花| 四虎在线视频免费观看| 亚洲精品老司机| 污免费在线观看| 91日韩视频| 国产精品久久久久久影视| 丝袜视频国产在线播放| 亚洲成人资源在线| 亚洲黄色小说在线观看| 综合久久亚洲| 亚洲精品女av网站| 欧美日韩视频在线播放| 欧美性猛片aaaaaaa做受| 中文字幕 自拍| 久久精品系列| 欧美日韩精品一区| sese综合| 亚洲视频自拍偷拍| 五月婷婷激情五月| 国产精品久久网站| 亚洲另类第一页| 天天射成人网| 成人精品在线观看| 亚洲高清福利视频| 亚洲色图都市激情| 国产精品中文| 欧美日韩第一页| 丰满人妻一区二区| 亚洲狠狠爱一区二区三区| 亚洲av无码一区东京热久久| 韩日在线一区| 精品综合在线| 成人勉费视频| 最近2019中文字幕一页二页| 亚洲综合精品国产一区二区三区| 国产精品久久久久久福利一牛影视 | 秋霞av鲁丝片一区二区| 性做久久久久久| 美女久久久久久久久久| 日韩av电影免费观看高清完整版| 香蕉久久夜色| 国产精品xnxxcom| 久久久久久久一区二区三区| 天堂资源中文在线| 欧美亚洲国产一区二区三区| 日韩三级久久久| 风流少妇一区二区| 男人的天堂99| 91精品啪在线观看国产81旧版| 福利视频一区二区三区| 桃色一区二区| 欧美成人精品在线观看| 午夜性色福利影院| 欧美日韩视频在线一区二区| 青青草免费av| 久久久久99精品一区| 久国产精品视频| 国产精品日本| 中文字幕日韩精品一区二区| 久久综合社区| 国产欧美精品一区二区三区介绍| 男男gaygays亚洲| 亚洲视频第一页| 亚洲风情第一页| 欧洲精品一区二区| 久久婷婷综合国产| 日本一区二区视频在线| 亚洲精品久久一区二区三区777 | 欧美性生交xxxxx久久久| 国产精品1区2区3区4区| 不卡一区二区在线| 国产一级片自拍| 亚洲免费中文| 欧美精品在欧美一区二区| 精品福利久久久| 国产一区二区高清不卡 | 欧美精三区欧美精三区| 日韩成人免费观看| 亚洲女同ⅹxx女同tv| 日韩一级av毛片| 福利一区二区在线观看| jizz18女人| 亚洲一区自拍| 精品人妻少妇一区二区| 91久久久精品国产| 五月天久久综合网| 亚洲精品国产精品粉嫩| 懂色一区二区三区av片| 婷婷久久免费视频| 国产精品av在线| 黄色在线网站噜噜噜| 久热爱精品视频线路一| 成年人在线观看视频| 亚洲精美色品网站| 亚洲AV无码精品色毛片浪潮| 精品污污网站免费看| 91玉足脚交嫩脚丫在线播放| 亚洲午夜久久久久| 亚洲综合视频网站| 国产精品乱码一区二区三区软件| 在线 丝袜 欧美 日韩 制服| 国产91精品欧美| 91性高潮久久久久久久| 麻豆精品久久久| 美女网站视频黄色| 日日夜夜一区二区| 日韩在线xxx| 久久久噜噜噜久久狠狠50岁| 日韩avxxx| 制服诱惑一区二区| 六月丁香激情网| 亚洲伊人观看| 女人另类性混交zo| 久久久国产亚洲精品| 99福利在线观看| 亚洲一区免费| 乱子伦视频在线看| 日韩在线一区二区三区| 成人性做爰aaa片免费看不忠| 国产一区二区三区的电影 | 亚洲精品成人久久久998| 黑人操亚洲人| 四虎一区二区| 国产精品99久久| 最近免费观看高清韩国日本大全| 久久久人成影片免费观看| 异国色恋浪漫潭| 欧美精品网站| 美女日批免费视频| 久久精品一区二区三区中文字幕| 日本一极黄色片| 久久 天天综合| 夜夜爽久久精品91| 成人精品gif动图一区| 少妇大叫太粗太大爽一区二区| ww久久中文字幕| 国产在线综合视频| 亚洲欧美激情在线| 日本特黄一级片| 色呦呦网站一区| 国产精品色综合| 欧美精品一区二区在线播放| 视频二区在线| 中文字幕九色91在线| 成人av黄色| 97视频在线播放| 原纱央莉成人av片| 国产在线视频91| 国产精品2023| 日韩久久在线| 在线电影一区二区| 乱妇乱女熟妇熟女网站| 免费观看成人av| 精品国产aⅴ一区二区三区东京热 久久久久99人妻一区二区三区 | 韩国日本不卡在线| 久久天堂av| 成人免费看片网址| 欧洲乱码伦视频免费| 中文字幕在线乱| 性一交一乱一区二区洋洋av| 三上悠亚av一区二区三区| 成人午夜精品在线| 国产亚洲精品精品精品| 亚洲在线免费播放| 一区二区乱子伦在线播放| 日韩限制级电影在线观看| 欧美巨乳在线| 欧美日本亚洲视频| 韩国成人在线| 久久99国产精品| 综合久久99| 日韩av片网站| 99国产精品久| 国产成人无码aa精品一区| 欧美在线色视频| 婷婷伊人综合中文字幕| 久久天天躁狠狠躁夜夜躁2014| 亚洲精品一区| 爱情岛论坛亚洲入口| 日韩精品1区| 欧美韩国日本在线| 成人综合在线观看| 久久国产精品国语对白| 欧美午夜电影在线| 亚洲国产999| 久久精品亚洲国产| 电影一区二区| 欧美日韩一区在线播放| 亚洲激情一区| 免费看黄色片的网站| 亚洲久本草在线中文字幕| 中文字幕一区2区3区| 日韩精品免费在线观看| 久操av在线| 91手机在线视频| 你懂的亚洲视频| 91精品视频国产| 综合久久久久久| 91国在线视频| 日韩中文字幕精品| 日本中文字幕一区二区| 欧美午夜视频在线| 久久午夜视频| 国产jk精品白丝av在线观看| 欧美日韩美女在线观看| 婷婷五月综合激情| 97在线精品国自产拍中文| 激情小说亚洲图片| 色欲色香天天天综合网www| 福利电影一区二区| 日本在线视频免费观看| 精品免费日韩av| 天堂8中文在线| 国产精品国产一区二区| 在线成人国产| 国产美女视频免费观看下载软件| 亚洲一区二区视频在线观看| 肥臀熟女一区二区三区| 国内精品模特av私拍在线观看| 最新国产精品精品视频| 国产一二三区在线播放| 成人av在线一区二区三区| 日本熟妇毛耸耸xxxxxx| 亚洲国产精品一区二区三区| 麻豆免费版在线观看| 久久一区二区三区av| 日韩高清在线电影| 天堂а√在线中文在线鲁大师| 欧美日产在线观看| av毛片在线| 激情伦成人综合小说| 国产精品婷婷| 欧美黄色一级生活片| 欧美日韩成人在线| 成人免费网站在线观看视频| www国产亚洲精品| 午夜一区不卡| 欧美一区二区三区粗大| 欧美精品aⅴ在线视频| 在线中文字幕-区二区三区四区 | 日韩一级片免费在线观看| 91精品国产91久久久久久久久| 久久91成人| www.久久久久久久久久久| 亚洲精品日日夜夜| 天堂8在线视频| 国产精品jvid在线观看蜜臀| 婷婷亚洲最大| 国产视频精品视频| 欧美亚洲一区三区| 青春草在线视频| 欧美日韩亚洲在线| 国产乱码精品一区二区三区忘忧草 | 鲁鲁在线中文| 日韩欧美在线电影| 国产高清在线精品| 好吊色在线视频| 久久999免费视频| 欧美综合在线视频观看 | 久久久www成人免费无遮挡大片| 在线免费观看视频网站| 久久久久亚洲精品国产| 超碰成人久久| 少妇一级淫片免费放播放| 精品1区2区3区| 操喷在线视频| 一区二区三区国产福利| 成人av影院在线| 国产免费福利视频| 日韩美女视频在线观看| 欧美天天在线| 开心激情五月网|