精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型面經(jīng)——LoRA最全總結(jié) 原創(chuàng)

發(fā)布于 2024-10-17 10:40
瀏覽
0收藏

LoRA面經(jīng)搜集總結(jié)。

大家的顯卡都比較吃緊,LoRA家族越來越壯大,基于LoRA出現(xiàn)了各種各樣的改進(jìn),最近比較火的一個改進(jìn)版是 dora,聽大家反饋口碑也不錯。

基于PEFT的話用4090 24G顯存也可以進(jìn)行大模型的微調(diào),所以LoRA家族這塊還是很有研究和實際落地的潛力。

LoRA整個系列分為兩個部分:

1、LoRA總述

2、LoRA家族演進(jìn)

本篇開始介紹第一部分:LoRA總述,盡量以面經(jīng)問題的形式提出并解答,下面是一個快捷目錄。

一、概念

1. 簡單介紹一下LoRA

2. LoRA的思路

3. LoRA的特點

4. LoRA的優(yōu)點

5. LoRA的缺點

二、訓(xùn)練理論

1. LoRA權(quán)重是否可以合入原模型?

2. ChatGLM-6B LoRA后的權(quán)重多大? 

3. LoRA微調(diào)方法為啥能加速訓(xùn)練? 

4. 如何在已有LoRA模型上繼續(xù)訓(xùn)練?

5. LoRA這種微調(diào)方法和全參數(shù)比起來有什么劣勢嗎?

6. LORA應(yīng)該作用于Transformer的哪個參數(shù)矩陣? 

7. LoRA 微調(diào)參數(shù)量怎么確定? 

8. Rank 如何選取? 

9. alpha參數(shù) 如何選取? 

10. LoRA 高效微調(diào)如何避免過擬合?

11. 哪些因素會影響內(nèi)存使用? 

12. LoRA權(quán)重是否可以合并? 

13. 是否可以逐層調(diào)整LoRA的最優(yōu)rank? 

14. Lora的矩陣怎么初始化?為什么要初始化為全0?

 一、概念

1. 簡單介紹一下LoRA


大模型面經(jīng)——LoRA最全總結(jié)-AI.x社區(qū)

通過低秩分解來模擬參數(shù)的改變量,從而以極小的參數(shù)量來實現(xiàn)大模型的間接訓(xùn)練。實現(xiàn)思想很簡單,就是凍結(jié)一個預(yù)訓(xùn)練模型的矩陣參數(shù),并選擇用A和B矩陣來替代,在下游任務(wù)時只更新A和B。

2. LoRA的思路

主要思想:在原模型旁邊增加一個旁路,通過低秩分解(先降維再升維)來模擬參數(shù)的更新量。

  • 訓(xùn)練:原模型固定,只訓(xùn)練降維矩陣A和升維矩陣B。
  • 推理:可將BA加到原參數(shù)上,不引入額外的推理延遲。
  • 初始化:A采用高斯分布初始化,B初始化為全0,保證訓(xùn)練開始時旁路為0矩陣。
  • 可插拔式的切換任務(wù):當(dāng)前任務(wù)W0+B1A1,將lora部分減掉,換成B2A2,即可實現(xiàn)任務(wù)切換。

3. LoRA的特點

  • 將BA加到W上可以消除推理延遲; 
  • 可以通過可插拔的形式切換到不同的任務(wù);
  • 設(shè)計的比較簡單且效果好。

4. LoRA的優(yōu)點

1)一個中心模型服務(wù)多個下游任務(wù),節(jié)省參數(shù)存儲量 

2)推理階段不引入額外計算量 

3)與其它參數(shù)高效微調(diào)方法正交,可有效組合 

4)訓(xùn)練任務(wù)比較穩(wěn)定,效果比較好 

5)LoRA 幾乎不添加任何推理延遲,因為適配器權(quán)重可以與基本模型合并

5. LoRA的缺點

LoRA參與訓(xùn)練的模型參數(shù)量不多,也就百萬到千萬級別的參數(shù)量,所以效果比全量微調(diào)差很多。(數(shù)據(jù)以及算力滿足的情況下,還是微調(diào)的參數(shù)越多越好)

二、訓(xùn)練理論

1. LoRA權(quán)重是否可以合入原模型?

可以,將訓(xùn)練好的低秩矩陣(B*A)+原模型權(quán)重合并(相加),計算出新的權(quán)重。

2. ChatGLM-6B LoRA后的權(quán)重多大?

rank 8 target_module query_key_value條件下,大約15M。

3. LoRA微調(diào)方法為啥能加速訓(xùn)練? 

1)只更新了部分參數(shù):比如LoRA原論文就選擇只更新Self Attention的參數(shù),實際使用時我們還可以選擇只更新部分層的參數(shù);

2)減少了通信時間:由于更新的參數(shù)量變少了,所以(尤其是多卡訓(xùn)練時)要傳輸?shù)臄?shù)據(jù)量也變少了,從而減少了傳輸時間; 

3)采用了各種低精度加速技術(shù),如FP16、FP8或者INT8量化等。

這三部分原因確實能加快訓(xùn)練速度,然而它們并不是LoRA所獨有的,事實上幾乎都有參數(shù)高效方法都具有這些特點。LoRA的優(yōu)點是它的低秩分解很直觀,在不少場景下跟全量微調(diào)的效果一致,以及在預(yù)測階段不增加推理成本。

4. 如何在已有LoRA模型上繼續(xù)訓(xùn)練?

理解此問題的情形是:已有的lora模型只訓(xùn)練了一部分?jǐn)?shù)據(jù),要訓(xùn)練另一部分?jǐn)?shù)據(jù)的話,是在這個lora上繼續(xù)訓(xùn)練呢,還是跟base 模型合并后再套一層lora,或者從頭開始訓(xùn)練一個lora? 

把之前的LoRA跟base model 合并后,繼續(xù)訓(xùn)練就可以,為了保留之前的知識和能力,訓(xùn)練新的LoRA時,加入一些之前的訓(xùn)練數(shù)據(jù)是需要的。每次都要重頭訓(xùn)練的話成本比較高。

5. LoRA這種微調(diào)方法和全參數(shù)比起來有什么劣勢嗎?

大模型面經(jīng)——LoRA最全總結(jié)-AI.x社區(qū)

如果有足夠計算資源以及有10k以上數(shù)據(jù),還是建議全參數(shù)微調(diào),lora的一個初衷就是為了解決不夠計算資源的情況下微調(diào),只引入了少量參數(shù),就可以在消費級gpu上訓(xùn)練,但lora的問題在于它不能節(jié)省訓(xùn)練時間,相比于全量微調(diào),他要訓(xùn)練更久,同時因為可訓(xùn)練參數(shù)量很小,在同樣大量數(shù)據(jù)訓(xùn)練下,比不過全量微調(diào)。

6. LORA應(yīng)該作用于Transformer的哪個參數(shù)矩陣? 

大模型面經(jīng)——LoRA最全總結(jié)-AI.x社區(qū)

從上圖我們可以看到: 

1)將所有微調(diào)參數(shù)都放到attention的某一個參數(shù)矩陣的效果并不好,將可微調(diào)參數(shù)平均分配到 Wq 和 Wk 的效果最好;

2)即使是秩僅取4也能在 ?W 中獲得足夠的信息。

因此在實際操作中,應(yīng)當(dāng)將可微調(diào)參數(shù)分配到多種類型權(quán)重矩陣中,而不應(yīng)該用更大的秩單獨微調(diào)某種類型的權(quán)重矩陣。

7. LoRA 微調(diào)參數(shù)量怎么確定? 

LoRA 模型中可訓(xùn)練參數(shù)的結(jié)果數(shù)量取決于低秩更新矩陣的大小,其主要由秩 r 和原始權(quán)重矩陣的形狀確定。實際使用過程中,通過選擇不同的 lora_target 決定訓(xùn)練的參數(shù)量。 

以 LLama 為例: 

--lora_target q_proj,k_proj,v_proj,o_proj,gate_proj,up_proj,down_proj

8. Rank 如何選取? 

Rank的取值比較常見的是8,理論上說Rank在4-8之間效果最好,再高并沒有效果提升。不過論文的實驗是面向下游單一監(jiān)督任務(wù)的,因此在指令微調(diào)上根據(jù)指令分布的廣度,Rank選擇還是需要在8以上的取值進(jìn)行測試。

9. alpha參數(shù) 如何選?。?nbsp;

alpha其實是個縮放參數(shù),本質(zhì)和learning rate相同,所以為了簡化可以默認(rèn)讓alpha=rank,只調(diào)整lr,這樣可以簡化超參。

10. LoRA 高效微調(diào)如何避免過擬合?

過擬合還是比較容易出現(xiàn)的。減小r或增加數(shù)據(jù)集大小可以幫助減少過擬合,還可以嘗試增加優(yōu)化器的權(quán)重衰減率或LoRA層的dropout值。

11. 哪些因素會影響內(nèi)存使用? 

內(nèi)存使用受到模型大小、批量大小、LoRA參數(shù)數(shù)量以及數(shù)據(jù)集特性的影響。例如,使用較短的訓(xùn)練序列可以節(jié)省內(nèi)存。

12. LoRA權(quán)重是否可以合并? 

可以將多套LoRA權(quán)重合并。訓(xùn)練中保持LoRA權(quán)重獨立,并在前向傳播時添加,訓(xùn)練后可以合并權(quán)重以簡化操作。

13. 是否可以逐層調(diào)整LoRA的最優(yōu)rank? 

理論上,可以為不同層選擇不同的LoRA rank,類似于為不同層設(shè)定不同學(xué)習(xí)率,但由于增加了調(diào)優(yōu)復(fù)雜性,實際中很少執(zhí)行。

14. Lora的矩陣怎么初始化?為什么要初始化為全0?

矩陣B被初始化為0,而矩陣A正常高斯初始化。 

如果B,A全都初始化為0,那么缺點與深度網(wǎng)絡(luò)全0初始化一樣,很容易導(dǎo)致梯度消失(因為此時初始所有神經(jīng)元的功能都是等價的)。 

如果B,A全部高斯初始化,那么在網(wǎng)絡(luò)訓(xùn)練剛開始就會有概率為得到一個過大的偏移值Δ W 從而引入太多噪聲,導(dǎo)致難以收斂。 

因此,一部分初始為0,一部分正常初始化是為了在訓(xùn)練開始時維持網(wǎng)絡(luò)的原有輸出(初始偏移為0),但同時也保證在真正開始學(xué)習(xí)后能夠更好的收斂。


文轉(zhuǎn)載自公眾號瓦力算法學(xué)研所,作者:喜歡瓦力的卷卷

原文鏈接:??https://mp.weixin.qq.com/s/d3WIiA3VDyyRPyWWkwHa3w??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
標(biāo)簽
已于2024-10-17 10:44:12修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
99在线精品一区二区三区| 亚洲免费福利一区| 日韩美女视频一区二区 | 午夜福利视频一区二区| 亚洲少妇诱惑| 一本一本久久a久久精品综合小说| 久草综合在线观看| 亚洲成a人v欧美综合天堂麻豆| 老司机午夜精品| 美日韩丰满少妇在线观看| 免费黄色av网址| 免费毛片b在线观看| 久久久亚洲精品一区二区三区| 国产精品久久久久久久久男| 久草视频手机在线| 亚洲日本va中文字幕| 亚洲妇熟xx妇色黄| 欧美精品一区三区在线观看| 一区二区视频网| 日韩欧美一区二区三区免费看| 日韩一区二区三区av| 好吊色视频988gao在线观看| 亚洲欧美丝袜中文综合| 日韩成人一级大片| 欧美激情网站在线观看| 鲁丝一区二区三区| 日本在线视频一区二区三区| 欧美性色视频在线| 精品国产无码在线| 日本在线一二三| 久草在线在线精品观看| 2019国产精品自在线拍国产不卡| 国产精品18在线| 欧美大片网址| 在线播放视频一区| 国产又大又硬又粗| 亚洲h片在线看| 国产欧美日本一区视频| 国产经典一区二区三区| 亚洲视频一区二区三区四区| 99国产精品久久久久久久| 按摩亚洲人久久| 国产男女猛烈无遮挡a片漫画| 国产麻豆精品| 欧美午夜免费电影| 逼特逼视频在线| 电影k8一区二区三区久久| 中文字幕av一区二区三区免费看 | 欧美精选午夜久久久乱码6080| 妞干网在线观看视频| 日本高清视频在线观看| 久久精品免视看| 99电影网电视剧在线观看| 国产午夜无码视频在线观看 | 亚洲最新av网址| 国产激情第一页| 日本在线视频一区二区三区| 欧美性受xxxx黑人xyx性爽| 欧美 国产 小说 另类| 日本一级理论片在线大全| 国产精品二三区| 欧美一区二区视频17c| 亚洲欧美日本在线观看| 99久久99久久综合| 国产精品v欧美精品v日韩精品| 艳妇乳肉豪妇荡乳av| 日本中文字幕一区二区视频| 日本成人在线视频网址| 国产三级av片| 亚洲综合另类| 992tv成人免费视频| 肉色超薄丝袜脚交69xx图片| 久久裸体网站| 亚洲天堂网在线观看| 先锋影音av在线| 国产精品一区高清| 一本色道久久综合亚洲精品小说 | 成人福利在线观看视频| |精品福利一区二区三区| 日产中文字幕在线精品一区| 高清国产福利在线观看| 国产女同互慰高潮91漫画| 日本一区二区三区四区在线观看| 九色蝌蚪在线| 久久精品日韩一区二区三区| 神马影院一区二区三区| 91激情在线| 亚洲欧美电影院| 97干在线视频| 日韩电影毛片| 色综合久久久久| 色哟哟精品视频| 欧美午夜三级| 337p亚洲精品色噜噜噜| 波多野结衣网页| 久久超级碰碰| 亚洲人成绝费网站色www| 日本午夜精品视频| 欧美日韩视频一区二区三区| 欧美极品在线视频| 色一情一乱一伦| 美国av一区二区| av一区二区三区在线观看| 午夜影院在线视频| 久久久www免费人成精品| 99中文字幕在线观看| 91福利区在线观看| 精品视频在线免费看| 一级全黄裸体片| 国产在线观看91一区二区三区| 日韩视频在线观看免费| 国产小视频在线看| 日韩成人av影视| 成人精品水蜜桃| 欧美18xxxxx| 最新不卡av在线| 91九色在线观看视频| 欧美性生活一级| 精品无人区乱码1区2区3区在线| 国产探花视频在线播放| 国内精品美女在线观看| 国产91在线播放| 国产激情久久久久久熟女老人av| 久久欧美一区二区| 日韩精品一区二区在线视频| 99在线视频影院| 天天综合色天天综合色h| 成年人免费大片| 在线日韩成人| www国产91| 91视频免费网址| 国产精品资源网站| 日本视频一区二区不卡| 九色91在线| 欧美日韩成人综合| 女尊高h男高潮呻吟| 中出一区二区| 国产精品旅馆在线| 天天操天天干天天爽| 亚洲视频在线观看一区| 男人日女人下面视频| 日韩激情精品| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 日韩性xxx| 日韩欧美色综合网站| 无码人妻丰满熟妇啪啪欧美| 亚洲美女91| 97人人澡人人爽| 黄色网址在线免费观看| 欧洲人成人精品| 中文字幕一区二区人妻在线不卡 | 成人丝袜18视频在线观看| 在线播放豆国产99亚洲| 欧美free嫩15| 亚洲人成自拍网站| 国产精品人人人人| 97国产一区二区| 青青草原成人网| 国产成人福利av| 久久久噜噜噜久久中文字免| www三级免费| 亚洲激情一二三区| 激情成人在线观看| 91精品成人| 91网站免费看| av毛片在线| 日韩精品一区二区三区四区视频| www欧美com| 国产精品一区三区| 一道本在线观看视频| 成人在线视频观看| 在线精品91av| 一级黄色a视频| 亚洲欧洲精品一区二区精品久久久| 欧美伦理片在线观看| 四虎8848精品成人免费网站| 国产又爽又黄的激情精品视频| 在线免费看黄| 91精品综合久久久久久| 欧美成人免费观看视频| 国产成人在线看| 99999精品视频| 欧美日韩国产传媒| 亚洲一区美女视频在线观看免费| 午夜伦理大片视频在线观看| 日韩精品中午字幕| 免费在线观看黄网站| 久久夜色精品国产噜噜av| 黄色av网址在线播放| 精品在线99| 国产日韩欧美在线视频观看| 黄色av电影在线播放| 亚洲缚视频在线观看| 久久久久在线视频| 国产精品麻豆欧美日韩ww| 污视频在线观看免费网站| 最新成人av网站| 日本不卡在线播放| 玖玖玖视频精品| 97久久伊人激情网| 国产原创av在线| 在线综合视频播放| 亚洲久久在线观看| 中文天堂在线一区| jlzzjizz在线播放观看| 日本不卡一二三区黄网| 国产免费xxx| 美女久久99| 91久久精品在线| 涩涩视频在线| 欧美另类老女人| 黄色片视频在线观看| 欧美日韩一级黄| 国产精品美女毛片真酒店| 国产日产精品一区| 亚洲啪av永久无码精品放毛片 | 国模无码大尺度一区二区三区| 日韩av新片网| 久久一区二区三区喷水| 久久国产一区二区| 久久99成人| 国产精品偷伦视频免费观看国产| √最新版天堂资源网在线| 日韩视频免费在线观看| 你懂的视频在线播放| 日韩视频永久免费| 中文亚洲av片在线观看| 天天色图综合网| 神马午夜精品91| 欧美韩国日本不卡| 波多野结衣先锋影音| 国产69精品久久久久777| 一区二区三区入口| 久久大逼视频| 黄色一级视频在线播放| 亚洲视频在线免费| 婷婷亚洲婷婷综合色香五月| 免费萌白酱国产一区二区三区| 91免费看片在线| 91av一区| 97国产精品视频| 91美女精品| 欧美精品成人91久久久久久久| 欧美日本高清| 亚洲午夜色婷婷在线| 人成在线免费视频| 亚洲精品黄网在线观看| 亚洲国产av一区二区| 91精品国产综合久久香蕉的特点| 国产99免费视频| 欧美中文字幕一区二区三区 | 人妻精油按摩bd高清中文字幕| 麻豆freexxxx性91精品| 亚洲国产日韩欧美在线观看| 久久久精品日韩| 青青草原av在线播放| 国产亚洲网站| 国产免费毛卡片| 在线一区免费观看| 麻豆av免费在线| 首页亚洲欧美制服丝腿| 37pao成人国产永久免费视频| 亚洲三级电影在线观看| 黄网站欧美内射| 国产亚洲亚洲| 黄色高清无遮挡| 全部av―极品视觉盛宴亚洲| 狠狠干狠狠操视频| 国产老肥熟一区二区三区| 一区二区久久精品| 国产精品一区免费视频| 亚洲AV成人精品| 风间由美性色一区二区三区| 无码人妻精品一区二区三区99不卡| 国产成人自拍高清视频在线免费播放| 成人在线短视频| 成人三级在线视频| 性色av蜜臀av浪潮av老女人| www.欧美日韩| 实拍女处破www免费看| 国产欧美一区二区三区鸳鸯浴 | 国产精品色在线| 免费看一级大片| 亚洲一区二区精品视频| 国产污污视频在线观看| 一本色道久久综合亚洲91| 中文字幕网址在线| 日韩一区二区三区免费看| 蜜臀久久99精品久久久| 亚洲精品中文字幕有码专区| 成人一区二区不卡免费| 久青草国产97香蕉在线视频| eeuss鲁一区二区三区| 奇米一区二区三区四区久久| 中文字幕乱码中文乱码51精品| 国产精自产拍久久久久久蜜| 国产亚洲高清一区| 精品国产一区二区三区日日嗨| 少妇一区二区视频| 肉大捧一出免费观看网站在线播放 | av女优在线| 欧美成人精品h版在线观看| 国产最新在线| 国产精品va在线播放| 国产成年精品| 蜜桃av色综合| 一区二区三区四区在线观看国产日韩 | 久久久综合色| 亚洲国产精品成人天堂| 人人超碰91尤物精品国产| 韩国一区二区三区四区| 久久久久成人黄色影片| 69av.com| 欧美日韩一区小说| 天堂在线观看av| 精品国产一区二区三区在线观看| 爱看av在线入口| 国产欧美精品va在线观看| 狼人精品一区二区三区在线| 女人床在线观看| 三级不卡在线观看| 国产日韩视频一区| 中文字幕一区二区在线观看| 免费在线不卡视频| 日韩免费高清av| 秋霞成人影院| 欧美一区二区三区图| 国产精品巨作av| 只有这里有精品| 青青草国产成人99久久| 97人妻精品一区二区三区免| 亚洲日本欧美天堂| 在线亚洲欧美日韩| 一区二区三区动漫| 国产精品粉嫩| 九九九九九精品| 尤物网精品视频| 337p日本欧洲亚洲大胆张筱雨| 欧美国产精品专区| 中文字幕在线播| 日韩精品视频在线播放| www.超碰在线| 国产精选一区二区| 午夜国产欧美理论在线播放| 黄色一级片免费的| 国产欧美日韩精品一区| 亚洲成熟少妇视频在线观看| 日韩电影在线观看永久视频免费网站| 日本欧美在线视频免费观看| 成人高清视频观看www| 99久久婷婷国产综合精品电影√| 免费观看成人网| 久久综合九色综合久久久精品综合| 国产精品自拍视频一区| 日韩午夜av电影| 色女人在线视频| 亚洲www视频| 午夜日韩在线| 久久久久亚洲av成人网人人软件| 亚洲精品成人天堂一二三| av网站免费播放| 欧美激情精品久久久久| 欧美日韩国产一区二区在线观看| 欧美日韩精品不卡| 全部av―极品视觉盛宴亚洲| 日韩精品电影一区二区三区| 欧美亚洲日本国产| 999在线视频| 91久久国产综合久久91精品网站| 久久久国产精品| 精品人妻一区二区乱码| 亚洲午夜久久久久久久久久久| 亚洲精品久久久久久无码色欲四季 | 色哟哟免费网站| 国产69精品一区二区亚洲孕妇| 欧美成人黄色网| 精品亚洲夜色av98在线观看| 成人影院入口| 亚洲成色www久久网站| 九九九久久久精品| 日韩欧美中文字幕视频| 亚洲精品一区二区精华| 一本大道色婷婷在线| 日本精品免费| 久久av中文字幕片| 欧美日韩国产精品综合| 精品国产人成亚洲区| 在线最新版中文在线| 亚洲精品永久www嫩草| 日韩有码一区二区三区| 2021亚洲天堂| 国产视频在线一区二区| 日韩免费大片| 成人在线国产视频| 国产欧美精品区一区二区三区| 97人妻精品视频一区| 欧美激情成人在线视频| 九九热精品视频在线观看| 亚洲一二区在线观看| 精品国产乱码久久久久久婷婷|