精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"

發(fā)布于 2025-4-27 00:35
瀏覽
0收藏

在大語言模型(LLMs)的訓練領域,Low - Rank Adaptation(LoRA)技術堪稱一項重大突破。它就像給模型訓練開啟了一條 “高速通道”,讓我們能更高效地為特定任務訓練大語言模型。如今,LoRA 在眾多應用場景中廣泛使用,并且引發(fā)了一系列改進研究,催生出了許多變體,這些變體從不同角度優(yōu)化 LoRA,提升訓練速度、性能,或者兩者兼得。今天,咱們就來深入了解一下 LoRA 及其家族成員的奧秘。

1. LoRA:基礎概念與核心優(yōu)勢

LoRA 的核心做法是在預訓練權重矩陣 W 旁邊添加兩個較小的可訓練矩陣 A 和 B,同時不改變 W 的參數(shù)。想象一下,預訓練的權重矩陣 W 是一個經(jīng)驗豐富的 “老將”,已經(jīng)具備了很多通用知識,但在應對特定任務時還不夠完美。這時,矩陣 A 和 B 就像是兩個靈活的 “小助手”,在不打擾 “老將” 的情況下,通過自身的訓練,為模型在特定任務上提供額外助力。

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

假設原始參數(shù)矩陣 W 的大小是 d x d,矩陣 A 的大小是 r x d,矩陣 B 的大小是 d x r,這里的 r 比 d 小很多(比如通常取 r=16) ,r 被稱為秩。訓練時,輸入數(shù)據(jù)在經(jīng)過 W 的同時也會經(jīng)過 A 和 B,B 的輸出會與 W 的輸出相加,以此來影響模型的最終預測結果。并且,A 和 B 的添加可以應用于神經(jīng)網(wǎng)絡內(nèi)部的多個層,而不只是在模型的最后添加一層。

在初始化時,矩陣 A 被賦予均值為零、有一定方差的隨機值,矩陣 B 則被初始化為全零矩陣。這樣的初始化方式能確保在訓練初期,LoRA 矩陣不會對原始 W 的輸出產(chǎn)生隨機干擾,只有在 A 和 B 的參數(shù)朝著理想方向調(diào)整后,才會逐步對原始輸出起到補充優(yōu)化作用 。與傳統(tǒng)的微調(diào)方法相比,LoRA 最大的優(yōu)勢就是大幅減少了需要訓練的參數(shù)數(shù)量,卻能達到相當?shù)男阅鼙憩F(xiàn)。

2. LoRA+:優(yōu)化學習率,提升訓練效率

LoRA + 在 LoRA 的基礎上,為矩陣 A 和 B 引入了不同的學習率。在大多數(shù)神經(jīng)網(wǎng)絡訓練中,通常會對所有權重矩陣采用相同的學習率。然而,LoRA + 的研究者發(fā)現(xiàn),對于 LoRA 中的適配器矩陣(即 A 和 B)而言,這種單一學習率并非最優(yōu)選擇。

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

從理論上講,當模型的神經(jīng)元數(shù)量增多,模型變得更 “寬” 時,基于神經(jīng)網(wǎng)絡初始化的一些數(shù)值特性,將矩陣 B 的學習率設置得比矩陣 A 高很多,能夠提升訓練效率。直觀地理解,矩陣 B 初始化為零,它就像一張 “白紙”,可以接受更大的更新步長來快速學習;而矩陣 A 是隨機初始化的,更新時需要更謹慎。

實際驗證也表明,將矩陣 B 的學習率設置為矩陣 A 的 16 倍時,在像 RoBERTa 或 Llama - 7b 這樣的模型訓練中,不僅能使模型準確率有大約 2% 的小幅度提升,還能將訓練時間縮短一半。

3. VeRA:減少參數(shù),借助隨機投影 “四兩撥千斤”

VeRA(Vector - based Random Matrix Adaptation)另辟蹊徑,它不再訓練矩陣 A 和 B,而是將它們初始化為共享的隨機權重矩陣,同時添加兩個新的向量 d 和 b 進行訓練。這一做法可能讓人疑惑:不訓練 A 和 B,它們能發(fā)揮什么作用呢?

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

這背后涉及到隨機投影的研究。在大型神經(jīng)網(wǎng)絡中,其實只有一小部分權重對模型在特定任務上的行為和性能起到關鍵作用。基于這個原理,VeRA 通過在隨機初始化的矩陣后添加投影向量 d 和 b,實現(xiàn)了與調(diào)整矩陣中稀疏參數(shù)類似的效果。而且,與原始 LoRA 不同,VeRA 中的矩陣 B 不再初始化為零,而是和矩陣 A 一樣隨機初始化。

以給 GPT - 3 引入秩為 16 的 LoRA 層為例,使用傳統(tǒng) LoRA 方法會有 7550 萬個參數(shù),而 VeRA 僅需 280 萬個參數(shù),參數(shù)減少了 97%。在 GLUE 或 E2E 等常見基準測試中,VeRA 模型的性能僅略低于完全微調(diào)的模型或使用原始 LoRA 技術的模型。

4. LoRA - FA:凍結矩陣 A,簡化訓練

LoRA - FA(LoRA with Frozen - A)和 VeRA 的思路有些相似,它在初始化后凍結矩陣 A,讓 A 充當隨機投影的角色,只訓練矩陣 B。矩陣 B 的初始化方式和原始 LoRA 一樣,為零矩陣。通過這種方式,LoRA - FA 將需要訓練的參數(shù)數(shù)量減少了一半,同時在性能上與普通 LoRA 相當。

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

5. LoRA - drop:智能篩選,減少不必要訓練

在神經(jīng)網(wǎng)絡中,雖然添加 LoRA 矩陣比微調(diào)整個模型成本低,但添加的 LoRA 適配器越多,訓練成本依然會增加。LoRA - drop 就像是一個 “智能篩選器”,它引入一種算法來判斷哪些層值得用 LoRA 進行增強,哪些層則不需要。

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

具體操作分兩步:第一步,先從數(shù)據(jù)集中采樣一個子集,用這個子集訓練 LoRA 適配器幾次,然后計算每個 LoRA 適配器的重要性,計算方式是B x A x x(其中 x 是輸入),這個結果代表了 LoRA 適配器對凍結層輸出的改變程度,值越大說明對凍結層行為影響越大,也就越重要;第二步,根據(jù)計算出的重要性,選擇最重要的 LoRA 層。可以通過設定閾值,累加重要性值達到閾值時確定所選層,也可以直接選取前 n 個重要性最高的層。確定好要訓練的層后,再用整個數(shù)據(jù)集對這些層進行完整訓練,其他層則固定為一組共享參數(shù),不再訓練。實驗表明,與訓練所有 LoRA 層相比,LoRA - drop 在準確率上僅有微小變化,但由于減少了訓練參數(shù)數(shù)量,大大降低了計算時間。

6. AdaLoRA:動態(tài)調(diào)整矩陣秩,精準分配資源

AdaLoRA(Adaptive LoRA)的獨特之處在于能夠動態(tài)調(diào)整 LoRA 矩陣的秩。在實際應用中,并非所有層都需要添加相同規(guī)模的 LoRA 矩陣,有些層對模型性能的影響更大,需要更高的秩來進行更精細的調(diào)整。

AdaLoRA 通過考慮 LoRA 矩陣的奇異值來判斷其重要性。簡單來說,矩陣乘法可以看作是對向量應用一個函數(shù),當我們想減少矩陣參數(shù)又希望函數(shù)行為改變盡可能小時,可以通過計算矩陣的特征值(奇異值是特征值的平方根)來決定保留哪些行。對于那些只捕獲少量方差、對函數(shù)貢獻不大的行,可以將其設置為零,從而縮小矩陣的秩。

與 LoRA - drop 不同,AdaLoRA 不是完全舍棄某些層的適配器,而是根據(jù)情況降低一些層適配器的秩,使得不同的適配器可以有不同的秩。并且,AdaLoRA 在計算時不會每次都顯式計算奇異值(因為計算成本高),而是通過奇異值分解來獲取奇異值。同時,它不僅考慮奇異值,還會結合損失對某些參數(shù)的敏感度來綜合判斷。在許多場景下,同樣的總參數(shù)數(shù)量,AdaLoRA 通過更合理地分配可訓練參數(shù),比標準 LoRA 方法獲得了更好的分數(shù)。

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

7. DoRA:分解權重,更接近微調(diào)效果

DoRA(Weight - Decomposed Low - Rank Adaption)基于一種新穎的思路:將每個矩陣分解為幅度和方向兩個部分。就像在二維空間中,一個向量既可以用坐標表示,也可以用長度(幅度)和角度(方向)來描述。DoRA 將這種分解方式應用于描述模型訓練步驟中權重更新的矩陣,無論是傳統(tǒng)微調(diào)訓練的模型還是使用 LoRA 適配器訓練的模型。

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

研究發(fā)現(xiàn),微調(diào)訓練和 LoRA 訓練在幅度和方向變化的關系上存在差異。微調(diào)訓練中,方向和幅度更新之間存在較小的負相關,而 LoRA 訓練中則是較強的正相關。DoRA 通過將預訓練矩陣 W 分解為大小為 1 x d 的幅度向量 m 和方向矩陣 V,分別對它們進行獨立訓練。方向矩陣 V 像標準 LoRA 方法一樣,通過 B x A 進行增強,幅度向量 m 則直接進行訓練。這樣,DoRA 在訓練時能夠更靈活地調(diào)整幅度和方向,使兩者關系更接近微調(diào)訓練。在多個基準測試中,DoRA 的準確率超過了 LoRA,這表明它通過分解權重更新,在使用 LoRA 較小參數(shù)空間的同時,實現(xiàn)了更接近微調(diào)的訓練效果。

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

8. Delta - LoRA:更新預訓練權重,突破性能瓶頸

在 LoRA 中,為了避免高昂的計算成本,預訓練矩陣 W 是不被調(diào)整的,這就導致了較小的矩陣 A 和 B 在學習下游任務時能力有限,使得 LoRA 訓練的模型性能往往低于微調(diào)模型。Delta - LoRA 則打破了這個限制,它提出通過 A x B 在連續(xù)時間步的梯度來更新矩陣 W 。

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

一文讀遍 LoRA 家族:大語言模型高效訓練的"秘密武器"-AI.x社區(qū)

9. 總結

LoRA 及其一系列變體從不同維度對大語言模型的訓練進行了優(yōu)化。

  • LoRA 通過添加低秩矩陣 A 和 B 開啟了高效訓練的大門;
  • LoRA + 優(yōu)化學習率提升訓練效率;
  • VeRA 和 LoRA - FA 減少參數(shù)數(shù)量;
  • LoRA - drop 智能篩選訓練層;
  • AdaLoRA 動態(tài)調(diào)整矩陣秩;
  • DoRA 分解權重使訓練更接近微調(diào);
  • Delta - LoRA 更新預訓練權重突破性能瓶頸。

本文轉(zhuǎn)載自?????鴻煊的學習筆記????,作者: 鴻煊

收藏
回復
舉報
回復
相關推薦
日韩av黄色在线| 在线观看h网| 久久99在线观看| 美日韩精品免费视频| 国产免费一区二区三区最新6| 乱馆动漫1~6集在线观看| 久久精品人人做人人爽97| 成人在线一区二区| 天天操天天干视频| 婷婷综合视频| 日韩大陆毛片av| 在线观看免费视频污| 麻豆免费版在线观看| 中文字幕中文乱码欧美一区二区| 成人午夜电影免费在线观看| 毛片在线免费播放| 影音先锋亚洲电影| 久久精品视频在线播放| av网站免费在线播放| 成人国产精品久久| 色婷婷国产精品| 日本香蕉视频在线观看| 99精品老司机免费视频| 波多野结衣中文一区| 91亚洲va在线va天堂va国| 日本黄色一级视频| 亚洲大片在线| 欧美大片免费看| 亚洲色图27p| 国产乱码精品一区二区亚洲| 亚洲激情视频在线播放| 网站在线你懂的| 日韩精品免费观看视频| 精品国产福利在线| 久久男人资源站| 搞黄网站在线观看| 综合亚洲深深色噜噜狠狠网站| 秋霞久久久久久一区二区| 少妇高潮一区二区三区69| 国产iv一区二区三区| 成人午夜在线观看| 一区二区久久精品66国产精品| 天堂在线亚洲视频| 亲子乱一区二区三区电影| 日本一区二区免费在线观看| 伊人久久大香线| 久久九九全国免费精品观看| 美女网站视频色| 清纯唯美日韩| 中文字幕最新精品| 黄色av片三级三级三级免费看| 在线日本制服中文欧美| 亚洲日韩欧美视频| 99精品欧美一区二区| 国产精品嫩草影院在线看| 亚洲精品中文字| 国产女主播喷水高潮网红在线| 日韩欧美黄色| 亚洲欧洲美洲在线综合| www.av天天| 色135综合网| 日韩中文字幕在线观看| 久久久久久久麻豆| 亚洲性视频h| 78m国产成人精品视频| 天天综合天天干| 久久久久久夜| 成人国产亚洲精品a区天堂华泰| 一级片在线观看视频| 国内精品第一页| ts人妖另类在线| 婷婷丁香花五月天| 国产日韩av一区二区| 亚洲高清视频在线观看| 黄色网页在线免费看| 一区二区三区在线视频免费观看| 成年人深夜视频| а√资源新版在线天堂| 久久免费视频一区| 日韩欧美一区二区视频在线播放| 日本激情在线观看| 亚洲一区二区五区| 欧洲熟妇精品视频| 国产一精品一av一免费爽爽| 亚洲黄色av女优在线观看| 黄瓜视频污在线观看| 日韩成人a**站| 欧美区在线播放| 国产精品va无码一区二区三区| 日本美女视频一区二区| 91九色偷拍| 久久久资源网| 久久久高清一区二区三区| 一本一道久久a久久综合精品| 污视频网站在线免费| 一本在线高清不卡dvd| 交换做爰国语对白| 性人久久久久| 久久国产精品久久国产精品| 精品美女久久久久| 狠狠色综合日日| 免费日韩av电影| www红色一片_亚洲成a人片在线观看_| 欧美性videos高清精品| 国产一级片中文字幕| 欧美人与拘性视交免费看| 久色乳综合思思在线视频| av图片在线观看| 国内精品国产成人| 日本中文不卡| 小草在线视频免费播放| 91精品欧美福利在线观看| 亚洲第九十七页| 欧美va天堂| 国产日产久久高清欧美一区| 亚洲人视频在线观看| 亚洲欧美日韩在线播放| 午夜视频在线瓜伦| 日韩美脚连裤袜丝袜在线| 欧美xxxx18国产| 在线观看中文字幕网站| 久久综合999| 人妻无码久久一区二区三区免费| 综合久草视频| 在线亚洲欧美视频| 国语对白永久免费| 99riav久久精品riav| 美女黄色免费看| 四虎国产精品永久在线国在线| 亚洲欧洲日产国产网站| 欧美亚洲精品天堂| av一本久道久久综合久久鬼色| 日本一级淫片演员| 欧美jizz18| 中文字幕亚洲色图| 亚洲天堂视频在线| 国产欧美精品一区二区色综合| 欧美精品一区免费| 日韩三级视频| 欧美一级高清免费播放| 人妻视频一区二区三区| 亚洲国产精品久久人人爱蜜臀| 奇米777在线| 中国成人一区| 99porn视频在线| 日本一本在线免费福利| 欧美精品一区二区三区蜜桃视频| 久久99久久98精品免观看软件| 国产精品一二三在| 免费在线黄网站| 九色丨蝌蚪丨成人| 欧美一级大片在线观看| 蜜桃视频在线入口www| 日本久久电影网| 一级黄色毛毛片| 九九视频精品免费| 超碰10000| 加勒比色老久久爱综合网| 91成人在线播放| 韩国三级av在线免费观看| 欧洲视频一区二区| 日韩精品一区二区亚洲av性色| 国产精品伊人色| 成人免费视频91| 久久91成人| 国产剧情久久久久久| 国产理论在线观看| 精品国产麻豆免费人成网站| 黄色片视频网站| 国产欧美日韩精品a在线观看| 亚洲天堂国产视频| 亚洲视频免费| 蜜桃视频成人| 色综合一区二区日本韩国亚洲| 九九精品在线视频| 手机福利小视频在线播放| 欧美午夜精品一区二区三区 | av资源免费观看| 国产日产欧美精品一区二区三区| 中文字幕av专区| 国产综合网站| 丝袜美腿玉足3d专区一区| 国产亚洲字幕| 日韩av片免费在线观看| 黄色网页在线看| 亚洲级视频在线观看免费1级| 日韩中文字幕高清| 亚洲制服丝袜一区| 美女爆乳18禁www久久久久久| 久草这里只有精品视频| 成人在线免费观看av| 婷婷另类小说| 久久久一本精品99久久精品| 亚洲欧美综合久久久久久v动漫| 欧美精品第一页在线播放| www在线免费观看| 欧美成人aa大片| 免费黄色一级大片| 亚洲成av人片| 欧美偷拍第一页| 国产亚洲欧美中文| 婷婷五月精品中文字幕| 久久国产精品第一页| 国产欧美在线一区| 亚洲午夜伦理| 黄黄视频在线观看| 日韩精品一区二区三区免费观影| 精品在线视频一区二区| 免费看日产一区二区三区| 国产精品久久久久久久app| 超碰在线中文字幕| 久久国产精品首页| 亚洲成人三级| 亚洲人在线观看| 水莓100在线视频| 精品国产精品网麻豆系列| 91精品国自产| 欧美三级三级三级| 销魂美女一区二区| 精品欧美aⅴ在线网站| 妺妺窝人体色www聚色窝仙踪| 国产精品视频在线看| 国产麻豆天美果冻无码视频 | aa成人免费视频| 亚洲伊人伊成久久人综合网| 国产成人综合亚洲| 中文字幕在线直播| 69视频在线播放| 黄色羞羞视频在线观看| 欧美精品一二区| 91高清在线观看视频| 久久亚洲精品中文字幕冲田杏梨| av福利在线播放| 一区二区在线视频| 国产精品麻豆一区二区三区| 亚洲九九九在线观看| 三级在线播放| 亚洲欧美999| 欧美孕妇性xxxⅹ精品hd| 精品无人国产偷自产在线| 少妇性bbb搡bbb爽爽爽欧美| 精品国产亚洲在线| 黄色福利在线观看| 亚洲国产精品va在线看黑人| 蜜臀av午夜精品| 亚洲第一精品夜夜躁人人躁| 蜜臀av中文字幕| 精品视频在线播放色网色视频| 五月婷婷久久久| 亚洲精品自拍偷拍| 国产一级二级三级在线观看| 国产亚洲精品一区二555| 超碰国产在线| 久久亚洲精品网站| 91破解版在线观看| 欧美一区二区.| 欧美日韩国产网站| 成人乱色短篇合集| 精品入口麻豆88视频| 国产厕所精品在线观看| 美女av一区| 日韩欧美亚洲v片| 99精品在线观看| 国产资源在线免费观看| 一区二区三区成人精品| 国产一级片黄色| 精品一区二区三区在线播放| 国产ts在线观看| 97se亚洲国产综合在线| 久久久久久成人网| 亚洲色图都市小说| 国产成人自拍视频在线| 欧洲中文字幕精品| 精品国产九九九| 国产视频久久久久久久| 91视频在线观看| 久久全球大尺度高清视频| 欧美不卡高清一区二区三区| 91欧美精品成人综合在线观看| 粉嫩久久久久久久极品| 日本一区二区三区四区高清视频 | jizz国产视频| 亚洲免费福利视频| 成人看av片| 日韩av免费在线观看| 日日夜夜精品视频| 欧美一区二区三区四区在线观看地址 | 欧美一区二区在线免费观看| 高清乱码毛片入口| 在线亚洲男人天堂| 97人人爽人人澡人人精品| 国产精品视频成人| 乱亲女h秽乱长久久久| 中文字幕综合在线观看| 国产精品美女久久久| 加勒比av中文字幕| 久久久激情视频| 国产精品18p| 欧美美女激情18p| 欧美zozo| 久久男人的天堂| 精品视频一区二区三区| 任我爽在线视频精品一| 悠悠资源网久久精品| aaa一级黄色片| 久久久国产综合精品女国产盗摄| 久草免费新视频| 欧美人与z0zoxxxx视频| 你懂得在线网址| 97久久精品人搡人人玩| a一区二区三区亚洲| 色999五月色| 午夜一区二区三区不卡视频| 亚洲熟女乱综合一区二区| 国产精品国产自产拍高清av王其| 二区视频在线观看| 精品对白一区国产伦| 污视频免费在线观看| 成人午夜在线观看| 日韩在线二区| 午夜视频在线瓜伦| 久久久久久久网| 91精品国产乱码久久久张津瑜| 日韩欧美一区二区三区在线| 麻豆视频在线| 国产日韩欧美视频| 欧美色婷婷久久99精品红桃| av免费中文字幕| 99麻豆久久久国产精品免费 | 午夜在线一区| xfplay5566色资源网站| 亚洲一区二区视频| www夜片内射视频日韩精品成人| 久久精品国产亚洲| 国产精品777777在线播放| 在线码字幕一区| 久久成人免费网站| 男人av资源站| 欧美日韩国产免费一区二区| 一广人看www在线观看免费视频| 国产精品入口免费视频一| 久久激情电影| av噜噜在线观看| 亚洲欧美日韩一区| www.日韩高清| 久久久之久亚州精品露出| www.成人网| www..com日韩| 99re这里只有精品6| 国产精品suv一区| 国产亚洲日本欧美韩国| 国产91精品在线| 在线观看成人av电影| 狠狠色综合日日| 日韩 国产 在线| 亚洲欧美激情一区| 91另类视频| 国产一二三四五| 成人丝袜视频网| 久久久久99精品成人片我成大片 | 欧美人与性动交α欧美精品图片| 99在线热播| 亚洲在线一区| аⅴ天堂中文在线网| 7777精品伊人久久久大香线蕉 | 色婷婷狠狠综合| 免费在线你懂的| 高清视频一区二区三区| 米奇777在线欧美播放| 我想看黄色大片| 欧美一级视频精品观看| av在线资源| 色噜噜一区二区| 国产精品亚洲视频| 日韩一区二区视频在线| www.欧美免费| 成人午夜网址| 中文字幕视频在线免费观看| 亚洲日本韩国一区| 欧美拍拍视频| 亚洲999一在线观看www| 国产精品久久久久9999高清| 粉嫩精品久久99综合一区| 欧美大片免费久久精品三p| 欧美黄色视屏| 精品毛片久久久久久| 日韩不卡一区二区三区| 欧美激情精品久久| 一区二区国产精品视频| 136导航精品福利| xxxx一级片| 亚洲成人av福利| 黄色视屏免费在线观看| 久久久久资源| 国产精品综合一区二区| 自拍偷拍校园春色| 午夜精品久久久久久久久久久久久 | 国产成人超碰人人澡人人澡| 无码人妻精品一区二区50| 欧美成人精品不卡视频在线观看|