精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果

發布于 2024-4-15 08:56
瀏覽
0收藏

隨著大模型的參數量日益增長,微調整個模型的開銷逐漸變得難以接受。


為此,北京大學的研究團隊提出了一種名為 PiSSA 的參數高效微調方法,在主流數據集上都超過了目前廣泛使用的 LoRA 的微調效果。

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


  • 論文: PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large Language Models
  • 論文鏈接: https://arxiv.org/pdf/2404.02948.pdf
  • 代碼鏈接: https://github.com/GraphPKU/PiSSA


如圖 1 所示,PiSSA (圖 1c) 在模型架構上和 LoRA [1] 完全一致 (圖 1b),只是初始化 Adapter 的方式不同。LoRA 使用高斯噪聲初始化 A,使用 0 初始化 B。而 PiSSA 使用主奇異值和奇異向量 (Principal Singular values and Singular vectors) 來初始化 Adapter 來初始化 A 和 B。

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 1)從左到右依次為全參數微調、LoRA、以及 PiSSA。藍色代表凍結的參數,橘黃色代表可訓練參數及它們的初始化方式。相比全參數微調,LoRA 和 PiSSA 都大幅節省了可訓練參數量。對于相同輸入,這三種方法的初始輸出完全相等。然而,PiSSA 凍結模型的次要成分,直接微調主成分(前 r 個奇異值和奇異向量);而 LoRA 可看作凍結模型的主要部分,而去微調 noise 部分。


在不同的任務上對比 PiSSA、LoRA 的微調效果


研究團隊使用 llama 2-7B、Mistral-7B 以及 Gemma-7B 作為基礎模型,通過微調提升它們的數學、代碼和對話能力。其中包括:在 MetaMathQA 上訓練,在 GSM8K 和 MATH 數據集上驗證模型的數學能力;在 CodeFeedBack 上訓練,在 HumanEval 和 MBPP 數據集上驗證模型的代碼能力;在 WizardLM-Evol-Instruct 上訓練,在 MT-Bench 上驗證模型的對話能力。從下表的實驗結果可以看出,使用相同規模的可訓練參數,PiSSA 的微調效果顯著超越了 LoRA,甚至超越了全參數微調。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


對比 PiSSA、LoRA 在不同的可訓練參數量下微調的效果


研究團隊在數學任務上對模型的可訓練參數量和效果之間的關系進行消融實驗。從圖 2.1 發現在訓練初期,PiSSA 的訓練 loss 下降特別快,而 LoRA 存在不下降,甚至略有上升的階段。此外,PiSSA 的訓練 loss 全程低于 LoRA,說明對訓練集擬合得更好;從圖 2.2、2.3、2.4 可以看出在每種 setting 下,PiSSA 的 loss 始終比 LoRA 低,準確率始終比 LoRA 高,PiSSA 能夠使用更少的可訓練參數追趕上全參數微調的效果。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 2.1) 當秩為 1 時 PiSSA、LoRA 在訓練過程中的 loss。每幅圖的右上角是前 100 步迭代放大的曲線。其中 PiSSA 用橙色線表示,LoRA 用藍色線表示,全參數微調用綠線展示了最終的 loss 作為參考。秩為 [2,4,8,16,32,64,128] 時的現象與此一致,詳見文章附錄。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 2.2)使用秩為 [1,2,4,8,16,32,64,128] 的 PiSSA 和 LoRA 的最終 training loss。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 2.3)使用秩為 [1,2,4,8,16,32,64,128] 的 PiSSA 和 LoRA 微調的模型在 GSM8K 上的準確率。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 2.4)使用秩為 [1,2,4,8,16,32,64,128] 的 PiSSA 和 LoRA 微調的模型在 MATH 上的準確率。


PiSSA 方法詳解


受到 Intrinsic SAID [2]“預訓練大模型參數具有低秩性” 的啟發,PiSSA 對預訓練模型的參數矩陣

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

進行奇異值分解,其中前 r 個奇異值和奇異向量用來初始化適配器 (adapter) 的兩個矩陣

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

;剩余的奇異值和奇異向量用來構造殘差矩陣

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,使得

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

。因此,適配器中的參數包含了模型的核心參數,而殘差矩陣中的參數是修正參數。通過微調參數量較小的核心適配器 A、B,凍結參數量較大的殘差矩陣

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,就達成了用很少的參數近似全參數微調的效果。


盡管同樣受到 Intrinsic SAID [1] 啟發,PiSSA 和 LoRA 背后的原理卻截然不同。


LoRA 認為大模型微調前后矩陣的變化 △W 具有很低的本征秩 r,因此通過

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

相乘得到的低秩矩陣來模擬模型的變化 △W。初始階段,LoRA 使用高斯噪聲初始化 A,使用 0 初始化 B,因此

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,以此保證模型初始能力沒有變化,并微調 A 和 B 實現對 W 進行更新。與此相比,PiSSA 不關心 △W,而是認為 W 具有很低的本征秩 r。因此直接對 W 進行奇異值分解,分解成主成分 A、B,以及殘差項

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,使得

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

。假設 W 的奇異值分解為

改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

,A、B 使用 SVD 分解后奇異值最大的 r 個奇異值、奇異向量進行初始化:


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


殘差矩陣使用其余的奇異值、奇異向量進行初始化:


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


PiSSA 直接對 W 的低秩主成分 A、B 進行微調,凍結次要的修正項。相比 LoRA 用高斯噪聲以及 0 初始化適配器參數、凍結核心模型參數,PiSSA 收斂更快、效果更好。


PiSSA 的發音類似 “披薩”(pizza)--- 如果把整個大模型類比為一個完整的披薩,PiSSA 切掉其中一角,而且是餡料最豐富的一角(主奇異值、奇異向量),重新烘焙(在下游任務上微調)成喜歡的口味。


由于 PiSSA 采用了和 LoRA 完全相同的架構,其可以作為 LoRA 的一種可選初始化方式,在 peft 包中很方便的進行修改和調用 (如以下代碼所示)。相同的架構也使得 PiSSA 繼承了大多數 LoRA 的優點,如:對殘差模型使用 4bit 量化 [3],減小訓練開銷;微調完成后適配器能合并進殘差模型,不改變推理過程的模型架構;無需分享完整模型參數,只需要分享參數量很少的 PiSSA 模塊,使用者直接加載 PiSSA 模塊就能自動進行奇異值分解以及賦值;一個模型可以同時使用多個 PiSSA 模塊等等。一些對 LoRA 方法的改進,也能與 PiSSA 進行結合:比如不固定每層的秩,通過學習找到最佳的秩 [4];用 PiSSA 指導的更新 [5],從而突破秩的限制等等。


# 在 peft 包中 LoRA 的初始化方式后面增加了一種 PiSSA 初始化選項:

if use_lora:

  nn.init.normal_(self.lora_A.weight, std=1 /self.r)

  nn.init.zeros_(self.lora_B.weight) 

elif use_pissa:

  Ur, Sr, Vr = svd_lowrank (self.base_layer.weight, self.r, niter=4) 

  # 注意:由于 self.base_layer.weight 的維度是 (out_channel,in_channel, 所以 AB 的順序相比圖示顛倒了一下)

  self.lora_A.weight = torch.diag (torch.sqrt (Sr)) @ Vh.t ()

  self.lora_B.weight = Ur @ torch.diag (torch.sqrt (Sr)) 

  self.base_layer.weight = self.base_layer.weight - self.lora_B.weight @ self.lora_A.weight


對比高中低奇異值微調效果實驗


為了驗證使用不同大小奇異值、奇異向量初始化適配器對模型的影響,研究人員分別使用高、中、低奇異值初始化 LLaMA 2-7B、Mistral-7B-v0.1、Gemma-7B 的適配器,然后在 MetaMathQA 數據集上進行微調,實驗結果展示在圖 3 中。從圖中可以看出,使用主要奇異值初始化的方法訓練損失最小,在 GSM8K 和 MATH 驗證集上的準確率更高。這一現象驗證了微調主要奇異值、奇異向量的有效性。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區

圖 3)從左到右依次為訓練 loss、在 GSM8K 上的準確率、在 MATH 上的準確率。其中藍色表示最大奇異值、橙色表示中等奇異值、綠色表示最小奇異值。


快速奇異值分解


PiSSA 繼承了 LoRA 的優點,使用起來方便,效果超越 LoRA。代價是在初始化階段,需要對模型進行奇異值分解。雖然僅需要在初始化時分解一次,但是仍然可能需要幾分鐘甚至幾十分鐘的開銷。因此,研究人員使用一種快速奇異值分解 [6] 方法替代標準的 SVD 分解,通過下表的實驗可以看出,僅需幾秒鐘的時間,就能逼近標準 SVD 分解的訓練集擬合效果。其中 Niter 表示迭代次數,Niter 越大,時間越久但是誤差越小。Niter = ∞表示標準 SVD。表格中的平均誤差表示快速奇異值分解與標準 SVD 得到的 A、B 之間的平均 L_1 距離。


改變LoRA的初始化方式,北大新方法PiSSA顯著提升微調效果-AI.x社區


總結與展望


本工作對預訓練模型的權重進行奇異值分解,通過將其中最重要的參數用于初始化一個名為 PiSSA 的適配器,微調這個適配器來近似微調完整模型的效果。實驗表明,PiSSA 比 LoRA 收斂更快,最終效果更好,唯一的代價僅是需要幾秒的 SVD 初始化過程。


那么,您愿意為了更好的訓練效果,多花幾秒鐘時間,一鍵更改 LoRA 的初始化為 PiSSA 嗎?


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/3gvLaFJtlHVUOP4-DcinTg??

收藏
回復
舉報
回復
相關推薦
中文字幕一区三区| 欧美激情视频一区二区三区在线播放 | 99热在线只有精品| 亚洲一区二区三区日本久久九| 亚洲黄色网址大全| 欧美在线性视频| 亚洲主播在线观看| 中文字幕亚洲欧美| 午夜激情视频网| 成人影音在线| 国产欧美精品一区二区色综合朱莉| 国产精自产拍久久久久久蜜| 精品视频一区二区在线观看| 加勒比久久综合| 日韩精品一区二区三区蜜臀| 午夜视频在线瓜伦| 中文在线手机av| 国产午夜亚洲精品羞羞网站| 亚洲最大成人在线| 国产亚洲欧美在线精品| 影视亚洲一区二区三区| 亚洲精品自在久久| 手机在线免费毛片| 亚洲伦乱视频| 一区二区三区久久| 亚洲国产欧美日韩| 天堂在线一二区| 国产精品影视网| 国产91精品久| 免费人成视频在线| 性欧美69xoxoxoxo| 国产午夜一区二区| 99久久免费看精品国产一区| 韩国三级成人在线| 欧美色成人综合| 国产原创中文在线观看| 中文字幕有码在线观看| 国产精品天美传媒沈樵| 欧美性大战久久久久| 可以免费观看的毛片| 久久精品国产免费| 国产成人精品a视频一区www| 日本一区二区不卡在线| 欧美日韩在线大尺度| xxx一区二区| jizz日本在线播放| 精品久久久久中文字幕小说| 精品香蕉一区二区三区| 国产又粗又长又爽| 久久香蕉精品香蕉| 亚洲国产精品电影在线观看| 免费啪视频在线观看| 一区二区三区在线免费看| 69久久夜色精品国产69蝌蚪网| jizz大全欧美jizzcom| 福利视频一区| 欧美日韩国产综合久久| www.com操| 99久久综合国产精品二区| 在线观看亚洲精品视频| 亚洲男人天堂色| 美女色狠狠久久| 色94色欧美sute亚洲线路一ni| 97视频在线免费播放| 亚洲国产福利| 在线日韩av片| 中文字幕第38页| 欧美亚洲人成在线| 在线不卡中文字幕| 日韩av影视大全| 一区二区三区高清在线观看| 日韩精品自拍偷拍| 一边摸一边做爽的视频17国产| 成人18夜夜网深夜福利网| 精品国产乱码久久久久久浪潮 | 激情五月激情综合| 色综合天天爱| 久久的精品视频| 免看一级a毛片一片成人不卡| 伊人狠狠色j香婷婷综合| 久久久久久这里只有精品| 自拍偷拍欧美亚洲| 久久高清免费观看| 国产一区私人高清影院| 国产黄色片免费| www.av精品| 欧美资源一区| 99福利在线| 亚洲成国产人片在线观看| 欧美 丝袜 自拍 制服 另类| 日韩精品免费观看视频| 欧美一区二区三区免费视频 | 亚洲精品一区二三区| 久久国产精品无码网站| 国产精品一区二区三区在线 | 久久久99久久精品女同性| 草视频在线观看| 国产九九精品| 国产欧美日韩最新| 丰满肥臀噗嗤啊x99av| 久久综合九色综合97婷婷| 亚洲一区3d动漫同人无遮挡| 97人人爽人人澡人人精品| 欧美亚洲动漫精品| caopor在线| 日韩国产欧美一区二区| 久久久久久综合网天天| 亚洲天堂aaa| 波多野结衣中文一区| 亚洲欧洲一区二区| h片在线观看下载| 在线观看一区二区视频| 亚洲欧美综合视频| 色综合天天爱| 欧美资源在线观看| 亚洲av无码片一区二区三区| 久久精品视频一区| 国产91沈先生在线播放| 国产三级一区| 亚洲精品日韩在线| 国产一级理论片| 久草精品在线观看| 日本高清一区| 成入视频在线观看| 日韩精品在线一区| 992在线观看| 日韩成人伦理电影在线观看| 国产亚洲欧美一区二区| 2024最新电影在线免费观看| 欧美亚洲动漫制服丝袜| 国产中年熟女高潮大集合| 亚洲国产影院| 99精品国产高清在线观看| 日本福利在线| 欧美在线播放高清精品| 91中文字幕永久在线| 最新成人av网站| 99国产在线| 污视频网站在线免费| 欧美电影影音先锋| 黑人狂躁日本娇小| 麻豆国产欧美一区二区三区| 色狠狠久久av五月综合|| 欧美电影h版| 日韩久久免费视频| 中文字幕在线观看视频网站| 成人美女视频在线看| 久操手机在线视频| 91丨精品丨国产| 久久精品一本久久99精品| 一级做a爱片久久毛片| 国产精品美女视频| 91国内在线播放| 欧美激情黄色片| 国产专区欧美专区| 麻豆免费在线观看| 欧美一区二区日韩一区二区| 欧美日韩中文字幕在线观看| 国产成人综合网| av网站大全免费| 久久久久观看| 日本精品视频在线观看| 福利片在线观看| 一本一本久久| 免费福利视频一区| 国产精品毛片aⅴ一区二区三区| av在线不卡精品| 外国电影一区二区| 久久久成人av毛片免费观看| 婷婷综合六月| 99久久久国产| 电影一区电影二区| 偷拍一区二区三区| 亚洲av无码一区二区二三区| 亚洲一区成人| 色视频一区二区三区| 六九午夜精品视频| 久久影视电视剧免费网站清宫辞电视 | 国产福利视频在线播放| 国内精品久久久久久久久电影网| 国产精品久久久久国产a级| 天天在线视频色| 欧美一卡二卡三卡四卡| 国产亚洲色婷婷久久99精品| 91香蕉国产在线观看软件| 欧美成人免费高清视频| 成人黄色小视频| 亚洲在线免费看| 里番在线播放| 亚洲性无码av在线| 136福利视频导航| 亚洲高清在线精品| 免费在线观看a视频| 国产精品99久久久| 干日本少妇首页| 欧美国产一区二区三区激情无套| 国产欧美日本在线| 第四色男人最爱上成人网| 久久精品国亚洲| 日韩中文字幕观看| 欧美日韩一区二区在线视频| 不卡的免费av| 国产精品热久久久久夜色精品三区| 一级日本黄色片| 国产毛片一区| 日本女人高潮视频| 亚洲自拍都市欧美小说| 亚洲一区二区三区乱码aⅴ| 午夜欧美激情| 久久的精品视频| 高h视频在线| 亚洲精品456在线播放狼人| 一二三四区在线| 疯狂做受xxxx高潮欧美日本| 欧美做爰啪啪xxxⅹ性| 久久天天做天天爱综合色| 无码人妻一区二区三区在线视频| 香蕉久久久久久久av网站| 国产精品一二三在线观看| 久久不见久久见国语| 古典武侠综合av第一页| 亚洲男女网站| 国产精品久久久久久久久久三级| √天堂8资源中文在线| 久久av中文字幕| av女优在线| 亚洲欧洲国产伦综合| 成人毛片在线免费观看| 7878成人国产在线观看| 老熟妇一区二区三区啪啪| 动漫精品一区二区| 国产精彩视频在线| 亚洲色图一区二区三区| 五月激情四射婷婷| 久久久久久一二三区| 国产xxxxxxxxx| 99精品偷自拍| 中文字幕99页| 国产麻豆精品久久一二三| 欧美日韩精品区别| 开心九九激情九九欧美日韩精美视频电影 | 色综合色狠狠综合色| 精品午夜福利在线观看| 一区二区三区美女视频| 伊人在线视频观看| 国产精品理伦片| 国产亚洲精品久久久久久豆腐| 久久久久综合网| av女人的天堂| 国产欧美一区二区精品性| 丝袜美腿中文字幕| 久久久精品日韩欧美| 性少妇bbw张开| 国产亚洲va综合人人澡精品| 在线国产视频一区| 国产视频一区二区在线观看| 国产精品无码午夜福利| 日本一区二区三区国色天香 | 一区二区三区国产免费| 日韩国产一区二| 午夜免费高清视频| 男人的j进女人的j一区| 99re精彩视频| 国产一区二区三区免费在线观看| 亚洲精品无码久久久久久久| 国产精品99久久久久久久vr| 日韩综合第一页| 久久久久久久久一| 国产传媒在线看| 日韩毛片在线免费观看| 91在线播放观看| 亚洲va欧美va人人爽午夜| 久久精品国产成人av| 日本精品一区二区三区高清 | 免费日本视频一区| 国产亚洲视频一区| 国产成人免费视频一区| 中文字幕第3页| 久久老女人爱爱| 天天鲁一鲁摸一摸爽一爽| 亚洲午夜在线电影| 亚洲不卡视频在线观看| 欧美男同性恋视频网站| 亚洲第一第二区| 亚洲欧美一区二区精品久久久| 日本在线观看www| 精品中文字幕在线| 在线观看涩涩| 91天堂在线视频| 欧美jizz19性欧美| 亚洲国产欧美不卡在线观看| 欧美视频福利| 精品少妇无遮挡毛片| 国产精品白丝jk白祙喷水网站| 欧美在线一级片| 国产农村妇女毛片精品久久麻豆| 欧美人妻一区二区| 日韩欧美在线观看视频| 91黄色在线视频| 亚洲国产成人爱av在线播放| 91caoporm在线视频| 久久久免费电影| 国产精品蜜月aⅴ在线| 91在线视频精品| 免费看成人哺乳视频网站| 蜜桃视频一区二区在线观看| 免费在线日韩av| 潘金莲一级淫片aaaaaaa| 久久精品一区二区三区av| 久久精品国产亚洲av香蕉| 欧美亚洲尤物久久| 蜜桃视频污在线观看| 色999日韩欧美国产| 一区二区精品伦理...| 成人字幕网zmw| 久久99国产精品视频| 成人免费a级片| 黑人巨大精品欧美黑白配亚洲| 成人h动漫精品一区| 亚洲一卡二卡三卡四卡五卡| 国产精品久久久久久久成人午夜| 精品视频偷偷看在线观看| 久久久久黄久久免费漫画| 国产精品看片资源| 亚洲裸色大胆大尺寸艺术写真| 国产91视频一区| 国产综合久久久久久久久久久久| 99久久久无码国产精品衣服| 舔着乳尖日韩一区| 国产自产一区二区| 欧美成人精品一区二区| 国产原创一区| 日韩精品一区二区三区四区五区| 99精品视频免费观看视频| 国产精品无码自拍| 亚洲欧美国产77777| 中文字幕永久在线观看| 一区二区在线视频| 欧美成人ⅴideosxxxxx| 久久久久久久久久久一区| 亚洲激情av| 国产老熟女伦老熟妇露脸| 亚洲成人777| 日本激情视频网站| 久久久在线免费观看| 哺乳挤奶一区二区三区免费看| 日日噜噜夜夜狠狠久久丁香五月| 韩国女主播成人在线观看| 欧美视频一区二区在线| 欧美日韩一区小说| 秋霞影院午夜丰满少妇在线视频| 国产精选久久久久久| 亚洲mv大片欧洲mv大片| 亚洲三级在线观看视频| 亚洲视频你懂的| 国产成人精品一区二三区四区五区| 久久影院中文字幕| 国产午夜精品一区在线观看| 国产性生活免费视频| 成人国产免费视频| 欧美亚韩一区二区三区| 日韩精品免费综合视频在线播放| 永久免费毛片在线播放| 欧洲成人一区二区| 日韩电影在线观看电影| 免费黄色在线网址| 51精品秘密在线观看| 伊人手机在线| 国产精品久久九九| 亚洲一区二区三区高清不卡| 欧美 日韩 国产 成人 在线观看| 欧美亚洲国产一区在线观看网站| 黄在线免费看| 国产99午夜精品一区二区三区 | 欧美绝顶高潮抽搐喷水合集| 欧美日韩激情视频在线观看| 国产婷婷色一区二区三区| 中文字幕一区二区人妻| 久久精品久久久久久| 超碰在线成人| av五月天在线| 亚洲人成影院在线观看| 六月丁香色婷婷| 国产精品精品视频一区二区三区| 我不卡影院28| 亚洲成a人无码| 日本丶国产丶欧美色综合| 国内外激情在线| 精品国产中文字幕| 免费一区二区视频| 久久成人在线观看| 精品在线欧美视频| 亚洲成人高清| 日本国产在线播放| 国产精品美女久久久久av爽李琼 | 亚洲美女精品久久| 国产精品一级在线观看| 日本www在线视频| 国产精品成人一区二区艾草| 少妇av在线播放|