精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大規(guī)模語言模型高效參數微調--BitFit/Prefix/Prompt 微調系列

人工智能
Prompt Tuning 可以看作是 Prefix Tuning 的簡化版本,它給每個任務定義了自己的 Prompt,然后拼接到數據 上作為輸入,但只在輸入層加入 prompt tokens,并且不需要加入 MLP 進行調整來解決難訓練的問題。

2018 年谷歌發(fā)布了 BERT,一經面世便一舉擊敗 11 個 NLP 任務的 State-of-the-art (Sota) 結果,成為了 NLP 界新的里程碑; BERT 的結構如下圖所示, 左邊是 BERT 模型預訓練過程, 右邊是對于具體任務的微調過程。其中, 微調 階段是后續(xù)用于一些下游任務的時候進行微調, 例如: 文本分類, 詞性標注, 問答系統(tǒng)等, BERT 無需調整結構 就可以在不同的任務上進行微調。通過”預訓練語言模型 + 下游任務微調”的任務設計, 帶來了強大的模型效 果。從此,“預訓練語言模型 + 下游任務微調”便成為了 NLP 領域主流訓練范式。

BERT 結構圖,左邊是預訓練過程,右邊是具體任務微調過程BERT 結構圖,左邊是預訓練過程,右邊是具體任務微調過程

但是, 以 GPT3 為代表的大規(guī)模語言模型(LLM) 參數規(guī)模變得越來越大, 這使得在消費級硬件上進行全量 微調變得不可行。下表展示了在一張 A100 GPU  (80G 顯存) 以及 CPU 內存 64GB 以上的硬件上進行模型全量 微調以及參數高效微調對于 CPU/GPU 內存的消耗情況。

全量參數微調與參數高效微調顯存占用對比全量參數微調與參數高效微調顯存占用對比

除此之外, 模型全量微調還會損失多樣性, 存在災難性遺忘的問題。因此, 如何高效的進行模型微調就成了業(yè)界研究的重點,這也為參數高效微調技術的快速發(fā)展帶來了研究空間。

參數高效微調是指微調少量或額外的模型參數, 固定大部分預訓練模型(LLM) 參數, 從而大大降低了計 算和存儲成本, 同時, 也能實現與全量參數微調相當的性能。參數高效微調方法甚至在某些情況下比全量微調 效果更好,可以更好地泛化到域外場景。

高效微調技術可以粗略分為以下三大類,如下圖所示:增加額外參數(A)、選取一部分參數更新(S)、引入重參數化(R)。 而在增加額外參數這類方法中,又主要分為類適配器(Adapter-like)方法和軟提示(Soft prompts)兩個小類。

常見的參數高效微調技術有 BitFit 、Prefix Tuning 、Prompt Tuning 、P-Tuning 、Adapter Tuning 、LoRA 等, 后 面章節(jié)將對一些主流的參數高效微調方法進行講解。

常見的參數高效微調技術和方法常見的參數高效微調技術和方法

BitFit/Prefix/Prompt 微調系列

BitFit

雖然對每個任務進行全量微調非常有效, 但它也會為每個預訓練任務生成一個獨特的大型模型, 這使得很 難推斷微調過程中發(fā)生了什么變化,也很難部署,特別是隨著任務數量的增加,很難維護。

理想狀況下,我們希望有一種滿足以下條件的高效微調方法:

上述的問題取決于微調過程能多大程度引導新能力的學習以及暴露在預訓練 LM 中學到的能力。雖然, 之 前的高效微調方法 Adapter-Tuning 、Diff-Pruning 也能夠部分滿足上述的需求。一種參數量更小的稀疏的微調方 法 BitFit 可以滿足上述所有需求。

BitFit 是一種稀疏的微調方法, 它訓練時只更新 bias 的參數或者部分 bias 參數。對于 Transformer 模型而言, 凍結大部分 transformer-encoder 參數, 只更新 bias 參數跟特定任務的分類層參數。涉及到的 bias 參數有 attention  模塊中計算 query,key,value 跟合并多個 attention 結果時涉及到的bias,MLP 層中的bias,Layernormalization 層的 bias 參數,預訓練模型中的bias參數如下圖所示。

圖片圖片

PLM 模塊代表了一個特定的 PLM 子層, 例如注意力或 FFN,圖中橙色塊表示可訓練的提示向量, 藍色 塊表示凍結的預訓練模型參數

在 Bert-Base/Bert-Large 這種模型里, bias 參數僅占模型全部參數量的 0.08%~0.09%。但是通過在 Bert-Large  模型上基于 GLUE 數據集進行了 BitFit、Adapter 和 Diff-Pruning 的效果對比發(fā)現, BitFit 在參數量遠小于Adapter、 Diff-Pruning 的情況下,效果與 Adapter 、Diff-Pruning 想當,甚至在某些任務上略優(yōu)于 Adapter 、Diff-Pruning。

通過實驗結果還可以看出, BitFit 微調結果相對全量參數微調而言, 只更新極少量參數的情況下, 在多個數 據集上都達到了不錯的效果, 雖不及全量參數微調, 但是遠超固定全部模型參數的 Frozen 方式。同時, 通過對 比 BitFit 訓練前后的參數, 發(fā)現很多 bias 參數并沒有太多變化(例如:跟計算 key 所涉及到的 bias 參數)。發(fā)現 計算 query 和將特征維度從 N 放大到 4N 的 FFN 層(intermediate) 的 bias 參數變化最為明顯, 只更新這兩類 bias 參數也能達到不錯的效果,反之,固定其中任何一者,模型的效果都有較大損失。

Prefix Tuning

在 Prefix Tuning 之前的工作主要是人工設計離散的模版或者自動化搜索離散的模版。對于人工設計的模版, 模版的變化對模型最終的性能特別敏感, 加一個詞、少一個詞或者變動位置都會造成比較大的變化。而對于自動 化搜索模版, 成本也比較高;同時, 以前這種離散化的 token 搜索出來的結果可能并不是最優(yōu)的。除此之外, 傳 統(tǒng)的微調范式利用預訓練模型去對不同的下游任務進行微調, 對每個任務都要保存一份微調后的模型權重, 一 方面微調整個模型耗時長;另一方面也會占很多存儲空間。基于上述兩點, Prefix Tuning 提出固定預訓練 LM,為LM 添加可訓練, 任務特定的前綴, 這樣就可以為不同任務保存不同的前綴, 微調成本也小; 同時, 這種 Prefix  實際就是連續(xù)可微的 Virtual Token  (Soft Prompt/Continuous Prompt),相比離散的 Token ,更好優(yōu)化,效果更好。

那么 prefix 的含義是什么呢?prefix 的作用是引導模型提取 x 相關的信息, 進而更好地生成 y。例如, 我們 要做一個 summarization 的任務, 那么經過微調后, prefix 就能領悟到當前要做的是個“總結形式”的任務, 然后 引導模型去 x 中提煉關鍵信息;如果我們要做一個情感分類的任務, prefix 就能引導模型去提煉出 x 中和情感相 關的語義信息,以此類推。這樣的解釋可能不那么嚴謹,但大家可以大致體會一下 prefix 的作用。

Prefix Tuning 是在輸入 token 之前構造一段任務相關的 virtual tokens 作為 Prefix,然后訓練的時候只更新 Prefix 部分的參數,而 PLM 中的其他部分參數固定。針對不同的模型結構,需要構造不同的 Prefix:

  • 針對自回歸架構模型:在句子前面添加前綴, 得到 z = [PREFIX; x; y],合適的上文能夠在固定 LM 的情況 下去引導生成下文(比如:GPT3 的上下文學習)。
  • 針對編碼器-解碼器架構模型:Encoder 和 Decoder 都增加了前綴,得到 z = [PREFIX; x; PREFIX0; y]。Encoder 端增加前綴是為了引導輸入部分的編碼, Decoder 端增加前綴是為了引導后續(xù) token 的生成。

圖片圖片

上部分的微調更新所有 Transformer 參數(紅色框),并且需要為每個任務存儲完整的模型副本。下部分 的 Prefix Tuning 凍結了 Transformer 參數并且只優(yōu)化前綴(紅色框)

該方法其實和構造 Prompt 類似, 只是 Prompt 是人為構造的“顯式”的提示, 并且無法更新參數, 而 Prefix 則是可以學習的“隱式”的提示。同時,為了防止直接更新 Prefix 的參數導致訓練不穩(wěn)定和性能下降的情況,在 Prefix 層前面加了 MLP 結構, 訓練完成后, 只保留 Prefix 的參數。除此之外, 通過消融實驗證實, 只調整 embedding 層的表現力不夠,將導致性能顯著下降,因此,在每層都加了 prompt 的參數,改動較大。

Prefix Tuning 雖然看起來方便,但也存在以下兩個顯著劣勢:

Prompt Tuning

大模型全量微調對每個任務訓練一個模型, 開銷和部署成本都比較高。同時, 離散的 prompts  (指人工設計 prompts 提示語加入到模型) 方法, 成本比較高, 并且效果不太好。Prompt Tuning 通過反向傳播更新參數來學習 prompts,而不是人工設計 prompts;同時凍結模型原始權重, 只訓練 prompts 參數, 訓練完以后, 用同一個模型 可以做多任務推理。

圖片圖片

模型調整需要為每個任務制作整個預訓練模型的特定任務副本下游任務和推理必須在分開批次。Prompt Tuning 只需要為每個任務存儲一個小的特定于任務的提示,并且使用原始預訓練模型啟用混合任務推理。

Prompt Tuning 可以看作是 Prefix Tuning 的簡化版本,它給每個任務定義了自己的 Prompt,然后拼接到數據 上作為輸入,但只在輸入層加入 prompt tokens,并且不需要加入 MLP 進行調整來解決難訓練的問題。

通過實驗發(fā)現,隨著預訓練模型參數量的增加,Prompt Tuning 的方法會逼近全參數微調的結果。同時, Prompt Tuning 還提出了 Prompt Ensembling,也就是在一個批次(Batch) 里同時訓練同一個任務的不同 prompt  (即采用 多種不同方式詢問同一個問題) ,這樣相當于訓練了不同模型, 比模型集成的成本小多了。除此之外, Prompt Tuning 論文中還探討了 Prompt token 的初始化方法和長度對于模型性能的影響。通過消融實驗結果發(fā)現, 與隨機 初始化和使用樣本詞匯表初始化相比, Prompt Tuning 采用類標簽初始化模型的效果更好。不過隨著模型參數規(guī) 模的提升, 這種 gap 最終會消失。Prompt token 的長度在 20 左右時的表現已經不錯(超過 20 之后, 提升Prompt token 長度, 對模型的性能提升不明顯了),同樣的, 這個 gap 也會隨著模型參數規(guī)模的提升而減小(即對于超大 規(guī)模模型而言,即使 Prompt token 長度很短,對性能也不會有太大的影響)。

責任編輯:武曉燕 來源: AI大模型咨訊
相關推薦

2025-05-08 05:00:00

2024-01-18 15:38:17

語言模型大型語言模型

2025-04-10 07:59:51

2023-06-09 08:00:00

QLoRa語言模型微調

2024-07-22 08:17:00

模型性能

2024-04-15 12:50:00

大型語言模型ReFT

2023-03-06 13:59:38

模型參數

2024-03-18 13:36:36

大型語言模型個人可識別信息

2023-06-07 08:22:59

LLM微調技術

2024-11-21 08:22:45

2024-05-07 08:00:00

自然語言處理機器學習

2025-06-26 09:06:59

2023-06-02 15:47:49

2025-01-14 10:56:14

2025-02-24 14:15:00

模型訓練AI

2024-12-10 09:07:17

2025-10-11 18:05:23

AI智能體模型

2023-12-18 13:37:44

天翼云天池大語言模型

2024-09-09 07:46:16

點贊
收藏

51CTO技術棧公眾號

激情五月婷婷网| www.se五月| 国产小视频福利在线| 看国产成人h片视频| 欧美国产第一页| 性欧美13一14内谢| 国产精品日本一区二区三区在线 | 精品日韩在线观看| 白嫩少妇丰满一区二区| 国产剧情在线| 久久精品一区二区三区不卡牛牛| 成人福利视频网| 免费在线观看黄网站| 国产高清一区二区| 日韩久久午夜影院| www.色.com| 蜜桃视频成人m3u8| 午夜精品福利视频网站| 影音先锋亚洲视频| 免费理论片在线观看播放老| 国产麻豆日韩欧美久久| 亲爱的老师9免费观看全集电视剧| 蜜桃av.com| 伊人成综合网伊人222| 欧美一级在线视频| 五月天婷婷激情视频| 国产www视频在线观看| 国产精品人妖ts系列视频| 精品高清视频| 国产叼嘿视频在线观看| 日本少妇一区二区| 欧美做爰性生交视频| 欧美日韩精品在线观看视频 | 成人免费视频一区| 成人亚洲激情网| 手机av免费观看| 亚洲作爱视频| 久久久久九九九九| 永久免费看黄网站| 亚洲情侣在线| www.日韩系列| 国产成人精品视频免费| 欧美日韩国产免费观看视频| 亚洲成人精品视频| 美女流白浆视频| 日韩高清二区| 欧美一区二区三区不卡| 色戒在线免费观看| 日韩午夜视频在线| 欧美日韩dvd在线观看| 91热这里只有精品| 视频在线日韩| 在线观看日韩电影| 亚洲免费av一区二区三区| 色一区二区三区| 欧美日韩亚洲精品内裤| 99精品人妻少妇一区二区 | 五月天欧美精品| 久无码久无码av无码| 免费看电影在线| 亚洲国产一区二区视频| 婷婷无套内射影院| 日本不卡网站| 色噜噜久久综合| 日本爱爱免费视频| 亚洲精品aa| 日韩欧美一区二区不卡| 91porn在线| 日本一区福利在线| 亚洲日本成人女熟在线观看| 亚洲理论片在线观看| 欧美自拍偷拍| 久久九九有精品国产23| 国产精品111| 午夜一级久久| 国产欧美精品久久久| 国产精品欧美激情在线| 国产精品99久久久| 精品亚洲一区二区三区四区五区高| 天堂中文在线看| 国产欧美一区二区精品性色超碰| 曰韩不卡视频| 少妇视频在线| 欧美午夜性色大片在线观看| 国产精品天天av精麻传媒| 亚洲欧美综合久久久久久v动漫| 日韩一区二区三区视频在线| 日本人添下边视频免费| 国产成人短视频在线观看| 伊人久久综合97精品| 91视频综合网| 亚洲欧美日本日韩| 成人福利网站在线观看| 免费看av毛片| 国产精品久久久久久久久久久免费看| 一本色道久久88亚洲精品综合| 蜜桃视频在线观看播放| 欧美精品九九99久久| 波多野结衣加勒比| 久久99精品久久| 精品人伦一区二区三电影| 国产在线一区二区三区四区| 精品粉嫩aⅴ一区二区三区四区 | 99在线视频免费| 天天超碰亚洲| 欧美亚洲免费电影| 国产露脸91国语对白| 99久久久精品| 女女同性女同一区二区三区按摩| 黄色18在线观看| 欧美高清dvd| 老鸭窝一区二区| 欧美一区二区| 国产精品美女久久久久久免费| 亚洲精品久久久久久久久久久久久久 | 国产日本在线视频| 亚洲高清免费观看| 国产精品久久久久久久99| 视频国产一区| 久久欧美在线电影| 99国产精品久久久久久久成人| 久久综合九色综合欧美98| av动漫在线播放| 国产伊人久久| 亚洲欧美一区二区三区久久| 久青草免费视频| 国产自产高清不卡| 亚洲综合欧美日韩| 国产成人免费9x9x人网站视频| 精品国产乱码久久| 欧美精品色哟哟| 久久99精品视频| 亚洲精品8mav| 粉嫩91精品久久久久久久99蜜桃| 亚洲美女黄色片| 日本高清www免费视频| 国产suv精品一区二区三区| 午夜精品一区二区在线观看的| 性欧美18~19sex高清播放| 亚洲аv电影天堂网| 久久精品www| 国产精品99久久久久久宅男| 中文字幕一区二区三区有限公司 | 黄色视屏免费在线观看| 欧美美女bb生活片| 最新黄色av网址| 久久99深爱久久99精品| 亚洲午夜精品久久久久久浪潮| 久久精品女人天堂av免费观看 | 国产98在线|日韩| 主播国产精品| 精品久久久久久久久久久久包黑料| 日本a级片视频| 国产激情视频一区二区三区欧美| 黄色网址在线免费看| 欧美经典一区| 欧美激情视频一区二区三区不卡| 国产高清第一页| 亚洲尤物视频在线| v天堂中文在线| 性色一区二区| 视频二区一区| 99亚洲男女激情在线观看| 免费成人高清视频| 成人免费一级视频| 五月天久久比比资源色| xxxx日本免费| 九九**精品视频免费播放| 大地资源第二页在线观看高清版| 欧美久久亚洲| 91国产视频在线| 黄色av网址在线免费观看| 欧美系列亚洲系列| 午夜69成人做爰视频| 成人短视频下载| 日本三区在线观看| 图片区亚洲欧美小说区| 动漫精品视频| 二吊插入一穴一区二区| 日韩视频欧美视频| 人人妻人人玩人人澡人人爽| 欧美日韩中文字幕日韩欧美| 超碰人人干人人| 国产99一区视频免费| 国产熟女高潮视频| 国产精品伦理久久久久久| 国产精品美女xx| 精品网站在线| 欧美精品videossex性护士| 国产在线观看黄| 91精品视频网| 午夜婷婷在线观看| 亚洲欧美精品午睡沙发| 人妻丰满熟妇av无码久久洗澡| 免费的成人av| 青青草视频在线免费播放| 青青草国产成人a∨下载安卓| 99电影网电视剧在线观看| 人人鲁人人莫人人爱精品| 久久99国产精品自在自在app| 日本福利片在线| 91精品国产欧美一区二区18| 五月天婷婷久久| 一区二区三区久久| 人人妻人人澡人人爽| 福利视频网站一区二区三区| 欧美伦理片在线观看| 亚洲二区视频| 熟女视频一区二区三区| 欧美日韩国产高清电影| 精品国产中文字幕| 国产欧美视频在线| 国产精品视频网| 97成人资源| 国内精品久久久久久中文字幕 | 性生交生活影碟片| 欧美日韩专区在线| 成人免费视频国产免费| 五月天视频一区| 国产成人精品av久久| 亚洲视频免费在线| 日本黄色小视频在线观看| 99久久99久久综合| av电影在线播放| 国产一区二区电影| 男女污污视频网站| 蜜桃久久av一区| 亚洲男人天堂色| 久久aⅴ乱码一区二区三区| 乱人伦xxxx国语对白| 欧美三级第一页| 精品嫩模一区二区三区| 国产精品成人a在线观看| 先锋影音欧美| 欧洲毛片在线视频免费观看| 欧美精品国产精品久久久| 亚洲精品**不卡在线播he| 久久爱av电影| 亚洲妇女av| 欧美日产一区二区三区在线观看| 欧美jizz19性欧美| 久久精品99| 一区二区美女| 色999日韩自偷自拍美女| 黑丝美女一区二区| 日韩国产欧美一区| 色狮一区二区三区四区视频| 一区二区三区欧美在线| 亚洲啊v在线观看| 日韩精品第1页| 国产精品第十页| 国产午夜福利100集发布| 国产日韩亚洲欧美精品| 久久久久久久激情| 日韩精品欧美成人高清一区二区| 国产熟人av一二三区| 日本欧美一区二区三区| 国产一区二区在线观看免费视频| 久久 天天综合| 日本成人xxx| 成人污污视频在线观看| 精品人妻一区二区免费视频| www国产精品av| 中文字幕伦理片| 亚洲欧美一区二区视频| 欧美黄色免费在线观看| 精品动漫一区二区三区| 日韩 国产 欧美| 欧美精品xxxxbbbb| www黄色网址| 日韩精品一区二区三区第95| 福利在线午夜| 精品自在线视频| 男人的天堂免费在线视频| 国产成人一区二| 国产激情综合| 九九99久久| 色乱码一区二区三区网站| 成人一级生活片| 日韩中文字幕区一区有砖一区| 在线观看国产福利| www.亚洲在线| 久久精品国产亚洲AV成人婷婷| 亚洲精品高清在线观看| 亚洲 欧美 成人| 日韩午夜激情免费电影| 经典三级在线| 九九热精品在线| 日韩高清成人| 99久久99| 日韩欧美精品| 久久国产精品网| 极品销魂美女一区二区三区| 国产精品手机在线观看| 成人欧美一区二区三区黑人麻豆| 国产精品99精品| 欧美日韩亚洲国产综合| 亚洲av成人精品毛片| 精品国产一区二区三区久久| 黄色在线网站噜噜噜| 成人免费在线网址| 国产乱码精品一区二区亚洲| 97中文字幕在线| 麻豆一区二区三区| 一区二区三区免费在线观看视频| 亚洲久草在线视频| 中文字幕人妻精品一区| 亚洲国产天堂久久国产91 | 亚洲男人天堂2021| 久久久久久**毛片大全| 久久免费小视频| 欧美高清你懂得| 黄色在线小视频| 午夜精品视频在线| 日韩视频在线直播| 91社在线播放| 麻豆精品在线观看| 日韩女同一区二区三区| 精品国产老师黑色丝袜高跟鞋| 国产色视频在线| 色婷婷综合成人| 欧美成人免费电影| 国产在线一区二区三区四区| 欧美日韩99| 秋霞午夜鲁丝一区二区| 亚洲欧洲成人精品av97| 中文字幕日本视频| 亚洲欧美日韩国产成人| 交100部在线观看| 国产伦精品一区二区三区高清版| 亚洲精品一二三区区别| 97超碰人人爽| 一区二区中文字幕在线| 亚洲一区二区视频在线播放| 一区二区三区视频免费在线观看| 亚洲少妇视频| 美女视频久久| 久久高清国产| 国产精品久久久久久久av| 欧美中文字幕一区| 国产精品一区在线看| 国产精品久久久久久久久久| 精品成av人一区二区三区| 日本爱爱免费视频| 国产精品久久二区二区| 97人妻一区二区精品免费视频| 日韩亚洲第一页| 国产精品va视频| 99久久99久久精品| 豆国产96在线|亚洲| 久久无码精品丰满人妻| 亚洲国产精品成人av| 麻豆免费在线| 欧美日韩一区二| 美女国产一区二区| а天堂中文在线资源| 欧美高清www午色夜在线视频| av片在线观看| 国产一区精品视频| 久久狠狠婷婷| 日本女人性生活视频| 日韩欧美一区二区视频| 蜜桃av在线播放| 亚洲国产精品久久久久婷婷老年 | 亚洲成人网在线播放| 欧美影视一区在线| 久久亚洲天堂| 国产高清在线一区二区| 噜噜噜在线观看免费视频日韩 | 久久久久久久久久久久久久| 亚洲国产综合av| 亚洲成人免费影院| 黄色小视频在线免费观看| 国产综合视频在线观看| 亚洲天堂偷拍| 在线观看福利片| 欧美一区国产二区| 日本不卡网站| 日本福利视频导航| av不卡在线播放| 在线观看一二三区| 欧美激情国产日韩精品一区18| 日本午夜精品| 在线视频一二区| 日韩欧美在线观看| av在线免费网址| 欧美大陆一区二区| 国产一区免费电影| 亚洲免费黄色网址| 久久综合久中文字幕青草| 亚洲免费专区| 欧美人与性动交α欧美精品| 一本大道av一区二区在线播放| 欧洲不卡视频| 日本10禁啪啪无遮挡免费一区二区| 国产乱码一区二区三区| 九九热最新视频| 亚洲91精品在线| 91精品国产视频| a级大片在线观看|