精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型微調技巧 | 高質量指令數據篩選方法-MoDS

發布于 2024-7-16 09:11
瀏覽
0收藏

寫在前面

大家好,我是劉聰NLP。

大模型時代,指令微調已經成了算法工程師們必不可少的技能。而在指令微調過程中,我們往往會從數據數量和數據質量兩個維度來對模型進行調優。

今天給大家帶來一個新的方法-MoDS,一種面向模型的指令數據選擇方法-《MoDS: Model-oriented Data Selection for Instruction Tuning》,核心是從數據質量、覆蓋范圍、必要性三個角度來對原始數據集進行數據過濾,最終獲取對于不同模型的高質量數據集。并且相較于自動識別方法,在使用更少數據的情況下,就可以獲取更好的效果。

paper: https://arxiv.org/pdf/2311.15653.pdf
github: https://github.com/CASIA-LM/MoDS

MoDS方法

MoDS方法主要通過質量、覆蓋范圍、必要性三個指標來進行數據的篩選,其中數據質量是為了保證所選的指令數據的問題和答案都足夠好;數據覆蓋范圍是為了讓所選擇的數據中指令足夠多樣、涉及知識范圍更廣;數據必要性是選擇對于大模型較復雜、較難或不擅長的數據以填補大模型能力的空白。整體流程如下圖所示,

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

質量篩選

對于數據進行質量過濾時,采用OpenAssistant的reward-model-debertav3-large-v2模型(一個基于DeBERTa架構設計的獎勵模型)對數據進行質量打分。講原始數據的Instruction、Input、Output的三個部分進行拼接,送入到獎勵模型中,得到一個評分,當評分超過α時,則認為數據質量達標,構建一份高質量數據集-Data1。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

多樣性篩選

為了避免所選質量數據高度相似,通過K-Center-Greedy算法進行數據篩選,在最大化多樣性的情況下,使指令數據集最小。獲取種子指令數據集(Seed Instruction Data)-SID。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

在該步驟中,采用BERT模型為指令數據生成句向量來計算不同數據之間的距離。

必要性篩選

不同的大型語言模型在預訓練過程中所學到的知識和具有的能力不同,因此在對不同的大型語言模型進行指令微調時,所需的指令數據也需要不同。

對于一條指令,如果給定的大型語言模型本身能夠生成較好的回答,則說明給定的大型語言模型具有處理該指令或者這類指令的能力,反之亦然,并且哪些不能處理的指令對于模型微調來說更為重要。

  • 使用SID數據集對模型進行一個初始訓練
  • 用訓練好的初始模型對整個高質數據集-Data1中的指令進行結果預測
  • 利用獎勵模型對結果進行評分,當分值小于β時,說明初始模型不能對這些指令生成優質的回復,不具有處理這些類型指令的能力,獲取必要性數據集-Data2
  • 對Data2進行多樣性篩選,獲取增強指令數據集(Augmented Instruction Data)-AID。

模型訓練

最終利用種子指令數據集和增強指令數據集一起對模型進行指令微調,獲得最終模型。

實驗結果

訓練數據

訓練數據有兩種,一種是單獨的Alpaca數據集(52k),一種時混合數據集(214k),包含HC3數據集、Alpaca數據集、Alpaca-evol-instruct數據集、Dolly-v2數據集、InstructWild數據集和LIMA數據集。

測試數據主要包含5個測試集,分別為Koala數據集(180)、WizardLM數據集(218)、Self-instruct數據集(252)、Vicuna數據集(80)和LIMA數據集(300)。

訓練超參

模型基座采用LLaMA2-7B模型,訓練過程中學習率為2e-5,warmup的比率為0.03,權重衰減為0.0,批大小為128,訓練輪數為3。在質量評價和必要性評價過程中,Alpaca數據集的α和β均設置為0.0,混合數據集的α和β分別設置為1.0和-1.0。

在模型測試過程中,采用ChatGPT和GPT4作為裁判,對模型生成結果從相關性和準確性兩個角度進行打分,每個角度的評分從1到10。在評價兩個模型勝、平、負時,當兩個角度評分都高時為勝;當兩個角度評分一高一低時為平;當兩個角度評分都低時為負。

結果分析

在Alpaca數據集中通過MoDS方法獲取1k數據的效果要優于全量數據訓練的結果,如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

在Alpaca數據集中MoDS方法在選擇2k數據時,訓練效果優于基于IFD的自動選擇方法,如下表所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

在混合數據及中MoDS方法獲取4k數據的效果全面優于全量數據訓練的結果,如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

驗證指令多樣性選擇的重要性,與隨機選擇進行對比,如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

驗證必要性篩選的重要性,與僅用種子數據訓練的模型進行對比,如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

寫在最后

大模型時代,大多數算法工程師已經變成了數據工程師,如何構造出讓模型表現更好地數據,變成了大家的日常工作,但千萬不要小看這份工作,往往細節決定成敗。

本文轉載自 ??NLP工作站??,作者: 劉聰NLP

已于2024-7-16 09:24:20修改
收藏
回復
舉報
回復
相關推薦
蜜臀精品一区二区三区| 强伦女教师2:伦理在线观看| 国产精品久久久久久久久久精爆| 欧美日韩国产高清电影| 桃花岛tv亚洲品质| 奶水喷射视频一区| 日韩在线观看高清| 少妇丰满尤物大尺度写真| 极品在线视频| 亚洲国产岛国毛片在线| 97人人模人人爽人人喊38tv| 日本中文字幕久久| 欧美精品三区| 亚洲日本中文字幕免费在线不卡| 熟妇无码乱子成人精品| 在线成人av观看| 亚洲另类色综合网站| 欧美一二三区| 色欲久久久天天天综合网| 毛片av一区二区| 国内自拍欧美激情| 亚洲AV成人无码精电影在线| 精品淫伦v久久水蜜桃| 欧美日韩国产片| 色欲av无码一区二区人妻| 香蕉久久aⅴ一区二区三区| 欧美激情一区不卡| 久久久久se| 精品久久久免费视频| 日本免费新一区视频| 国内精品一区二区三区| 日本一级二级视频| 99精品网站| 亚洲欧美一区二区三区四区| 中文字幕人妻一区二区三区| 国产麻豆一区二区三区| 欧美图区在线视频| 欧美精品第三页| 免费v片在线观看| 欧美亚洲一二三区| 影音先锋国产在线| 男人的天堂亚洲| 国内外成人免费激情在线视频| 色老板免费视频| 成人网18免费网站| 亚洲午夜av久久乱码| www.超碰97| 国产丝袜一区| 亚洲成人久久久久| www男人天堂| av不卡一区| 精品久久五月天| 蜜桃色一区二区三区| 免费精品一区| 日韩午夜电影av| 色姑娘综合天天| 欧美成人精品午夜一区二区| 日韩精品中文字幕在线不卡尤物| 亚洲一区精品视频在线观看| 欧美成人黄色| 欧美久久一二区| 一级黄色片在线免费观看| 99久热在线精品视频观看| 91精品国模一区二区三区| а 天堂 在线| 日韩精品一级| 亚洲成人久久网| 亚洲国产精品无码久久久久高潮| 欧美调教视频| 在线观看国产精品淫| 少妇愉情理伦三级| 亚洲精品网址| 欧美激情啊啊啊| 日韩精品一区三区| 午夜在线一区| 国产精品高清免费在线观看| 91久久精品国产91性色69| 国产在线精品一区二区不卡了| 亚洲综合色激情五月| 蜜臀久久99精品久久久| 久久亚洲综合色| 无码免费一区二区三区免费播放| 精品麻豆一区二区三区| 亚洲国产日日夜夜| 37pao成人国产永久免费视频| 免费观看成人性生生活片 | 久久亚洲成人av| 在线精品一区二区| 国产精品9999| 精品人妻一区二区三区麻豆91| 97国产一区二区| 亚洲成人网上| 99热99re6国产在线播放| 在线看不卡av| 男人女人拔萝卜视频| 欧亚精品一区| 精品久久国产精品| 日韩精品成人在线| 久久99热99| 久久国产精品亚洲va麻豆| 五月天婷婷在线视频| 亚洲午夜在线视频| 嫩草av久久伊人妇女超级a| 日韩免费一级| 一区二区三区精品99久久 | porn亚洲| 亚洲成人午夜电影| 中文字幕资源在线观看| 西瓜成人精品人成网站| 欧美乱妇高清无乱码| 在线免费观看av网址| 国产成人在线看| 亚洲高清视频一区| 成人动漫一区| 亚洲电影免费观看高清完整版在线观看| 性爱在线免费视频| 国产日韩欧美一区| 国产91精品一区二区绿帽| 自拍av一区二区三区| 波多野结衣家庭教师在线| 亚洲网站三级| 亚洲欧洲日产国码av系列天堂| 国产波霸爆乳一区二区| 日本欧美一区二区三区乱码| 国产精品一区二区av| 国产精品一卡二卡三卡| 91国偷自产一区二区开放时间 | 欧美激情第99页| 一级特黄aaa| 日本一区二区免费在线观看视频| 2018国产在线| 中文字幕区一区二区三| www.久久撸.com| 国产精品无码粉嫩小泬| 久久亚洲影视婷婷| 99爱视频在线| 欧美人与动xxxxz0oz| 欧美韩国理论所午夜片917电影| 一本一道精品欧美中文字幕| 中文字幕欧美日韩一区| 国产福利影院在线观看| 国产欧美一区二区精品久久久| 欧美在线视频网| 先锋av资源站| 欧美日韩午夜激情| 国产麻豆xxxvideo实拍| 激情视频一区| 久久99久久精品国产| 成av人片在线观看www| 亚洲国产99精品国自产| 日本天堂网在线观看| 成人免费视频一区| www..com日韩| 丝袜美腿一区二区三区动态图| 91精品国产九九九久久久亚洲| 人妻91麻豆一区二区三区| 亚洲第一精品在线| 成人精品在线观看视频| 久久大逼视频| 亚洲国产精品一区二区第一页 | 欧美性受xxxx黑人xyx性爽| 中文字幕网站在线观看| 日本欧美韩国一区三区| 中文字幕制服丝袜在线| 欧美黄视频在线观看| 欧美激情网友自拍| 午夜视频免费在线| 欧美在线|欧美| 国产精品国产精品88| 国产99精品在线观看| 国产91对白刺激露脸在线观看| 欧美精品一区二区久久| 国产一区视频在线| 羞羞的视频在线观看| 亚洲精品第一页| 欧美日韩a v| 自拍偷拍欧美激情| 国产精品成人99一区无码 | 欧洲美女亚洲激情| 欧美日韩视频| 欧美尤物一区| 91精品麻豆| 久久久女人电视剧免费播放下载| 日韩欧美亚洲系列| 欧美日高清视频| 国产一级在线视频| 欧美激情在线一区二区三区| 女教师高潮黄又色视频| 久久精品1区| 99亚洲国产精品| 欧美网色网址| 91在线精品视频| 台湾佬中文娱乐网欧美电影| 久久精品国产欧美亚洲人人爽| 蜜桃在线一区二区| 欧美麻豆精品久久久久久| 久久精品女人毛片国产| 中文字幕乱码亚洲精品一区 | 91在线一区| 国产精品国产福利国产秒拍| 欧美草逼视频| 在线观看欧美日韩| 日韩在线一区二区三区四区| 欧美日韩一区三区| 日韩精品――中文字幕| 亚洲视频1区2区| 谁有免费的黄色网址| 高清不卡在线观看| 中文字幕线观看| 日韩影院在线观看| 日韩国产一级片| 亚洲色图网站| 色之综合天天综合色天天棕色| 欧美一级一片| 国产91一区二区三区| 久久亚洲精品中文字幕| 热草久综合在线| 9lporm自拍视频区在线| 欧美成人免费在线视频| 日本中文字幕在线观看| 亚洲精品自拍视频| 亚洲高清视频网站| 欧美丰满少妇xxxbbb| 欧美人一级淫片a免费播放| 午夜在线成人av| wwwav国产| 综合婷婷亚洲小说| 国产传媒视频在线| 国产亚洲精品福利| 蜜桃精品成人影片| 99久久久久久| 182在线视频| a在线欧美一区| 9.1在线观看免费| 国产高清久久久久| 亚洲三级在线视频| 国产精品自拍一区| 午夜激情视频网| 国产一区二区久久| 中文字幕剧情在线观看| 国产一区二区三区在线看麻豆| 亚洲天堂国产视频| 美女网站色91| 天天摸天天舔天天操| 狠狠狠色丁香婷婷综合久久五月| 男女视频在线看| 日本美女一区二区| wwww.国产| 精品一区二区综合| 欧美一区二区三区影院| 国产99久久久久| 国产一线在线观看| 97精品国产露脸对白| 风间由美一二三区av片| 久久众筹精品私拍模特| 亚洲精品视频久久久| 国产嫩草影院久久久久| 青青青视频在线播放| 亚洲国产精品高清| 91嫩草丨国产丨精品| 亚洲自拍偷拍麻豆| 日韩三级视频在线| 一本大道久久精品懂色aⅴ| 波多野结衣在线观看一区| 欧美日韩一区二区不卡| 国产99视频在线| 亚洲国产91精品在线观看| 欧洲视频在线免费观看| 日韩中文视频免费在线观看| av网站在线看| 韩国v欧美v日本v亚洲| 国模套图日韩精品一区二区| 国产精品入口福利| 日本免费一区二区视频| 久久涩涩网站| 久久视频在线| 青草网在线观看| 天堂久久一区二区三区| 一区二区三区四区毛片| 成人国产精品免费网站| 欧洲av一区二区三区| 亚洲精品中文在线观看| 在线观看国产亚洲| 欧美日韩国产一级二级| 色综合视频一区二区三区高清| 日韩视频在线视频| 久久精品人人做人人爽电影蜜月| 另类小说第一页| 国产麻豆视频一区| 青青草视频播放| 日韩美女精品在线| 日本最新中文字幕| 欧美日韩午夜精品| 韩国中文字幕hd久久精品| 亚洲欧美色婷婷| 污污片在线免费视频| 国产激情综合五月久久| 亚洲图色一区二区三区| 欧美亚洲另类久久综合| 欧美黄色一区| 国产wwwxx| 99久久精品情趣| 国产va在线播放| 在线免费精品视频| 亚洲精品视频专区| 中文字幕精品久久| 欧美freesex黑人又粗又大| 91精品国产自产在线| 亚洲素人在线| 蜜臀精品一区二区| 精品一区二区av| 好吊一区二区三区视频| 亚洲免费在线观看| 探花国产精品一区二区| 日韩av有码在线| 在线中文免费视频| 国产精品专区第二| 欧美禁忌电影网| 国产深夜男女无套内射| 国产精品一二三四| 91制片厂在线| 欧美体内she精视频| 全部免费毛片在线播放网站| 国语自产精品视频在免费| 欧美二区观看| 性做爰过程免费播放| 久久电影国产免费久久电影| 在线观看国产精品一区| 欧美日韩激情美女| 乱色精品无码一区二区国产盗| 欧美巨大黑人极品精男| 色999久久久精品人人澡69 | 欧美成人黄色网址| 91视视频在线观看入口直接观看www| 久草视频在线资源站| 欧美一级在线免费| 久cao在线| 91热福利电影| 66视频精品| 亚洲欧美日韩一二三区| 亚洲视频资源在线| 国产乱人乱偷精品视频a人人澡| 色琪琪综合男人的天堂aⅴ视频| 亚洲www啪成人一区二区| 日韩午夜视频在线观看| 免费观看久久久4p| jizzjizz日本少妇| 欧美日韩一区二区在线观看| 成人在线免费观看| 国产精品三级美女白浆呻吟| 色婷婷一区二区三区| 91日韩精品视频| 亚洲精品国产成人久久av盗摄 | 亚洲情综合五月天| 粉嫩一区二区三区| 日韩免费av电影| 免费的国产精品| 99re6热在线精品视频| 欧美精品1区2区| 在线看福利影| 国产精品视频福利| 亚洲欧美视频| 国产精品久久久久久成人| 91麻豆精品国产自产在线| 性欧美videoshd高清| 九色一区二区| 日韩精品亚洲一区| 日韩在线视频免费看| 精品国产一区二区三区久久久蜜月| 97蜜桃久久| 欧洲在线视频一区| 九色|91porny| 国产亚洲欧美精品久久久久久| 日韩成人av网址| 国产精品麻豆成人av电影艾秋| 男人草女人视频| 99久久99久久精品免费观看| 一级一级黄色片| 九九热精品视频国产| 蜜桃一区二区| 在线视频观看一区二区| 黑人欧美xxxx| 免费黄色网址在线观看| 激情欧美一区二区三区中文字幕| 日韩经典一区二区| 青娱乐免费在线视频| 日韩精品免费在线视频| 国产精品一级在线观看| 日韩久久一级片| 亚洲日本丝袜连裤袜办公室| 天天干,天天操,天天射| 国产欧美 在线欧美| 一区二区毛片| 手机在线免费看毛片| 亚洲欧美国产高清va在线播| 国产成人久久精品一区二区三区| 免费高清在线观看免费| 有码一区二区三区| www免费网站在线观看| 国产一区二区高清视频|