精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數據合成方法-讓模型自己說出用了哪些指令對齊數據

發布于 2024-7-10 09:24
瀏覽
0收藏

寫在前面

大家好,我是劉聰NLP。

大模型時代,數據至上,如何利用大模型合成更多高質量數據也備受關注。

今天給大家分享一個有意思的大模型合成數據方法-MAGPIE,在不需要種子數據和額外人工干預的情況下,挖掘出對齊過的模型自身的指令數據。

《MAGPIE: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing》

paper: https://arxiv.org/abs/2406.08464
github: https://github.com/magpie-align/magpie

核心思想:對齊過的大模型本身是經過大量指令數據對齊得來,往往這些對齊后的模型接受的輸入通常由“前置查詢模板”、“查詢內容”、“后置查詢模板”組成(例如:Llama2-Chat模型接受的輸入是"[INST] Hi! [/INST]",[INST] 是前置查詢模板”,[/INST]則是后置查詢模板)當對模型僅輸入前置模板時,模型會自回歸的合成“查詢內容”;并且當組合完全時,開源獲得模型的回復結果。

這樣就變相地挖掘出對齊模型的指令數據,你以為只開了模型,我直接挖向

方法介紹

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

如上圖所示,合成數據主要涉及兩個步驟:

  • 指令合成:僅給大模型輸入前置查詢模板“<|start_header_id|>user<|end_header_id|>”,大模型會自動續寫出指令內容“What materials should I use to build a nest?”
  • 回復合成:將生成的指令內容與前置查詢模板、后置查詢模板拼接“<|start_header_id|>user<|end_header_id|>What materials should I use to build a nest?<|start_header_id|>assistant<|end_header_id|>”輸入到大模型中,大模型給出回復結果“Other birds collect twigs for their nests. Magpies acquire jewels for theirs.”

注意:在指令合成過程中,Temperature和Top-p都需要開得比較大,保證指令的多樣性;在回復合成過程中,采用貪婪解碼,默認概率最高的Token可能來自模型的訓練語料。

當然直接生成的指令是涉及的場景是廣泛、隨機的,如果需要針對限定任務進行數據生成,可以通過增加系統提示詞來限定場景,比如:增加對數學任務進行指令數據生成,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

數學任務

如果想獲取多輪對話數據,只需要在單輪的指令數據后面繼續進行指令和回復的生成即可。但當開源模型本身參數較小時,生成的多輪數據可能出現忘記上下文內容的情況,可以通過增加系統提示的方式,讓模型強制記住上文信息

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

多輪任務

還可以構造偏好數據,額外利用模型基座生成回復,再通過獎勵模型FsfairX-LLaMA3-RM-v0.1進行打分,保留合成回復分數大于基座回復分數的數據。

數據分析

衡量合成數據好壞,最簡單直接辦法就是SFT一把模型,比較訓練后模型的效果。

MAGPIE方法利用Llama3-8B-Instruct模型和Llama3-70B-Instruct模型分別構造了MAGPIE-Air數據和MAGPIE-Pro數據,詳細分布如下表所示,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

與ShareGPT、WildChat、Evol Instruct、UltraChat、OpenHermes和Tulu V2 Mix數據分別對Llama3-8B模型進行微調,效果如下表所示,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

采用MAGPIE-Air和MAGPIE-Pro訓練的模型,要比其他數據集訓練的模型效果要好,甚至在AlpacaEval 2榜單上超過了原始的Llama3-Instruct模型。

Pro數據訓練的模型優于Air數據訓練的模型,主要是Llama3-70B-Instruct模型能力更強,獲得的指令數據質量更高。

經過過濾的數據集訓練的模型效果比原始數據集更優,其中過濾指標包括:

  • 指令長度:指令中的字符總數。
  • 回復長度:響應中的字符總數。
  • 任務類別:指令的類別,分布如下圖所示,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

  • 指令質量:根據指令的清晰度、特定性和連貫性,分為“非常差”、“差”、“一般”、“好”和“優秀”5個等級。
  • 指令難度:根據指令中描述的任務所需的知識水平,分為“非常容易”、“容易”、“中等”、“困難”和“非常困難”5個等級。
  • 指令相似度:采用all-mpnet-base-v2模型對指令進行向量化表征,計算指令之間的相似程度,篩選出重復或相似的樣本。
  • 獎勵值:采用FsfairX-LLaMA3-RM-v0.1模型對回復內容進行評分,通過過濾低質量的樣本。
  • 獎勵差:利用獎勵模型對基模生成的回復評分,通過獲得更高質量的樣本。

上面每個過濾數據的詳細過濾規則如下表所示,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

利用MAGPIE-Pro-300K-Filtered數據集,訓練Qwen1.5-4B和Qwen1.5-7B模型的效果要好于Qwen1.5-4B-Chat和Qwen1.5-7B-Chat模型,說明MAGPIE方法獲取的指令數據對其他非同源模型,依然有效。

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

多輪數據的質量要高于單論數據集。

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

其他榜單(MMLU 、ARC、HellaSwag、TruthfulQA、Winogard、GSM8K、MMLU-Redux)上的效果如下,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

對MAGPIE數據進行安全性分析,利用Llama-Guard-2模型進行預測,有害指令少于1%。

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

本文轉載自??NLP工作站??,作者: 劉聰NLP ????

收藏
回復
舉報
回復
相關推薦
国产视频一区二| 91影院在线播放| 欧美男男freegayvideosroom| 亚洲成人在线免费| 久久天天狠狠| 亚洲自拍一区在线观看| 成人vr资源| 精品国产髙清在线看国产毛片| 国产xxxx振车| se在线电影| 国产福利精品一区| 97**国产露脸精品国产| 极品尤物一区二区| 日韩欧洲国产| 亚洲精品中文在线| 国产美女精品久久久| 国产免费a视频| 欧美日韩p片| 日韩电影中文字幕一区| 图片区乱熟图片区亚洲| 国产精品一区二区av影院萌芽| ㊣最新国产の精品bt伙计久久| 国产日韩三区| 波多野结衣在线电影| 亚洲天堂黄色| 最新的欧美黄色| 黑人无套内谢中国美女| 欧美gay视频| 亚洲成av人影院| 一区在线电影| 激情综合闲人网| 成人av网站免费观看| 国产日韩欧美自拍| 国产精华7777777| 黄色成人av网站| 久久影院模特热| 黄色片在线观看免费| 国产精品巨作av| 日韩欧美www| 国产aaaaa毛片| 欧美片第一页| 天天影视色香欲综合网老头| 亚洲高清乱码| 男操女在线观看| 成人av影院在线| 国产精品区一区二区三在线播放 | 中文字幕在线天堂| 亚洲精品美女91| 久久久精品一区二区| 91导航在线观看| 精品中文一区| 亚洲男子天堂网| 免费的av网站| 国产劲爆久久| 亚洲成人三级在线| 老司机av网站| 99精品国产一区二区三区2021| 欧美日韩亚洲综合| 污污网站免费看| 国产成人免费精品| 欧美性淫爽ww久久久久无| 日本成人中文字幕在线| 美女福利一区二区三区| 一本一道久久a久久精品| 日韩国产欧美亚洲| xxx.xxx欧美| 亚洲一区二区三区四区在线| 成人小视频在线观看免费| 丝袜综合欧美| 一区二区欧美视频| 精品久久一二三| av老司机在线观看| 亚洲一二三专区| 成人午夜免费在线| 高清视频在线观看三级| 色天天综合色天天久久| 国产日韩一区二区在线观看| 国产一区二区精品调教| 欧洲激情一区二区| 999热精品视频| 亚洲午夜免费| 精品免费日韩av| 无码人妻aⅴ一区二区三区| 网友自拍区视频精品| 国产一区二区三区毛片| 极品久久久久久久| 欧美激情第10页| 久久久久久九九九| 无码无套少妇毛多18pxxxx| 日韩电影在线看| 成人两性免费视频| 欧美 日韩 人妻 高清 中文| 91伊人久久大香线蕉| 亚洲乱码一区二区三区 | 一区在线影院| 91麻豆精品国产无毒不卡在线观看| 亚洲成人av免费观看| 国产亚洲精品美女久久| 中文字幕日韩av综合精品| 粉嫩av性色av蜜臀av网站| 中文日韩欧美| 国产欧美一区二区三区久久| 蜜桃久久一区二区三区| 国产欧美精品在线观看| 亚洲午夜精品久久| 蜜臀久久精品| 6080午夜不卡| www.色天使| 最新国产精品久久久| 青草成人免费视频| 国产乱码久久久| 久久综合久久综合久久| av磁力番号网| 欧美日韩五区| 精品免费99久久| 又色又爽的视频| 久久国产日本精品| 2022国产精品| а√天堂中文在线资源bt在线| 亚洲午夜成aⅴ人片| 天天操天天爱天天爽| 久久97精品| 久久亚洲私人国产精品va| 亚洲乱码国产乱码精品| 高清日韩电视剧大全免费| 亚洲一区二区三区加勒比| 成人一级福利| 精品剧情在线观看| 欧美a级片免费看| 日韩av一级片| 国内精品视频免费| 免费污视频在线观看| 欧美午夜一区二区三区| 精品成人av一区二区三区| 黄色精品网站| 懂色一区二区三区av片| 欧美天天影院| 欧美综合亚洲图片综合区| 国产高潮视频在线观看| 欧美一区二区三区久久精品茉莉花| 日韩免费黄色av| 少妇喷水在线观看| 亚洲天天做日日做天天谢日日欢| 久久久久久蜜桃一区二区| 婷婷亚洲成人| 国产69精品久久久久9| 国产情侣一区二区| 国产精品每日更新| 色七七在线观看| 妖精一区二区三区精品视频 | av漫画网站在线观看| 欧美一区二区在线播放| 国产极品美女在线| 免费一级片91| 一区二区三区视频| 日韩漫画puputoon| 久久精品国产一区二区电影| 中文字幕免费观看视频| 国产精品乱码人人做人人爱 | 国产最新在线| 日韩欧美在线网站| 欧美丰满熟妇bbbbbb| 国产二区国产一区在线观看| www亚洲国产| 91丝袜一区二区三区| 国产成人免费视频网站| 9色porny| 国产精品三p一区二区| 国内精品久久久久久影视8| 免费av在线一区二区| 91tv亚洲精品香蕉国产一区7ujn| 美女视频久久黄| 亚洲最大在线视频| 精品视频在线免费观看| 狠狠躁天天躁日日躁欧美| 亚洲国产色一区| 一区二区三区成人在线视频| 亚洲特黄一级片| 久久午夜免费电影| 成人av在线播放网站| 成人福利电影精品一区二区在线观看| 老牛国产精品一区的观看方式| 欧美 亚欧 日韩视频在线 | 久久久精品免费免费| 欧美国产综合| blacked蜜桃精品一区| 99国产精品99久久久久久粉嫩| 欧美精品tushy高清| 男人操女人动态图| 久久99精品视频| 欧美日韩一区在线播放| 视频精品导航| 欧美激情视频在线免费观看 欧美视频免费一| 精品人妻一区二区三区蜜桃| 高潮白浆女日韩av免费看| 国产精品成人观看视频免费| 国产在线观看91精品一区| 成人字幕网zmw| 91久久精品国产91久久性色tv| 成人激情电影一区二区| 国产一区在线免费| 成人午夜小视频| 成人福利视频网| 成人午夜在线视频一区| 国产在线精品一区| 800av免费在线观看| 99精品视频一区二区| av视屏在线播放| 欧美国产激情| 日韩av一区二区三区在线 | 99精品国产高清一区二区麻豆| 91精品成人久久| 一广人看www在线观看免费视频| 91精品国产综合久久婷婷香蕉 | 九九久久久久久| 一区二区三区四区日韩| 日韩精品一区二区三区色偷偷| 95精品视频| 一区二区三区四区精品| 国产欧美高清在线| 黄色av免费观看| 少妇精品高潮欲妇又嫩中文字幕 | 黄视频在线播放| 妞干网免费在线视频| 欧美精品一线| 亚洲美女免费视频| 亚洲电影免费观看高清完整版在线观看 | 国产精品无码无卡无需播放器| av大片在线免费观看| 最好看的日本字幕mv视频大全| 国产黄色一级大片| 免费超碰在线| 日韩理论视频| 精品淫伦v久久水蜜桃| 婷婷综合五月| 日韩福利视频导航| 国产欧美日韩在线| 欧美成va人片在线观看| 5566日本婷婷色中文字幕97| 国产精品av网站| 精品在线不卡| 牛夜精品久久久久久久| 在线观看亚洲网站| 亚洲欧美另类日本| 亚洲国产成人无码av在线| 青青青草原在线| 激情网站在线| 国产一区 二区| 精品成人国产| eeuss鲁片一区二区三区在线观看| 亚洲激情自拍偷拍| 亚洲国产高潮在线观看| 欧美国产日韩一区二区| 4444kk亚洲人成电影在线| 久久久久久草| 在线观看的毛片| 波多野结衣福利| 免费在线观看日韩| 欧美一级淫片免费视频魅影视频| 美女羞羞视频在线观看| 精品国产亚洲一区二区三区| 视频一区中文字幕| 中文字幕一区视频| 91黄色小视频| 久久91超碰青草是什么| 国产女主播一区二区三区| 欧美 国产 精品| 成人一级黄色大片| 搞黄网站在线观看| 欧美91在线| 久久精品视频在线播放| 国产私拍精品| 国产一区二区三区网站| 国产福利在线视频| 亚洲日本aⅴ片在线观看香蕉| 黄色免费在线播放| 在线观看中文字幕亚洲| 在线视频91p| 久久久精品一区二区| 亚洲91av| 66m—66摸成人免费视频| 亚洲校园激情春色| 国产精品激情自拍| 玖玖精品在线| 99久久伊人精品影院| 都市激情亚洲| 麻豆精品蜜桃一区二区三区| 精品国产一区二区三区四区| 在线观看一区二区三区三州| 一区二区中文| 每日在线更新av| 日韩精品亚洲一区| 涩涩网站在线看| 国产mv日韩mv欧美| 黄瓜视频污在线观看| 国产精品蜜臀av| 国产大片中文字幕| 欧美在线观看视频一区二区| 91激情在线观看| 欧美一级精品在线| 国产一级免费在线观看| 久久在线精品视频| 波多野结衣视频一区二区| 国产精品99久久久久久人| 国产精品视频一区视频二区| 九9re精品视频在线观看re6| 色狮一区二区三区四区视频| 26uuu成人| 亚洲一区二区三区免费在线观看 | 少妇无码av无码专区在线观看 | 盗摄牛牛av影视一区二区| 久久资源av| 欧美aaaaaaaaaaaa| 北条麻妃在线一区| 国产麻豆成人传媒免费观看| 欧美深性狂猛ⅹxxx深喉 | 成熟人妻av无码专区| 亚洲精品ww久久久久久p站| 成人免费毛片男人用品| 日韩一级免费观看| 137大胆人体在线观看| 久久久久久久色| 91九色综合| 久久99精品久久久久久久久久| 亚洲情侣在线| 日本特黄a级片| 91在线视频播放| 免费成人深夜夜行网站| 色综合色狠狠综合色| 亚洲精品视频91| 久久久国产视频91| 超碰一区二区| 久久久久久久久久久久久9999| 一区二区三区午夜视频| 日韩一级理论片| 91啦中文在线观看| 国产无遮挡aaa片爽爽| 欧美一区二区三区四区久久| 国产美女视频一区二区三区 | 中文字幕在线直播| 高清av免费一区中文字幕| 久久久久久久久久久9不雅视频| 激情综合在线观看| 久久先锋资源网| 亚洲视频免费播放| 日韩免费福利电影在线观看| 精精国产xxxx视频在线| 国产精品入口免费视频一| 一区二区三区韩国免费中文网站| 丰满人妻一区二区三区53号 | 亚洲国产精品久久人人爱| 国产黄色片免费| 欧美福利视频在线| 日本精品视频| 男人c女人视频| 激情综合亚洲精品| 多男操一女视频| 欧美精品在线视频| 日本在线免费| 国产日韩欧美视频| 久久精品亚洲人成影院| 日本在线观看免费视频| 最好看的中文字幕久久| 91精品视频免费在线观看| 日韩视频在线免费| 亚洲青青一区| 看一级黄色录像| 国内精品在线播放| 婷婷伊人五月天| 日韩一区二区三区视频| 欧美videossex| 国产精品视频在线免费观看| 在线成人黄色| 免费啪视频在线观看| 欧美日韩国产精品一区| 青青草免费在线| 国产精品欧美一区二区三区奶水| 成人久久一区| 欧美日韩精品区别| 樱花影视一区二区| 国产成人精品亚洲精品色欲| 九九热这里只有精品免费看| 777久久精品| 免费在线a视频| 国产日韩欧美精品一区| 一级视频在线播放| 久久影视免费观看 | 日韩欧美专区在线| 激情国产在线| 精品久久sese| 日韩精品视频网站| 97成人资源站| 亚洲精品美女网站| 国产一区一一区高清不卡| 日韩一区二区三区资源| 国产suv精品一区二区三区| 日韩欧美大片在线观看| 亚洲欧美在线一区二区| 99精品女人在线观看免费视频 | 国产区高清在线|