精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數據合成方法-讓模型自己說出用了哪些指令對齊數據

發布于 2024-7-1 10:40
瀏覽
0收藏

寫在前面

大家好,我是劉聰NLP。

大模型時代,數據至上,如何利用大模型合成更多高質量數據也備受關注。

今天給大家分享一個有意思的大模型合成數據方法-MAGPIE,在不需要種子數據和額外人工干預的情況下,挖掘出對齊過的模型自身的指令數據。

《MAGPIE: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing》

paper: https://arxiv.org/abs/2406.08464
github: https://github.com/magpie-align/magpie

核心思想:對齊過的大模型本身是經過大量指令數據對齊得來,往往這些對齊后的模型接受的輸入通常由“前置查詢模板”、“查詢內容”、“后置查詢模板”組成(例如:Llama2-Chat模型接受的輸入是"[INST] Hi! [/INST]",[INST] 是前置查詢模板”,[/INST]則是后置查詢模板)當對模型僅輸入前置模板時,模型會自回歸的合成“查詢內容”;并且當組合完全時,開源獲得模型的回復結果。

這樣就變相地挖掘出對齊模型的指令數據,你以為只開了模型,我直接挖向

方法介紹

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

如上圖所示,合成數據主要涉及兩個步驟:

  • 指令合成:僅給大模型輸入前置查詢模板“<|start_header_id|>user<|end_header_id|>”,大模型會自動續寫出指令內容“What materials should I use to build a nest?”
  • 回復合成:將生成的指令內容與前置查詢模板、后置查詢模板拼接“<|start_header_id|>user<|end_header_id|>What materials should I use to build a nest?<|start_header_id|>assistant<|end_header_id|>”輸入到大模型中,大模型給出回復結果“Other birds collect twigs for their nests. Magpies acquire jewels for theirs.”

注意:在指令合成過程中,Temperature和Top-p都需要開得比較大,保證指令的多樣性;在回復合成過程中,采用貪婪解碼,默認概率最高的Token可能來自模型的訓練語料。

當然直接生成的指令是涉及的場景是廣泛、隨機的,如果需要針對限定任務進行數據生成,可以通過增加系統提示詞來限定場景,比如:增加對數學任務進行指令數據生成,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

如果想獲取多輪對話數據,只需要在單輪的指令數據后面繼續進行指令和回復的生成即可。但當開源模型本身參數較小時,生成的多輪數據可能出現忘記上下文內容的情況,可以通過增加系統提示的方式,讓模型強制記住上文信息。

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區


還可以構造偏好數據,額外利用模型基座生成回復,再通過獎勵模型FsfairX-LLaMA3-RM-v0.1進行打分,保留合成回復分數大于基座回復分數的數據。

數據分析

衡量合成數據好壞,最簡單直接辦法就是SFT一把模型,比較訓練后模型的效果。

MAGPIE方法利用Llama3-8B-Instruct模型和Llama3-70B-Instruct模型分別構造了MAGPIE-Air數據和MAGPIE-Pro數據,詳細分布如下表所示,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

與ShareGPT、WildChat、Evol Instruct、UltraChat、OpenHermes和Tulu V2 Mix數據分別對Llama3-8B模型進行微調,效果如下表所示,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

采用MAGPIE-Air和MAGPIE-Pro訓練的模型,要比其他數據集訓練的模型效果要好,甚至在AlpacaEval 2榜單上超過了原始的Llama3-Instruct模型。

Pro數據訓練的模型優于Air數據訓練的模型,主要是Llama3-70B-Instruct模型能力更強,獲得的指令數據質量更高。

經過過濾的數據集訓練的模型效果比原始數據集更優,其中過濾指標包括:

  • 指令長度:指令中的字符總數。
  • 回復長度:響應中的字符總數。
  • 任務類別:指令的類別,分布如下圖所示,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

  • 指令質量:根據指令的清晰度、特定性和連貫性,分為“非常差”、“差”、“一般”、“好”和“優秀”5個等級。
  • 指令難度:根據指令中描述的任務所需的知識水平,分為“非常容易”、“容易”、“中等”、“困難”和“非常困難”5個等級。
  • 指令相似度:采用all-mpnet-base-v2模型對指令進行向量化表征,計算指令之間的相似程度,篩選出重復或相似的樣本。
  • 獎勵值:采用FsfairX-LLaMA3-RM-v0.1模型對回復內容進行評分,通過過濾低質量的樣本。
  • 獎勵差:利用獎勵模型對基模生成的回復評分,通過獲得更高質量的樣本。

上面每個過濾數據的詳細過濾規則如下表所示,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

利用MAGPIE-Pro-300K-Filtered數據集,訓練Qwen1.5-4B和Qwen1.5-7B模型的效果要好于Qwen1.5-4B-Chat和Qwen1.5-7B-Chat模型,說明MAGPIE方法獲取的指令數據對其他非同源模型,依然有效。

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

多輪數據的質量要高于單論數據集。

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

其他榜單(MMLU 、ARC、HellaSwag、TruthfulQA、Winogard、GSM8K、MMLU-Redux)上的效果如下,

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

對MAGPIE數據進行安全性分析,利用Llama-Guard-2模型進行預測,有害指令少于1%。

數據合成方法-讓模型自己說出用了哪些指令對齊數據-AI.x社區

寫在最后

MAGPIE方法不用種子數據,不用昂貴的GPT4 API接口,僅靠挖掘開源模型本身,就可以獲取高質量合成數據,是個有趣的研究。

收藏
回復
舉報
回復
相關推薦
欧美日韩精品综合| 欧美一级在线亚洲天堂| 久久黄色一级视频| freexxx性亚洲精品| 久久久一区二区三区| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 久久久激情视频| 成人激情春色网| 激情五月亚洲色图| 一区二区三区视频在线观看视频| 国产suv精品一区二区883| 一区二区三区日韩在线| 日韩成人精品视频在线观看| 国产美女一区视频| 国产日韩影视精品| 国产精品区免费视频| 五月激情丁香网| 1024日韩| 久久影院中文字幕| 久久精品视频18| 神马午夜在线视频| 中文字幕佐山爱一区二区免费| 国产精品久久久久久免费观看| 一二区在线观看| 久久电影一区| 久久人人爽人人| 免费成人深夜夜行网站| 国产欧美一区二区三区精品观看| 日韩一区和二区| 精品少妇人妻av一区二区| 日本亚洲欧美| 成人深夜在线观看| 51午夜精品| 国产在线综合网| 久久久久久久久久久久久久久久久久 | 少妇精品久久久一区二区三区| 欧美一区二区播放| 天天干天天干天天干天天干天天干| 亚洲 欧美 自拍偷拍| 国内成人免费视频| 国产精品视频xxxx| 久草视频一区二区| 国产精品美女久久久浪潮软件| 欧美成人午夜视频| 国产大学生视频| 亚洲伊人精品酒店| 欧美日韩一二区| 粉嫩虎白女毛片人体| 欧亚av在线| 亚洲3atv精品一区二区三区| 久久久久久久香蕉| 日韩精品卡一| 亚洲高清在线精品| 神马影院我不卡午夜| 天堂影院在线| 免费美女久久99| 国产精品电影网站| 狠狠狠狠狠狠狠| 久久久久一区| 国产成人在线一区| 自拍偷拍色综合| 另类小说一区二区三区| 国产日韩欧美91| 国产精品呻吟久久| 国产九色精品成人porny| 91精品视频在线| 日本在线视频免费观看| 亚洲视频免费| 欧美一级在线播放| 特级西西444www大胆免费看| 毛片av一区二区| 7777精品伊久久久大香线蕉语言| 朝桐光av在线一区二区三区| 国产成人av影院| 精品中文字幕人| av资源在线观看免费高清| 中文av一区二区| 国产四区在线观看| sqte在线播放| 欧美中文字幕一区二区三区亚洲| 成人免费看片'免费看| av在线不卡免费| 色哟哟欧美精品| 亚洲精品综合在线观看| 91av亚洲| 欧美日韩国产乱码电影| 免费国偷自产拍精品视频| 国产精品巨作av| 亚洲人成在线免费观看| 亚洲区一区二区三| 国内精品久久久久久久97牛牛 | 91精品国自产| 成人性视频网站| 欧美日韩国产一二| 日本在线观看www| 香蕉成人伊视频在线观看| 国产在线青青草| 成人精品国产| 亚洲电影免费观看高清完整版在线观看| 精品无码人妻一区| 亚洲国产精品久久久久蝴蝶传媒| 国内精品久久久久影院优| 日韩免费av网站| 国产成人久久精品77777最新版本| 久久爱av电影| 综合图区亚洲| 欧美亚洲综合一区| 欧美一级xxxx| 免费欧美一区| 久久久免费观看视频| 在线播放成人av| av在线播放不卡| 欧美a级黄色大片| 51一区二区三区| 亚洲国产成人久久综合一区| 免费成人美女女在线观看| 亚洲在线免费| 国产欧美综合精品一区二区| 一本一道波多野毛片中文在线 | 欧美激情视频给我| 亚洲网站免费观看| 久久久亚洲高清| 日韩av新片网| 精品精品导航| 欧美日韩在线直播| 欧美深性狂猛ⅹxxx深喉| 欧美韩日高清| 国产精品福利观看| 青青草免费在线| 婷婷综合另类小说色区| 亚洲成人激情小说| 91亚洲自偷观看高清| 国产成人亚洲综合| 深夜福利视频一区| 无码av中文一区二区三区桃花岛| 日本在线视频播放| 亚洲午夜精品一区 二区 三区| 国产精品久久久久久久久久久久久久| 色噜噜在线播放| 亚洲最大成人网4388xx| 51自拍视频在线观看| 日韩欧美字幕| 成人av.网址在线网站| 98在线视频| 欧美性猛交一区二区三区精品| 日韩av在线看免费观看| 亚洲视频1区| 快播亚洲色图| 永久免费毛片在线播放| 日韩av有码在线| 日韩欧美性视频| 99久精品国产| 国产亚洲天堂网| 婷婷久久免费视频| 中文字幕欧美日韩在线| 男操女视频网站| 中文字幕av资源一区| 污视频免费在线观看网站| 国内精品久久久久久久影视简单 | 自拍亚洲一区欧美另类| 久久久999久久久| 国产精品乱人伦中文| 17c国产在线| 欧美va天堂在线| 91高清免费在线观看| 国产精品国产高清国产| 欧美日韩在线免费观看| 亚洲综合网在线观看| 免费日本视频一区| 色爽爽爽爽爽爽爽爽| 影音先锋欧美激情| 91国内揄拍国内精品对白| 亚洲色图欧美视频| 欧美视频一区二| 国产第一页浮力| 不卡视频在线观看| 99久久激情视频| 国产国产精品| 国产精品一级久久久| 欧美黑人粗大| 超薄丝袜一区二区| 视频一区 中文字幕| 91成人在线精品| 欧美国产日韩在线观看成人| 成人av午夜电影| www.99在线| 欧美人成在线| 日本电影一区二区三区| 国产精品一区二区三区av| 久久久久免费视频| 国产成人三级在线播放| 舔着乳尖日韩一区| 国产精品一区二区亚洲| 高清成人免费视频| 男女无套免费视频网站动漫| 亚洲欧美综合国产精品一区| 热re99久久精品国99热蜜月| 国产精品3区| 人人做人人澡人人爽欧美| 免费在线观看黄| 日韩精品视频在线观看网址 | 神马电影网我不卡| 欧美另类极品videosbestfree| 中文字幕第315页| 亚洲自拍另类综合| 丰满的亚洲女人毛茸茸| 成人午夜碰碰视频| 亚洲天堂2018av| 亚洲在线观看| 男女激情免费视频| 色喇叭免费久久综合网| 精品一区国产| 亚洲免费一区三区| 国产日韩欧美在线| 二区三区不卡| 国语自产精品视频在免费| 麻豆影视国产在线观看| 亚洲免费人成在线视频观看| 国产 欧美 自拍| 欧美一区二区视频在线观看| 中文字幕av第一页| 欧美日韩午夜剧场| 国产大片aaa| 一区二区三区四区国产精品| 青青青视频在线播放| ww亚洲ww在线观看国产| 国产在线青青草| 亚洲精品1区2区| 欧美这里只有精品| 中文在线播放一区二区| 一道精品一区二区三区 | 亚洲精品日韩av| 国产精品高潮久久| 国产精品福利网| 超碰超碰人人人人精品| 亚州成人av在线| 操喷在线视频| 久久久久亚洲精品成人网小说| 亚洲小说区图片| 欧美大荫蒂xxx| 中文字幕在线播放网址| 久久成人亚洲精品| a级片国产精品自在拍在线播放| 色噜噜久久综合伊人一本| 成人在线免费视频| 在线播放日韩av| 在线观看免费高清完整| 上原亚衣av一区二区三区| 国产高清在线| 日韩欧美一级特黄在线播放| 97人妻精品一区二区三区视频 | 亚洲第一天堂在线观看| 日韩一区国产二区欧美三区| 99热这里是精品| 日韩一级片网站| 国产高清在线免费| 日韩精品一区二区三区老鸭窝| av网站在线免费看| 欧美变态tickling挠脚心| 欧美特黄aaaaaa| 欧美日韩一二三四五区| 少妇高潮av久久久久久| 色菇凉天天综合网| 在线观看国产精品视频| 制服丝袜亚洲精品中文字幕| 国产露脸国语对白在线| 日韩一区二区三区在线| 蜜臀av中文字幕| 亚洲乱码一区二区| 日本中文字幕在线播放| 欧美激情欧美激情在线五月| 涩涩av在线| 国产精品视频永久免费播放| 在线视频成人| 国产视频不卡| 日本一区二区免费高清| 99久热在线精品视频| 中日韩男男gay无套| 日韩中文字幕组| 国产又黄又大久久| 熟妇高潮一区二区| 欧美激情在线看| 欧美国产日韩在线观看成人 | 久久这里有精品视频| 17videosex性欧美| 国产精品日韩精品| 91精品久久久久久综合五月天| 免费在线成人av电影| 999久久久亚洲| 3d动漫一区二区三区| 日本欧美一区二区| 久久亚洲中文字幕无码| 老妇喷水一区二区三区| 伊人免费视频二| www久久久久| 欧美日韩一级在线观看| 在线视频一区二区三区| 精品区在线观看| 国产一区二区久久精品| 高清电影在线观看免费| 国产精品影片在线观看| 美女一区二区在线观看| 国产精品美女xx| 日韩一区二区在线| 欧美久久久久久久久久久久久| 久久电影国产免费久久电影| 亚洲最大综合网| 成人免费视频播放| 91香蕉视频网| 色呦呦国产精品| 亚洲乱码国产乱码精品精软件| 中文字幕国产精品| 手机在线观看av网站| 91国产丝袜在线放| 热久久天天拍国产| 日本www在线播放| 国产精品12区| 99热6这里只有精品| 欧美午夜美女看片| 欧美熟妇另类久久久久久不卡| 久久久国产视频| 日韩成人在线电影| 小说区图片区图片区另类灬| 香蕉久久国产| 成年人的黄色片| 亚洲高清视频的网址| 国产特级aaaaaa大片| 日韩在线观看免费| 成人一区视频| 视频一区免费观看| 视频一区视频二区中文| 久久人人妻人人人人妻性色av| 亚洲制服丝袜av| www久久久久久| 欧美日韩国产二区| 美女久久精品| 欧美一级中文字幕| 国产黄色精品视频| 免费人成视频在线| 精品国产一区二区亚洲人成毛片| 黄色网页在线免费看| 91理论片午午论夜理片久久| 久久日文中文字幕乱码| 亚洲综合婷婷久久| 国产精品私房写真福利视频| 自拍偷拍福利视频| 中文字幕亚洲一区在线观看 | 欧美日韩在线直播| 888av在线| 国产日韩在线视频| 一区二区三区四区在线观看国产日韩 | 成人高潮免费视频| 欧美一区二区三区四区五区| 香蕉成人app免费看片| av免费观看久久| 亚洲国产第一| 国产精品无码一区二区三区免费| 一本到一区二区三区| 成人av一区| 亚洲一区二区免费在线| 国内精品美女在线观看| 亚洲一区二区乱码| 色素色在线综合| 免费不卡视频| 国产99在线播放| 免费日韩av| 免费观看特级毛片| 日韩欧美一区二区不卡| 91禁在线看| 欧美一区三区二区在线观看| 麻豆精品国产传媒mv男同| 欧美成人精品欧美一级私黄| 亚洲精品电影网站| 国产亚洲一区二区手机在线观看 | 激情文学综合插| 国产香蕉在线视频| 亚洲一级黄色av| 日韩欧洲国产| 日韩精品一区中文字幕| 国产精品成人午夜| 日韩一级片免费观看| 国产精品久久久精品| 欧美大片一区| 三年中国中文观看免费播放| 91麻豆精品国产91久久久更新时间| 成年人视频免费在线播放| 日本一区二区三区四区在线观看 | 青青草原av在线| 欧美日韩国产精品一区二区| 国产乱码一区二区三区| 国产精品男女视频| 久久精品一偷一偷国产| 久久这里只有精品一区二区| 视频在线观看免费高清| 亚洲国产人成综合网站| 免费a级人成a大片在线观看| 久久久99国产精品免费| 国产一区二区精品在线观看| 黄色片网站在线免费观看| 久久99精品视频一区97|