精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM數(shù)學(xué)性能暴漲168%,微軟14人團(tuán)隊力作!合成數(shù)據(jù)2.0秘訣曝光,智能體生成教學(xué)

人工智能 新聞
合成數(shù)據(jù)2.0秘訣曝光了!來自微軟的研究人員們提出了智能體框架AgentInstruct,能夠自動創(chuàng)建大量、多樣化的合成數(shù)據(jù)。經(jīng)過合成數(shù)據(jù)微調(diào)后的模型Orca-3,在多項基準(zhǔn)上刷新了SOTA。

全世界高質(zhì)量數(shù)據(jù)幾乎枯竭。

AI科學(xué)家們?yōu)榱私鉀Q這一難題,可謂是絞盡腦汁。

目前來看,合成數(shù)據(jù)或許就是大模型的未來,也成為業(yè)界公認(rèn)的解決之法。

就連英偉達(dá)科學(xué)家Jim Fan曾發(fā)文表示,合成數(shù)據(jù)將提供下一萬億個高質(zhì)量的訓(xùn)練token。

圖片

但是,用合成數(shù)據(jù),并非完全對LLM訓(xùn)練有幫助。

前段時間,Nature封面研究顯示,合成數(shù)據(jù)迭代9次后,會讓大模型崩潰。而且,類似的研究比比皆是。

那么,我們該怎么辦呢?

最近,微軟團(tuán)隊提出了可擴(kuò)展的智能體框架——AgentInstruct,可自動創(chuàng)建大量多樣化、高質(zhì)量的合成數(shù)據(jù)。

它最大的優(yōu)勢在于,僅只用原始數(shù)據(jù)源,就能創(chuàng)建完整的提示和回應(yīng)。

圖片

論文地址:https://arxiv.org/pdf/2407.03502

對此,研究人員使用AgentInstruct,創(chuàng)建了2500萬對「后訓(xùn)練」數(shù)據(jù)集,涵蓋了多種使用技能,如文本編輯、創(chuàng)意寫作、工具使用、編碼、閱讀理解等。

然后,他們利用這些數(shù)據(jù)對Mistral-7b進(jìn)行后訓(xùn)練,得到了Orca-3模型。

與原始的Mistral-7b-Instruct相比,Orca-3在多個基準(zhǔn)測試中,都顯示出顯著的性能提升。

圖片

而在數(shù)學(xué)方面上的表現(xiàn),性能直接暴漲168%。

圖片

當(dāng)「合成數(shù)據(jù)」遇上智能體

過去一年,我們見證了智能體的興起。

智能體可以生成高質(zhì)量的數(shù)據(jù),通過反思和迭代,其能力反超了底層基礎(chǔ)大模型。

在這個過程中,智能體可以回顧解決方案,自我批評,并改進(jìn)解決方案。它們甚至可以利用工具,如搜索API、計算器、代碼解釋,來擴(kuò)展大模型的能力。

此外,多智能體還可以帶來更多的優(yōu)勢,比如模擬場景,同時生成新的提示和響應(yīng)。

它們還可以實現(xiàn)數(shù)據(jù)生成工作流的自動化,減少或消除某些任務(wù)對人工干預(yù)的需求。

論文中,作者提出了「生成式教學(xué)」的概念。

這是說,使用合成數(shù)據(jù)進(jìn)行后訓(xùn)練,特別是通過強(qiáng)大的模型創(chuàng)建數(shù)據(jù),來教另一個模型新技能或行為。

AgentInstruct是生成式教學(xué)的一個智能體解決方案。

總而言之,AgentInstruct可以創(chuàng)建:

- 高質(zhì)量數(shù)據(jù):使用強(qiáng)大的模型如GPT-4,結(jié)合搜索和代碼解釋器等工具。

- 多樣化數(shù)據(jù):AgentInstruct同時生成提示和回應(yīng)。它使用多智能體(配備強(qiáng)大的LLM、工具和反思流程)和一個包含100多個子類別的分類法,來創(chuàng)建多樣化和高質(zhì)量的提示和回應(yīng)。

- 大量數(shù)據(jù):AgentInstruct可以自主運行,并可以應(yīng)用驗證和數(shù)據(jù)過濾的流程。它不需要種子提示,而是使用原始文檔作為種子。

圖片

生成式教學(xué):AgentInstruct

我們?nèi)绾蝿?chuàng)建海量數(shù)據(jù)?如何保證生成的數(shù)據(jù)具有多樣性?如何生成復(fù)雜或微妙的數(shù)據(jù)?

為此,研究人員概述了解決這些挑戰(zhàn)的結(jié)構(gòu)化方法:

圖片

具體來說,AgentInstruct定義了三種不同的自動化生成流程:

內(nèi)容轉(zhuǎn)換流程:將原始種子轉(zhuǎn)換為中間表示,簡化了針對特定目標(biāo)創(chuàng)建指令的過程。

種子指令生成流程:由多個智能體組成,以內(nèi)容轉(zhuǎn)換流程的轉(zhuǎn)換后種子為輸入,生成一組多樣化的指令。

指令改進(jìn)流程:以種子指令流程的指令為輸入,迭代地提升其復(fù)雜性和質(zhì)量。

圖片

接下來,研究人員為為17種不同的技能實現(xiàn)了這些流程,每種技能都有多個子類別。

這些技能包括閱讀理解、問答、編碼、檢索增強(qiáng)生成、創(chuàng)意寫作、工具/API使用和網(wǎng)絡(luò)控制。

完整列表,如下表1中所示。

圖片

接下來,研究人員通過以下三種技能的案例研究,來解釋這些工作流是如何運作的。

圖片

圖片

圖片

實驗結(jié)果

正如開頭所述,研究人員使用2580萬對指令,微調(diào)Mistral-7b-v0.1模型,然后得到Orca-3。

那么經(jīng)過使用AgentInstruct數(shù)據(jù)訓(xùn)練Orca-3,性能究竟如何?

AgentInstruct的目標(biāo)是合成一個大型且多樣化的數(shù)據(jù)集,其中包含不同難度級別的數(shù)據(jù)。

在這個數(shù)據(jù)集上,像Orca-2.5、Mistral-Instruct-7b和ChatGPT這樣的基準(zhǔn)模型得分遠(yuǎn)低于10分,顯示出它們相對于GPT-4(被指定為基準(zhǔn),得分為10)的劣勢。

圖4中描繪的性能比較展示了基準(zhǔn)模型與Orca-3之間的對比分析。

這個圖顯示了在AgentInstruct數(shù)據(jù)的支持下,后訓(xùn)練過程中各種能力的顯著提升。

圖片

表2概括了所有評估維度的平均得分。

平均而言,包括每輪訓(xùn)練輪后的Orca-3,AgentInstruct數(shù)據(jù)的引入使性能相比Orca 2.5基準(zhǔn)提高了33.94%,相比Mistral-Instruct-7B提高了14.92%。

圖片

刷新多項基準(zhǔn)SOTA

表3中給出了每個基準(zhǔn)的所有基線的結(jié)果。

比如,在AGIEval提升40%,在MMLU上提升19%,在GSM8K上提升54%,在BBH上提升38%,在AlpacaEval上提升45%。

此外,它在性能上持續(xù)超過其他模型,如LLAMA-8B-instruct和GPT-3.5-turbo。

圖片

就閱讀理解任務(wù)來說,對于LLM至關(guān)重要。對于小模型來說,也更為重要。

通過使用AgentInstruct進(jìn)行針對性訓(xùn)練,可以觀察到Mistral的閱讀理解能力有了實質(zhì)性的提升(見表4)——相比Orca 2.5提高了18%,相對于Mistral-Instruct-7b提高了21%。

此外,通過利用這種數(shù)據(jù)驅(qū)動的方法,研究人員將一個7B參數(shù)的模型在LSATs的閱讀理解部分的表現(xiàn),提升到了與GPT-4相匹配的水平。

圖片

再拿數(shù)學(xué)來說,通過AgentInstruct,成功提升了Mistral在從小學(xué)到大學(xué)水平的各種難度數(shù)學(xué)問題上的熟練程度,如下表5所示。

在各種流行的數(shù)學(xué)基準(zhǔn)測試上,改進(jìn)幅度從44%-168%不等。

應(yīng)當(dāng)強(qiáng)調(diào)的是,生成式教學(xué)的目標(biāo)是教授一種技能,而不是生成數(shù)據(jù)來滿足特定的基準(zhǔn)測試。AgentInstruct在生成式教學(xué)方面的有效性通過在各種數(shù)學(xué)數(shù)據(jù)集上的顯著改進(jìn)得到了證明。

圖片

表6顯示了,Orca-3-7B模型和FoFo基準(zhǔn)上,其他開源和閉源基準(zhǔn)的性能。

圖片

另外,通過 AgentInstruct 方法,成功地將模型幻覺減少31.34%,同時達(dá)到了與GPT-4(教師)相當(dāng)?shù)馁|(zhì)量水平。

圖片

表8顯示了使用/不使用RAG的MIRAGE上所有模型的結(jié)果。

圖片

總之,AgentInstruct生成教學(xué)方法,為模型后訓(xùn)練生成大量多樣化和高質(zhì)量數(shù)據(jù)的挑戰(zhàn),提供了一個有前途的解決方案。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-02-23 07:46:48

學(xué)習(xí)模型數(shù)據(jù)倉庫

2025-03-03 09:00:00

2024-12-02 10:15:00

LLM模型

2025-07-31 02:00:55

AI智能體短視頻

2022-06-20 11:28:20

人工智能數(shù)據(jù)生成器

2024-04-18 08:38:15

LLM數(shù)據(jù)訓(xùn)練模型

2013-05-30 09:15:16

微軟團(tuán)隊成功秘訣微軟

2025-06-25 08:53:00

模型AI強(qiáng)化學(xué)習(xí)

2024-12-23 09:38:00

2025-11-06 01:44:00

2022-06-13 15:28:42

人工智能機(jī)器學(xué)習(xí)數(shù)據(jù)

2024-02-02 17:04:35

UCLALLMGPT-4

2024-10-14 09:25:00

2025-04-08 00:40:00

谷歌合成數(shù)據(jù)大模型

2022-08-11 08:00:00

機(jī)器學(xué)習(xí)合成數(shù)據(jù)深度學(xué)習(xí)

2024-09-27 12:20:18

2022-04-17 23:13:02

人工智能元宇宙數(shù)據(jù)

2025-06-04 03:00:00

人工智能AI智能訓(xùn)練

2023-08-01 14:59:35

人工智能合成數(shù)據(jù)

2025-02-07 13:26:13

點贊
收藏

51CTO技術(shù)棧公眾號

日韩精品欧美在线| 欧美在线视频免费| 亚洲成人激情小说| 超碰97国产精品人人cao| 99综合电影在线视频| 国产mv免费观看入口亚洲| 91成人精品一区二区| 人人九九精品视频| 欧美性开放视频| 亚洲精品日韩在线观看| 国产91免费看| 美女一区二区三区在线观看| 欧美激情成人在线视频| 魔女鞋交玉足榨精调教| 国产精区一区二区| 91豆麻精品91久久久久久| 老汉色影院首页| 欧美日韩国产综合视频| 国产麻豆精品久久一二三| 欧美在线视频一区二区| 欧美日韩在线观看成人| 禁果av一区二区三区| 亚洲成人久久一区| 亚洲美女爱爱视频| 小黄鸭精品aⅴ导航网站入口| 综合精品久久久| 欧美黑人3p| www.精品视频| 六月婷婷色综合| 欧美一区第一页| 久久久久人妻一区精品色欧美| 亚洲男人都懂第一日本| 精品国产人成亚洲区| 午夜国产福利在线观看| 欧美亚洲韩国| 精品久久久久久久久久久久| 日本精品免费视频| 亚洲1卡2卡3卡4卡乱码精品| 91麻豆视频网站| 国产精品日韩一区二区免费视频| 91国内精品久久久| 秋霞午夜av一区二区三区| 欧美资源在线观看| 精品久久免费视频| 中文字幕免费精品| 久久影院资源网| 一区二区三区在线观看免费视频| 精品伊人久久久| 精品欧美一区二区三区精品久久 | 国产第一页在线| 亚洲另类在线制服丝袜| 在线国产99| 免费a级毛片在线播放| 中文字幕不卡一区| 日韩高清三级| 触手亚洲一区二区三区| 国产亚洲一区二区三区| 裸模一区二区三区免费| 天天干天天操av| 成人免费va视频| 国产精品永久入口久久久| 亚洲不卡免费视频| 丁香激情综合五月| 国产女人水真多18毛片18精品| 高清毛片aaaaaaaaa片| 国产成人av电影| 国产精品久久波多野结衣| 亚洲欧美高清视频| 99久久综合狠狠综合久久| 国产区一区二区三区| 午夜18视频在线观看| 久久综合中文字幕| 日韩欧美三级一区二区| 日本三级在线视频| 亚洲精品自拍动漫在线| 青草网在线观看| 久久青草伊人| 欧美亚洲国产bt| 午夜天堂在线视频| 日韩精品一级| 日韩精品电影网| 99久久99久久精品免费| 久久精品久久久| 久久频这里精品99香蕉| 99re这里只有精品在线| 久草在线在线精品观看| 国产精品一区二区三区不卡| 天堂中文在线资| 国产精品麻豆网站| 亚洲乱码日产精品bd在线观看| 日韩影视在线| 一本久久a久久免费精品不卡| 在线观看国产中文字幕| 视频在线亚洲| 亚洲欧美另类自拍| 日本午夜在线观看| 亚洲一区二区三区四区五区午夜 | www.亚洲一区二区| av资源中文在线| 欧美伊人久久大香线蕉综合69| 91日韩精品视频| 伦理一区二区三区| www.国产精品一二区| 国产精品99re| 毛片av中文字幕一区二区| 国产精品免费在线| 91涩漫在线观看| 亚洲成人av电影在线| 天天操天天爽天天射| 91欧美日韩在线| 伊人伊人伊人久久| 日韩成人在线免费视频| 久久99精品久久久久久久久久久久| 成人片在线免费看| 日本综合在线| 一本一道波多野结衣一区二区| 91精品999| 国产99精品一区| 欧美精品videossex性护士| 91丨九色丨海角社区| gogogo免费视频观看亚洲一| 国产又爽又黄ai换脸| 日韩成人动漫| 精品国产91久久久久久久妲己| 老司机精品免费视频| 久久不射中文字幕| 国产日韩欧美亚洲一区| 欧美黑人猛交的在线视频| 欧美日本高清视频在线观看| 亚洲精品成人无码熟妇在线| 国内精品久久久久久久影视麻豆 | 精品精品视频| 在线视频免费一区二区| 国产又色又爽又黄的| 国产精品一区二区久久不卡 | 欧美freesextv| 奇米四色中文综合久久| 天天干天天干天天干| 亚洲综合男人的天堂| 九九久久久久久| 国产精品亚洲二区| 国产69久久精品成人| 亚洲精品久久久蜜桃动漫| 亚洲特黄一级片| 亚洲一区日韩精品| av中文字幕一区二区| 国产成人福利网站| 国产大学生校花援交在线播放| 午夜电影一区二区三区| 第四色在线视频| 伊人久久亚洲美女图片| 国产麻豆一区二区三区在线观看| 最新日本在线观看| 日韩欧美国产一二三区| 欧美日韩精品亚洲精品| 国产电影精品久久禁18| 国产一级大片免费看| 免费欧美网站| 欧美激情18p| 少妇无码一区二区三区| 亚洲www啪成人一区二区麻豆| 星空大象在线观看免费播放| 亚洲电影成人| 久久riav二区三区| 性欧美又大又长又硬| 亚洲国语精品自产拍在线观看| 黄色小视频在线免费看| 成人免费毛片嘿嘿连载视频| 欧美日韩在线一| 久久99国产精一区二区三区| 国产精品igao视频| 日本高清视频在线播放| 91精品国产91综合久久蜜臀| 欧美成人精品一区二区免费看片| 成人午夜碰碰视频| 男人天堂999| 精品美女久久| 亚洲一区二区久久久久久久| 男人天堂亚洲| 亚洲男人的天堂在线| 精品国产青草久久久久96| 亚洲欧洲色图综合| 最新中文字幕日本| 午夜亚洲伦理| 亚洲精品国产一区| 国产精品17p| 日韩免费观看视频| h片在线免费| 精品国产三级电影在线观看| 精品国产一区二区三区四| 国产精品五月天| 在线观看网站黄| 亚洲一区一卡| 97精品国产97久久久久久粉红| 91午夜精品| 国产精品第1页| 亚洲91av| 原创国产精品91| 黄色aaa大片| 精品视频1区2区3区| av资源吧首页| 国产精品久久久久一区| 国产高清成人久久| 久久国产精品99精品国产 | 成人无码精品1区2区3区免费看 | 97se国产在线视频| 免费观看成人性生生活片 | 中文一区一区三区高中清不卡免费| 亚洲精品在线视频| 国产成人精品一区二三区四区五区| 欧美视频在线观看免费| 三级影片在线看| 国产视频一区不卡| 中国免费黄色片| 久久国产精品99精品国产| 免费在线观看的av网站| 国产一区二区三区四区三区四| 日韩精品av一区二区三区| 91亚洲无吗| 成人在线观看视频网站| 久久电影tv| 午夜精品久久久久久99热| 久久久久久国产精品免费无遮挡| 亚洲欧美制服另类日韩| 国产91绿帽单男绿奴| 69堂亚洲精品首页| 亚洲视频在线观看一区二区| 一本久道久久综合中文字幕| 日本熟妇毛耸耸xxxxxx| 亚洲精品成人在线| 国产3级在线观看| 国产欧美综合色| 香蕉网在线播放| 不卡在线视频中文字幕| 香蕉在线观看视频| 国产盗摄精品一区二区三区在线 | 日韩经典中文字幕| 日本激情一区二区| 欧美精品一区二区三区一线天视频| 国产精品女同一区二区| 欧美日韩一区不卡| 伊人久久国产精品| 欧美在线一区二区三区| 亚洲第一网站在线观看| 日韩欧美在线免费| 日本免费在线观看视频| 日韩欧美aaa| 极品国产91在线网站| 色综合中文综合网| 国产伦精品一区二区三区视频我| 色婷婷亚洲婷婷| 性色av免费观看| 在线欧美一区二区| 中文字幕久久网| 欧美日本乱大交xxxxx| 亚洲最大成人在线视频| 欧美美女直播网站| 国产绿帽一区二区三区| 欧美成人一区二区三区在线观看 | 日韩成人在线观看| 天堂av电影在线观看| 亚洲精品视频在线播放| 国产三级在线免费| 日韩亚洲欧美中文高清在线| 很黄的网站在线观看| 欧美人成在线视频| 成年人国产在线观看| 欧美在线视频播放| 欧美另类激情| 91成人免费视频| 日韩精品免费一区二区夜夜嗨| 人禽交欧美网站免费| 久久免费av| 青青草视频在线视频| 亚洲视频成人| 天天干在线影院| 国产一区二区不卡| 黄色av网址在线观看| 国产欧美日韩视频在线观看| 东京热无码av男人的天堂| 亚洲精品第一国产综合野| 少妇一级淫片免费放中国| 在线观看亚洲精品| 国产高清免费观看| 日韩成人小视频| 免费av在线网站| 久久久影视精品| 欧美暴力调教| 超碰97在线人人| 国精一区二区| 亚洲精品国产suv一区88| 国产欧美三级| 看看黄色一级片| 91在线一区二区| 开心激情五月网| 韩曰欧美视频免费观看| 亚洲图片在线播放| 日韩av一区二区在线| 天堂а√在线官网| 性欧美xxxx交| 99久久婷婷国产综合精品首页 | 亚洲天堂国产精品| 精品国产乱码久久久久久免费 | 91蜜桃传媒精品久久久一区二区| 欧美激情视频二区| 午夜影院在线观看欧美| 一级淫片免费看| 亚洲精品一区二区三区婷婷月| 成人在线观看亚洲| 国产大片精品免费永久看nba| 奇米一区二区| 亚洲aⅴ天堂av在线电影软件| 亚洲第一毛片| 日本55丰满熟妇厨房伦| 欧美国产国产综合| 51国产偷自视频区视频| 欧美成人猛片aaaaaaa| 超碰在线国产| 日韩av手机在线观看| 成人看片爽爽爽| 欧美少妇在线观看| 免费成人性网站| 亚洲 小说 欧美 激情 另类| 亚洲国产美女搞黄色| 国产免费的av| 中文字幕国产精品| 日韩美女在线看免费观看| 国产在线播放一区二区| 欧美日韩精品免费观看视频完整| 久久国产激情视频| 中文字幕免费观看一区| 色一情一乱一伦| 日韩精品视频在线| bl在线肉h视频大尺度| 不卡日韩av| 国产精品地址| 蜜桃色一区二区三区| 亚洲天堂久久久久久久| 中文字幕人妻一区二区在线视频| 亚洲男人的天堂在线| 九色porny自拍视频在线播放| 国产成人av一区二区三区| 欧美 日韩 国产一区二区在线视频 | av大片在线观看| 日韩男女性生活视频| 蜜桃成人av| 蜜臀久久99精品久久久酒店新书 | 精品乱码一区| 91久久久久| 91视频啊啊啊| 午夜久久久久久电影| 人人妻人人澡人人爽久久av | 精品亚洲一区二区| 僵尸再翻生在线观看免费国语| 精品久久久久久中文字幕动漫| 1024精品一区二区三区| 国产精品无码永久免费不卡| 狠狠色噜噜狠狠狠狠97| 邻居大乳一区二区三区| 国产精品久久久久久久电影| 欧美日韩第一| 亚洲第一色av| 一区二区理论电影在线观看| 丰满人妻妇伦又伦精品国产| 538国产精品一区二区免费视频| 免费成人蒂法| 99视频在线免费| 最近中文字幕一区二区三区| 99精品人妻无码专区在线视频区| 欧美福利视频在线观看| 欧美三级午夜理伦三级在线观看 | 麻豆成人久久精品二区三区小说| 亚洲精品成人av久久| 在线精品视频一区二区三四| 91se在线| 999在线观看免费大全电视剧| 亚洲免费激情| 日本理论中文字幕| 67194成人在线观看| 999av小视频在线| 日韩美女一区| 国产精品亚洲第一| 日韩精品乱码久久久久久| 亚洲欧美日韩国产中文专区| 久久亚洲人体| 国产情侣第一页| 久久久久久97三级| 国产精品久久婷婷| 亚洲91精品在线| 色一区二区三区四区| 俄罗斯女人裸体性做爰| 日韩欧美国产免费播放| 理论片午午伦夜理片在线播放| 国产成人精品日本亚洲11| 日韩精品一级中文字幕精品视频免费观看 | 欧美变态另类刺激| 亚洲视频在线一区二区| 国产又爽又黄网站亚洲视频123| 国产免费观看久久黄| 亚洲高清激情|