精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟祭出代碼大模型WaveCoder!四項(xiàng)代碼任務(wù)兩萬個(gè)實(shí)例數(shù)據(jù)集,讓LLM泛化能力飆升

人工智能 新聞
指令調(diào)優(yōu)或許是讓大模型性能提升最有潛力的方法。

用高質(zhì)量數(shù)據(jù)集進(jìn)行指令調(diào)優(yōu),能讓大模型性能快速提升。

對(duì)此,微軟研究團(tuán)隊(duì)訓(xùn)練了一個(gè)CodeOcean數(shù)據(jù)集,包含了2萬個(gè)指令實(shí)例的數(shù)據(jù)集,以及4個(gè)通用代碼相關(guān)任務(wù)。

與此同時(shí),研究人員微調(diào)了一個(gè)代碼大模型WaveCoder。

論文地址:https://arxiv.org/abs/2312.14187

實(shí)驗(yàn)結(jié)果表明,Wavecoder優(yōu)于其他開源模型,在以前的代碼生成任務(wù)中表現(xiàn)出色。

指令調(diào)優(yōu),釋放「代碼大模型」?jié)摿?/h4>

過去的一年,GPT-4、Gemini、Llama等大模型在一系列復(fù)雜NLP任務(wù)中取得了前所未有的性能。

這些LLM利用自監(jiān)督預(yù)訓(xùn)練的過程,以及隨后的微調(diào),展示了強(qiáng)大的零/少樣本的能力,能夠有效遵循人類指示完成不同的任務(wù)。

然而,若想訓(xùn)練微調(diào)這樣一個(gè)大模型,其成本非常巨大。

因此,一些相對(duì)較小的LLM,特別是代碼大語言模型(Code LLM),因其在廣泛的代碼相關(guān)任務(wù)上的卓越的性能,而引起了許多研究者的關(guān)注。

鑒于LLM可以通過預(yù)訓(xùn)練獲得豐富的專業(yè)知識(shí),因此在代碼語料庫上進(jìn)行高效的預(yù)訓(xùn)練,對(duì)代碼大模型至關(guān)重要。

包括Codex、CodeGen、StarCoder和CodeLLaMa在內(nèi)的多項(xiàng)研究已經(jīng)成功證明,預(yù)訓(xùn)練過程可以顯著提高大模型處理代碼相關(guān)問題的能力。

此外,指令調(diào)優(yōu)的多項(xiàng)研究(FLAN、ExT5)表明,指令調(diào)優(yōu)后的模型在各種任務(wù)中的表現(xiàn)符合人類預(yù)期。

這些研究將數(shù)千個(gè)任務(wù)納入訓(xùn)練管道,以提高預(yù)訓(xùn)練模型對(duì)下游任務(wù)的泛化能力。

比如,InstructGPT通過整合人類標(biāo)注者編寫的高質(zhì)量指令數(shù)據(jù),有效地調(diào)整了用戶輸入,推進(jìn)指令調(diào)優(yōu)的進(jìn)一步探索。

斯坦福的Alpaca利用ChatGPT通過Self-Instruct的方法,自己生成指令數(shù)據(jù),進(jìn)而用于指令調(diào)優(yōu)的過程。

WizardLM和WizardCoder則應(yīng)用了evol-instruct的方法,進(jìn)一步提高了預(yù)訓(xùn)練模型的有效性。

這些近來的研究都體現(xiàn)了,指令調(diào)優(yōu)在提高大模型性能方面,展現(xiàn)出強(qiáng)大的潛力。

基于這些工作,研究人員的直覺是,指令調(diào)優(yōu)可以激活大模型的潛力,然后將預(yù)訓(xùn)練模型微調(diào)到出色的智能水平。

對(duì)此,他們總結(jié)了指令調(diào)優(yōu)的主要功能:

- 泛化

指令調(diào)優(yōu)最初是為了增強(qiáng)大模型的跨任務(wù)泛化能力而提出的,當(dāng)使用不同的NLP任務(wù)指令進(jìn)行微調(diào)時(shí),指令調(diào)優(yōu)可提高模型在大量未見任務(wù)中的性能。

- 對(duì)齊

預(yù)訓(xùn)練模型從大量token和句子層面的自監(jiān)督任務(wù)中學(xué)習(xí),已經(jīng)具備了理解文本輸入的能力。指令調(diào)優(yōu)為這些預(yù)訓(xùn)練模型提供了指令級(jí)任務(wù),讓它們能夠從指令中提取原始文本語義之外的更多信息。這些額外的信息是用戶的意圖,能增強(qiáng)它們與人類用戶的交互能力,從而有助于對(duì)齊。

為了通過指令調(diào)優(yōu)提高代碼大模型的性能,目前已有許多設(shè)計(jì)好的生成指令數(shù)據(jù)的方法,主要集中在兩個(gè)方面。

例如,self-instructe、vol-instruct利用teacher LLM的零/少樣本的能力來生成指令數(shù)據(jù),這為教學(xué)數(shù)據(jù)的生成提供了一種神奇的方法。

然而,這些生成方法過于依賴于teacher LLM的性能,有時(shí)會(huì)產(chǎn)生大量的重復(fù)數(shù)據(jù),便會(huì)降低微調(diào)的效率。

CodeOcean:四項(xiàng)任務(wù)代碼相關(guān)指令數(shù)據(jù)

為了解決這些問題,如圖2所示,研究人員提出了一種可以充分利用源代碼,并明確控制生成數(shù)據(jù)質(zhì)量的方法。

由于指令調(diào)優(yōu)是為了使預(yù)訓(xùn)練模型與指令遵循訓(xùn)練集保持一致,研究人員提出了一個(gè)用于指令數(shù)據(jù)生成的LLM Generator-Disciminator(大模型生成器-判別器)框架。

通過使用生成器和判別器,最新方法可以使數(shù)據(jù)生成過程,更可定制和更可控。

該方法以原始代碼作為輸入,選擇核心數(shù)據(jù)集,通過調(diào)整原始代碼的分布,可以穩(wěn)定地生成更真實(shí)的指令數(shù)據(jù),控制數(shù)據(jù)的多樣性。

針對(duì)上述挑戰(zhàn),研究人員將指令實(shí)例分類為4個(gè)通用的代碼相關(guān)任務(wù):代碼匯總、代碼生成、代碼翻譯、代碼修復(fù)。

同時(shí),使用數(shù)據(jù)生成策略為4個(gè)代碼相關(guān)的任務(wù)生成一個(gè)由20000個(gè)指令實(shí)例的數(shù)據(jù)集,稱為CodeOcean。

為了驗(yàn)證最新的方法,研究人員將StarCoder、CodeLLaMa、DeepseekCoder作為基礎(chǔ)模型,根據(jù)最新的數(shù)據(jù)生成策略,微調(diào)出全新的WaveCoder模型。

與此同時(shí),研究人員在 HumanEval、MBPP、HumanEvalPack對(duì)模型進(jìn)行了評(píng)估,結(jié)果表明,WaveCoder在小規(guī)模指令調(diào)優(yōu)的基準(zhǔn)上擁有出色的性能。

代碼數(shù)據(jù)生成

如上所述,研究人員選擇了4個(gè)具有代表性的編碼任務(wù),并從開源數(shù)據(jù)集中收集原始代碼。

以下具體介紹了訓(xùn)練數(shù)據(jù)生成過程。

在本節(jié)中,我們將介紹我們探索的方法細(xì)節(jié)。我們首先選擇4個(gè)代表性的編碼任務(wù),并從開源數(shù)據(jù)集中收集原始代碼。

對(duì)于每個(gè)任務(wù),作者使用GPT-3.5-turbo生成指令數(shù)據(jù)進(jìn)行微調(diào)。生成提示如表2所示。

如下,是LLM Generator-Disciminator整體架構(gòu),也是數(shù)據(jù)生成的完整過程。

Codesearchnet是一個(gè)包含來自 GitHub 上托管的開源庫的200萬對(duì)(注釋、代碼)的數(shù)據(jù)集。它包括6種編程語言的代碼和文檔。我們選擇 CodeSearchNet 作為我們的基礎(chǔ)數(shù)據(jù)集,并應(yīng)用基于 coreset 的選擇方法KCenterGreedy來最大化原始代碼的多樣性。

具體來說,生成器根據(jù)輸入(a)生成指令數(shù)據(jù)。隨后,判別器接受輸出并生成分析結(jié)果,輸出(b)包括四個(gè)鍵,研究人員將這些信息作為指令調(diào)優(yōu)的輸入和輸出。

分析(c)包括每條規(guī)則的詳細(xì)原因和總體答案,以檢查樣本是否滿足所有要求。

實(shí)驗(yàn)評(píng)估結(jié)果

代碼生成任務(wù)評(píng)估

表3顯示了兩個(gè)基準(zhǔn)上不同大模型的pass@1得分。從結(jié)果來看,我們有以下觀察結(jié)果:

WaveCoder大大優(yōu)于使用少于20k指令調(diào)優(yōu)數(shù)據(jù)(InsT Data)的指令模型訓(xùn)練。

經(jīng)過微調(diào)過程,與基礎(chǔ)模型和開源模型的選擇相比,最新模型的性能顯示出實(shí)質(zhì)性的改善,但它仍然落后于專有模型的指導(dǎo)模型訓(xùn)練超過70k的訓(xùn)練數(shù)據(jù)。

研究人員還用HumanEvalPack上最先進(jìn)的Code LLM對(duì)WaveCoder進(jìn)行評(píng)分,如表4。

表5列出了WaveCoder在代碼匯總?cè)蝿?wù)方面的結(jié)果,突出顯示了以下顯著的觀察結(jié)果:

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-11-16 15:58:00

訓(xùn)練數(shù)據(jù)

2011-07-20 10:26:36

Windows 8

2023-10-07 08:28:06

語言模型代碼技術(shù)

2025-04-27 02:22:00

MCP大模型Agent

2023-10-04 19:34:58

CodePlan代碼庫編碼

2011-05-04 17:20:24

打印機(jī)惠普節(jié)約方法

2009-05-31 18:55:35

虛擬化UnixHyper-V

2016-11-10 20:44:57

數(shù)據(jù)管理測(cè)試商務(wù)智能移動(dòng)應(yīng)用測(cè)試

2013-12-04 09:57:15

虛擬化存儲(chǔ)

2017-07-27 08:38:51

JavaLinux

2012-07-11 10:09:20

Android惡意軟件

2012-07-16 13:17:02

Android惡意軟件惡意軟件

2020-05-22 22:44:11

數(shù)字化轉(zhuǎn)型物聯(lián)網(wǎng)IoT

2011-08-02 16:47:47

電力信息化惠普

2023-03-03 10:17:38

數(shù)字化轉(zhuǎn)型IT領(lǐng)導(dǎo)者

2011-04-12 13:10:02

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲制服丝袜在线| 一本一本久久a久久综合精品| 午夜av电影一区| 欧美福利精品| 亚洲视频在线免费播放| 欧美成人午夜| 亚洲欧美三级伦理| 一级片黄色免费| av今日在线| 欧美国产欧美亚州国产日韩mv天天看完整| 国产一区二区香蕉| 日本黄色片视频| 97精品在线| 亚洲男人天堂古典| 91精品又粗又猛又爽| 欧美色网一区| 亚洲一区二区三区四区在线观看| 日韩精品欧美专区| 天天干天天摸天天操| 狠狠色狠狠色综合系列| 欧美亚洲国产视频小说| 欧美又粗又大又长| 日韩国产专区| 亚洲精品综合久久中文字幕| 久久久无码人妻精品无码| 亚洲mmav| 色狠狠色狠狠综合| 97中文字幕在线| 麻豆传媒视频在线| 欧美激情综合在线| 蜜桃传媒视频麻豆一区| 韩国av在线免费观看| 国产一区二区三区免费| 国产成人精品免高潮在线观看| 久久精品欧美一区二区| 91精品国偷自产在线电影 | 亚洲一级片网站| 久久sese| 日韩欧美在线第一页| 69sex久久精品国产麻豆| 九义人在线观看完整免费版电视剧| 91啦中文在线观看| 久久波多野结衣| 亚洲精品一区二区三区区别 | 久久人妻少妇嫩草av无码专区| 亚洲网站三级| 在线成人小视频| 五月婷婷六月合| 高清电影一区| 欧美在线免费播放| 国产一级片黄色| 日日av拍夜夜添久久免费| 精品久久久在线观看| 日韩精品 欧美| 鲁鲁在线中文| 日韩欧美中文字幕在线播放| 91国视频在线| 成人av三级| 在线观看国产91| wwww.国产| 日日夜夜一区| 日韩一级片网站| 亚洲最大视频网| 精品国产午夜肉伦伦影院| 精品播放一区二区| av无码av天天av天天爽| 亚洲人挤奶视频| 国产一区二区三区免费视频| 美国黄色特级片| 97精品国产| 欧美激情免费视频| 久久午夜免费视频| 视频一区免费在线观看| 国产精品一二区| 国产欧美一级片| 成人精品视频一区二区三区| 久久99九九| 国产在线观看精品一区| 中文字幕在线不卡一区二区三区| 偷拍盗摄高潮叫床对白清晰| 男人添女人下部高潮视频在线观看| 午夜视频一区二区| 久久久久国产精品熟女影院| 9999精品| 日韩av在线看| 国产中文字幕久久| 亚洲午夜极品| 国产www精品| a在线观看视频| 26uuuu精品一区二区| 亚洲 日韩 国产第一区| 四虎影院观看视频在线观看| 欧美午夜视频一区二区| 思思久久精品视频| 欧美国产极品| 色婷婷综合久久久久中文字幕1| 老女人性淫交视频| 久久性天堂网| www.久久艹| 992tv免费直播在线观看| 亚洲一区二区三区免费视频| 亚洲中文字幕久久精品无码喷水| 日韩一区二区三区在线看| 国产亚洲免费的视频看| 久久精品国产亚洲av香蕉 | 亚洲va欧美va人人爽| 三级在线视频观看| 好吊妞视频这里有精品| 神马国产精品影院av| 精品在线播放视频| 国产一区二区三区观看| 人偷久久久久久久偷女厕| 神马午夜伦理不卡| 欧美日韩美少妇| 国产 中文 字幕 日韩 在线| 综合一区在线| 国产欧美 在线欧美| 五月婷婷久久久| 亚洲欧美日韩中文播放| 少妇激情一区二区三区| 清纯唯美亚洲经典中文字幕| 久99九色视频在线观看| 亚洲天堂久久久久| 久久久不卡网国产精品二区 | 桃色av一区二区| 日韩女优av电影在线观看| 色屁屁草草影院ccyy.com| 亚洲狼人精品一区二区三区| 亚洲一区二区三区乱码aⅴ蜜桃女| 国产女主播在线写真| 黄色成人在线播放| 香港三日本8a三级少妇三级99| 午夜片欧美伦| 国产精品综合久久久| 免费黄网站在线观看| 亚洲国产成人porn| jjzz黄色片| 欧美二区不卡| 98国产高清一区| 综合久久2019| 日韩免费性生活视频播放| 四虎地址8848| 激情图片小说一区| 一级黄色录像免费看| 先锋影音网一区二区| 最新国产精品亚洲| 亚洲一级黄色大片| 国产精品国产a级| 伊人影院综合在线| 亚洲v在线看| 亚洲淫片在线视频| 污网站在线免费看| 精品国产a毛片| 国产精品23p| av电影天堂一区二区在线观看| 隔壁人妻偷人bd中字| 99久久人爽人人添人人澡| 欧美大片免费看| 色婷婷中文字幕| 色综合夜色一区| 99精品全国免费观看| 美女脱光内衣内裤视频久久网站| 日韩亚洲不卡在线| 欧美一区二区三区婷婷| 美女视频久久黄| 亚洲AV午夜精品| 亚瑟在线精品视频| 国产精品扒开腿做爽爽| 日韩国产在线一| 在线免费观看成人| 永久免费精品视频| 欧美一区在线直播| 中文字幕在线视频区| 在线综合视频播放| 亚洲视频免费播放| 欧美极品少妇xxxxⅹ高跟鞋 | 97视频一区| 欧美中文字幕视频| 欧美成人三区| 亚洲精品在线一区二区| 精品一区二区无码| 伊人一区二区三区| 中文字幕一区二区三区人妻| 麻豆国产精品777777在线| 欧美一级爱爱视频| 夜夜春成人影院| 91手机视频在线观看| 欧美伦理91| 日韩在线观看av| 神马午夜在线观看| 欧美理论片在线| 亚洲 欧美 日韩 综合| 国产精品久久久久久久久晋中 | 三级网站免费观看| 在线观看不卡视频| 国产真人真事毛片| 国产精品第四页| 国产福利短视频| 国产米奇在线777精品观看| 欧美视频在线播放一区| 888久久久| 日本高清不卡一区二区三| 日韩精品视频在线看| 国产精品va在线播放我和闺蜜| 蜜臀av在线播放| 日韩中文字幕国产| 免费看男男www网站入口在线| 日韩欧美精品在线视频| 国产天堂第一区| 香港成人在线视频| 久热这里有精品| 国产精品久久久久久亚洲毛片 | 亚洲在线视频免费观看| 超碰97av在线| 久久亚洲精品国产精品紫薇| 黄页网站在线看| 久久99国产精品成人| 最近免费中文字幕中文高清百度| 午夜日韩激情| 国产a级片免费看| 激情婷婷综合| 久久综合一区| 粉嫩一区二区三区四区公司1| 成人激情视频在线观看| 日本精品网站| 国产成人精品一区二区| 性感女国产在线| 97香蕉久久夜色精品国产| 欧美人与性动交α欧美精品图片| 久久精品国产精品亚洲| 最新国产在线观看| 一区二区三区视频观看| 国产精品99999| 亚洲欧美中文日韩在线v日本| 天堂中文网在线| 精品国产免费人成电影在线观看四季| aaa国产视频| 欧美一区二区三区在线看| 一区二区的视频| 欧美二区三区91| 国产免费久久久| 欧美一级片免费看| 国产精品欧美亚洲| 91精品综合久久久久久| 国产精品无码久久av| 91精品国产一区二区三区| 97精品人妻一区二区三区| 欧美乱妇15p| 99久久精品无免国产免费| 91精品在线免费| 性欧美18一19性猛交| 日韩欧美自拍偷拍| 丰满肥臀噗嗤啊x99av| 日韩精品一区二区三区在线观看| 午夜精品久久久久久久99| 欧美r级电影在线观看| 欧美一区二不卡视频| 亚洲精品国产精品国自产观看浪潮 | 最新中文字幕在线播放| 国产成人黄色av| 亚洲精品555| 91久久精品美女| 99re热精品视频| 欧美日韩一区二| 日韩影院二区| 乱熟女高潮一区二区在线| 在线欧美日韩| 色诱视频在线观看| 精品写真视频在线观看| 国产精品无码自拍| 91啪亚洲精品| 青青青视频在线播放| 亚洲精品一二三| 日韩乱码人妻无码中文字幕| 欧美视频一区二区三区…| 中文在线观看av| 欧美刺激午夜性久久久久久久| 天天摸天天碰天天爽天天弄| 亚洲图中文字幕| 亚洲七七久久综合桃花剧情介绍| 97人人做人人爱| 精品乱码一区二区三区四区| 国产高清在线精品一区二区三区| 久草在线成人| 91成人在线视频观看| 亚洲免费影院| 北条麻妃亚洲一区| 久久久久国产精品人| 最新黄色av网址| 欧美日韩激情小视频| 亚洲天堂视频网| 日韩大陆欧美高清视频区| 午夜不卡视频| 欧美资源在线观看| 美国十次综合久久| 日本高清久久一区二区三区| 欧美久久久久| 特级丰满少妇一级| aaa欧美色吧激情视频| 亚洲av无一区二区三区| 精品久久久精品| 国产伦子伦对白视频| 亚洲视频综合网| av电影在线地址| 亚洲永久免费观看| 日韩伦理一区| 国产偷人视频免费| 国产91富婆露脸刺激对白| 青青草华人在线视频| 黑人精品xxx一区一二区| 国产成人三级在线播放| 视频在线一区二区| 日本综合字幕| 精品国产一区二区三区免费| 综合激情在线| 婷婷激情综合五月天| 国产精品网站在线| 国产又黄又猛又粗又爽| 精品国产免费一区二区三区四区| 国产黄色小视频在线| 国产精品欧美日韩一区二区| 香蕉久久精品| 国产极品粉嫩福利姬萌白酱| 成熟亚洲日本毛茸茸凸凹| 久久国产精品国语对白| 欧美日韩中文另类| 国产精品影院在线| 日韩av不卡电影| 宅男在线一区| 啊啊啊一区二区| 99久精品国产| 国产情侣在线视频| 日韩av资源在线播放| av最新在线| 韩国成人一区| 9久re热视频在线精品| 久久久久亚洲AV成人网人人小说| 亚洲欧美日韩久久精品| 国产精品久久久久毛片| 久久精品在线播放| 宅男噜噜噜66国产精品免费| 亚洲欧美日韩精品综合在线观看| 丝袜美腿亚洲色图| 新91视频在线观看| 91成人国产精品| 在线观看a视频| 91精品视频在线看| 欧美日本一区二区高清播放视频| 亚洲欧美日韩中文字幕在线观看| 一区二区三区国产豹纹内裤在线| 亚洲老妇色熟女老太| 国内精品在线一区| 亚洲动漫在线观看| 91色国产在线| 亚洲欧美影音先锋| 午夜精品久久久久久久爽| 久久久噜噜噜久噜久久| 亚洲人成网站77777在线观看 | 123成人网| 一区二区成人国产精品| 国产一区二区剧情av在线| 久久精品久久国产| 亚洲男人av电影| 日韩黄色三级| av动漫在线免费观看| a美女胸又www黄视频久久| 波多野结衣 久久| 日韩中文字幕视频在线观看| 欧美成年网站| 欧美a在线视频| 国产精品不卡在线| 亚洲精品一区二区三区新线路| 2020国产精品视频| 99久久久久国产精品| 久久久久国产免费| 一本久道久久综合中文字幕| 老司机福利在线视频| 国产一区二区三区无遮挡| 日韩黄色免费电影| 欧美人妻精品一区二区三区| 日韩电视剧免费观看网站| www.26天天久久天堂| 男女h黄动漫啪啪无遮挡软件| 丁香婷婷综合网| 成人黄色三级视频| 高清一区二区三区四区五区| 国产精品一线天粉嫩av| 久久久久亚洲av无码麻豆| 懂色av一区二区三区| 免费**毛片在线| 精品一区二区三区日本| 老司机午夜精品| 在线观看精品国产| 久久视频免费观看| 欧美禁忌电影| 中文字幕第九页| 欧美日本韩国一区二区三区视频 | 777亚洲妇女| 欧美电影免费看| 久久综合亚洲精品|