精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

編碼碾壓ChatGPT!UIUC清華聯(lián)手發(fā)布7B參數(shù)Magicoder,代碼數(shù)據(jù)權(quán)重全開源

人工智能 新聞
全新代碼大模型Magicoder,不到7B參數(shù),就能在代碼生成領(lǐng)域與頂級代碼模型不相上下。

開源「代碼大模型」來了!

UIUC清華團(tuán)隊的研究人員發(fā)布了Magicoder,不到7B參數(shù),就能在代碼生成領(lǐng)域與頂級代碼模型不相上下。

值得一提的是,Magicoder的代碼、權(quán)重和數(shù)據(jù),毫無保留完全開源。

論文地址:https://arxiv.org/abs/2312.02120

Magicoder依靠的OSS-INSTRUCT的方法,是通過對現(xiàn)有頂級代碼模型(例如ChatGPT)的提示,加上網(wǎng)絡(luò)上的種子代碼片段,來生成的代碼。

這可真是取之于大模型,用之于大模型;就有網(wǎng)友轉(zhuǎn)發(fā)說道:通過這些結(jié)果,看到了提高用于LLMs的合成數(shù)據(jù)的潛力也是一個非常有趣的領(lǐng)域。

話不多說,那就讓我們來具體了解一下Magicoder的來歷吧!

代碼生成的發(fā)展史

代碼生成(Code Generation),也叫程序合成(Program Synthesis),近幾十年來,一直都是學(xué)術(shù)界的一塊「硬骨頭」,在此領(lǐng)域進(jìn)行過的許多嘗試,例如基于抽象的合成和基于示例的編程,都沒有取得很好的效果。

直到最近,使用在代碼上訓(xùn)練的大型語言模型取得了顯著的突破,被廣泛應(yīng)用于輔助實際軟件開發(fā)。

最初,諸如GPT-3.5 Turbo和GPT-4之類的閉源模型主導(dǎo)了各種代碼生成基準(zhǔn)和排行榜。

為了推動開源LLM在代碼生成領(lǐng)域的應(yīng)用,SELF-INSTRUCT方法被開發(fā)出來,通過使用強(qiáng)大的LLM生成合成的編碼指令,并利用這些指令對較弱的學(xué)生模型進(jìn)行微調(diào),以從強(qiáng)大的教師模型中提取知識。

然而,SELF-INSTRUCT在提高LLM的指令遵循能力時,仍然依賴于狹窄范圍的預(yù)定義任務(wù)或啟發(fā)式方法。

為了解決這一問題,UIUC和清華的研究人員提出了Magicoder,其中采用的OSS-INSTRUCT方法,旨在減輕LLM固有的偏見,通過直接學(xué)習(xí)開源代碼釋放其創(chuàng)造高質(zhì)量和創(chuàng)意編碼指令的潛力。

OSS-INSTRUCT通過從開源中搜集的隨機(jī)代碼片段獲得靈感,自動生成新的編碼問題。借助于不同的種子代碼片段,OSS-INSTRUCT能夠直接產(chǎn)生多樣、真實和可控的編碼指令數(shù)據(jù)。

如下圖所示,在這個例子中,LLM從兩個不同函數(shù)的不完整代碼片段中獲取靈感,成功地將它們關(guān)聯(lián)起來,并構(gòu)建出一個現(xiàn)實的機(jī)器學(xué)習(xí)問題。

由于OSS-INSTRUCT與現(xiàn)有的數(shù)據(jù)生成方法是正交的,OSS-INSTRUCT可以被同時結(jié)合使用,進(jìn)一步推動模型在編碼任務(wù)中的能力。

為什么OSS-INSTRUCT如此神奇?

OSS-INSTRUCT的工作方式是通過對LLM(例如ChatGPT)進(jìn)行提示,然后根據(jù)從互聯(lián)網(wǎng)搜集的一些種子代碼片段(例如來自GitHub)生成編程問題及其解決方案。

一方面,種子片段提供了生成的可控性;

另一方面,OSS-INSTRUCT加強(qiáng)了LLM創(chuàng)建編程問題的多樣化,更符合真實的編程場景。

我們可以從以下幾個指標(biāo)中一探究竟:

1. 類別平衡

如下圖所示,通過計算OSS-INSTRUCT中每個樣本的嵌入與這10個類別之間的余弦相似性,可以看出其在不同類別之間表現(xiàn)出了多樣性和平衡。

2. 長度分布

下圖展示生成問題和解決方案的長度分布,良好的平衡性讓OSS-INSTRUCT更貼合實際應(yīng)用場景。

3. 與HumanEval的相似性計算

下圖展示了與HumanEval樣本的余弦相似性。

可以看出,OSS--INSTRUCT在所有研究的數(shù)據(jù)生成技術(shù)中表現(xiàn)出最低的平均相似度,這說明OSS--INSTRUCT生成的數(shù)據(jù)是最富有多樣性的。

但是,既然OSS-INSTRUCT獲取到的種子片段來自于開源代碼,為什么不直接在這些開源代碼上進(jìn)行微調(diào)呢?

為了回答這個問題,研究人員遵循CodeSearchNet,使用基礎(chǔ)的CODELLAMA-PYTHON-7B對配對數(shù)據(jù)進(jìn)行了2個時期的微調(diào),遵循相同訓(xùn)練設(shè)置。

對比結(jié)果如下表,在75,000個配對注釋-函數(shù)數(shù)據(jù)上,微調(diào)甚至使基礎(chǔ)模型惡化,而OSS-INSTRUCT有助于引入實質(zhì)性的提升。

研究人員推測,這種惡化可能是由這些配對數(shù)據(jù)固有的大量噪聲和不一致性導(dǎo)致的。

這進(jìn)一步表明,數(shù)據(jù)的真實性對于代碼指令調(diào)整至關(guān)重要,而非格式。

該結(jié)果還凸顯了OSS-INSTRUCT的優(yōu)越性,可以將這些松散相關(guān)的代碼片段轉(zhuǎn)化為語義一致的指令調(diào)整數(shù)據(jù)。

Magicoder表現(xiàn)評估

研究團(tuán)隊首先構(gòu)建了使用OSS-INSTRUCT進(jìn)行訓(xùn)練的Magicoder系列,同時進(jìn)一步組合使用OSS-INSTRUCT和Evol--INSTRUCT構(gòu)建了MagicoderS系列,并在兩個系列上都進(jìn)行了測試。

代碼生成基準(zhǔn)使用的是HumanEval和MBPP,這是目前兩個最廣泛使用的基準(zhǔn)。這些基準(zhǔn)中的每個任務(wù)都包括一個任務(wù)描述(例如docstring)作為提示,然后讓LLMs生成相應(yīng)的代碼。其正確性由少量測試用例進(jìn)行檢查。

為了更嚴(yán)格的評估,研究人員還使用了由EvalPlus框架支持的HumanEval+和MBPP+以獲取更多的測試。

值得注意的是,MagicoderS-CL和MagicoderS-DS在HumanEval+上的表現(xiàn)都優(yōu)于只有7B參數(shù)的ChatGPT。

讓我們具體看下Magicoder的表現(xiàn):

1. Python語言

我們首先可以觀察到Magicoder-CL相在HumanEval和HumanEval+上相對于CODELLAMA-PYTHON-34B有了實質(zhì)性的改進(jìn)。

MagicoderS-CL在HumanEval+上優(yōu)于ChatGPT和所有其他開源模型。

此外,盡管在HumanEval上得分略低于WizardCoder-CL-34B和ChatGPT,但在更嚴(yán)格的HumanEval+數(shù)據(jù)集上超過了它們,這表明MagicoderS-CL可能生成更穩(wěn)健的代碼。

2. 其他編程語言

在除了Python之外的語言對比中,Magicoder-CL在所有研究過的編程語言中都大幅超過了基礎(chǔ)的CODELLAMA-PYTHON-7B。

此外,MagicoderS-CL在所有編程語言上都進(jìn)一步改進(jìn)了Magicoder-CL,僅使用7B參數(shù)就實現(xiàn)了與WizardCoder-CL-34B相當(dāng)?shù)男阅堋?/span>

值得注意的是,Magicoder-CL僅使用非常有限的多語言數(shù)據(jù)進(jìn)行訓(xùn)練,但仍然優(yōu)于其他具有相似甚至更大規(guī)模的LLMs。這意味著LLMs可以從數(shù)據(jù)中學(xué)習(xí)超出其格式的知識。

3. 數(shù)據(jù)科學(xué)庫

最后,針對7個熱門Python數(shù)據(jù)科學(xué)庫的1,000個獨特的數(shù)據(jù)科學(xué)編碼問題(DS-1000 dataset),研究人員也進(jìn)行了單元測試,旨在評估LLMs在實際用例中的表現(xiàn)。

從表中可以看出,Magicoder-CL-7B已經(jīng)在所有評估的基線中表現(xiàn)出色,包括最先進(jìn)的WizardCoder-SC-15B,改善了8.3個百分點。

雖然Magicoder還不夠完美,但作者認(rèn)為,通過公開分享所有的數(shù)據(jù)和代碼細(xì)節(jié),會有越來越多的先進(jìn)代碼模型出現(xiàn)。

讓我們也拭目以待。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-07-22 09:00:00

2024-03-18 07:01:42

2025-03-20 08:34:14

2024-07-22 07:10:00

小模型機(jī)器學(xué)習(xí)蘋果

2025-02-10 14:30:00

模型數(shù)據(jù)開源

2024-12-03 15:51:45

2025-04-14 09:27:00

2024-02-22 10:09:00

開源模型

2024-06-03 10:43:34

2025-04-02 09:00:00

模型開源AI

2025-06-23 09:01:00

2025-01-06 07:40:00

2024-05-15 09:17:30

模型AI

2025-10-15 14:10:47

AI模型開源

2023-12-14 13:00:00

AI訓(xùn)練

2023-12-17 13:07:11

訓(xùn)練數(shù)據(jù)

2025-03-27 09:40:59

2023-10-13 19:58:33

Mistral7B模型

2024-01-29 09:40:00

AI訓(xùn)練

2024-02-04 07:20:00

AI模型
點贊
收藏

51CTO技術(shù)棧公眾號

99精品福利视频| 日韩一区二区三区免费视频| 国产91丝袜在线18| 国产91|九色| 国产精品www爽爽爽| 豆花视频一区| 精品久久久久久久久久久| 日产中文字幕在线精品一区| 国产露脸91国语对白| 亚洲精品婷婷| 久久久精品免费视频| 久久影视中文粉嫩av| 中文天堂在线资源| 伊人影院久久| 国产美女精品人人做人人爽| 成人av综合在线| 欧美有码在线视频| 欧美第一页在线观看| 日本韩国欧美| 亚洲男人的天堂av| 日本日本精品二区免费| 精品人妻一区二区三区换脸明星 | av电影一区二区三区| 天天插天天干天天操| 国产综合色视频| 国产精品久久久久久av福利软件| 精品亚洲永久免费| 91精品动漫在线观看| 在线成人激情黄色| 日韩中文字幕电影| 国模精品视频| 91在线观看免费视频| 国模私拍视频一区| 成人涩涩小片视频日本| 欧美色图激情小说| 欧美丰满少妇xxxbbb| 黄色片久久久久| 91老司机福利在线| 一区二区久久久久久| 中文字幕黄色大片| 成年午夜在线| 国产欧美日韩视频在线观看| 国产美女精品久久久| 精品女同一区二区三区| 国产在线精品一区在线观看麻豆| 国产精品免费福利| 中文字幕精品无码亚| 日韩av一区二区在线影视| 欧美自拍视频在线观看| 国产一级片毛片| 久久亚洲美女| 久久不射热爱视频精品| 四虎地址8848| 在线一区免费| 色综合导航网站| 欧美亚洲日本在线| 欧美久久九九| 亚洲天堂成人在线| 久久久久久国产精品无码| 亚洲国产合集| 在线观看日韩av| 五月天婷婷丁香网| 99成人在线视频| 麻豆成人在线看| 久久人人爽人人爽人人| 在线观看的日韩av| 欧洲亚洲免费视频| 国产精品高清无码| 韩国三级电影一区二区| 99久久伊人精品影院| 黄频网站在线观看| 狠狠色狠狠色合久久伊人| 成人www视频在线观看| 狠狠躁夜夜躁人人爽天天高潮| 日韩一级免费| 国产精品v片在线观看不卡| 中文字幕有码无码人妻av蜜桃| 久久 天天综合| 高清av免费一区中文字幕| 少妇人妻精品一区二区三区| 久久网站最新地址| 中文字幕一区二区三区精彩视频| 亚洲wwwww| 欧美午夜精品久久久久久人妖| 在线视频日韩一区| 日本免费一区二区三区视频| 日韩电影中文字幕在线观看| av手机在线播放| 欧美成人综合| 日韩美女写真福利在线观看| 久久久久久久久久久97| 99在线精品视频在线观看| 国产精品久久久久久久久久久不卡 | 一区二区黄色片| 欧美国产一级| 亚洲色图17p| 伊人久久久久久久久久久久久久| 欧美女人交a| 国产精品黄页免费高清在线观看| 国产欧美熟妇另类久久久| 91一区二区在线| 三年中国中文在线观看免费播放 | 欧美.www| 国产成人久久精品| 蜜臀av中文字幕| 国产一区欧美一区| 久久精品欧美| 91三级在线| 在线视频亚洲一区| 无码国产精品一区二区免费式直播 | 亚洲国产一区视频| 午夜免费一区二区| 国产精品99久久免费观看| 日韩中文字幕在线精品| 五月婷婷亚洲综合| 国产aⅴ综合色| 一区二区三区视频| 国产精品伦理| 亚洲精品乱码久久久久久按摩观| 手机在线免费看毛片| 日韩国产一区二| 黑人中文字幕一区二区三区| 操你啦视频在线| 亚洲免费视频中文字幕| 久久久国产欧美| 日本欧美三级| 色综合久久精品亚洲国产| 亚洲天堂狠狠干| 国产在线不卡一区| 少妇免费毛片久久久久久久久| 黄在线观看免费网站ktv| 日韩精品专区在线影院重磅| 黄色片子在线观看| 理论电影国产精品| 午夜精品区一区二区三 | 国产日韩欧美视频| 黄色片在线免费观看| 精品日韩中文字幕| 中文字幕在线永久| 亚洲精品婷婷| 久久精彩视频| 三妻四妾完整版在线观看电视剧| 亚洲成人av中文字幕| 国产一级片免费观看| 国产91在线|亚洲| 国内少妇毛片视频| 国产成人福利av| 欧美激情精品久久久久久变态| www.污视频| 亚洲国产视频在线| youjizz.com日本| 黄色精品网站| 国内精品视频在线播放| 中文不卡1区2区3区| 亚洲精品自在久久| 波多野结衣家庭主妇| 国产喷白浆一区二区三区| 日日碰狠狠躁久久躁婷婷| 国产一区二区三区探花| 国产精品美女呻吟| 久久日韩视频| 日韩欧美精品在线视频| 国产亚洲精品久久久久久无几年桃| 成人精品一区二区三区中文字幕| 国产原创中文在线观看| 国产精品免费大片| 国产精品中文字幕在线| 黄色av免费在线| 精品成人在线观看| 欧美福利第一页| 久久国产精品99久久久久久老狼| 熟妇熟女乱妇乱女网站| 亚洲一区 二区| 5278欧美一区二区三区| 国产色a在线| 3d动漫精品啪啪| 日本在线观看视频网站| 国产日产欧美一区二区三区| 一道本在线免费视频| 午夜日韩福利| 欧美日韩免费高清| 麻豆av在线播放| 日韩成人久久久| 国产裸体美女永久免费无遮挡| 自拍偷拍国产亚洲| 日b视频在线观看| 日韩制服丝袜先锋影音| 青青草原网站在线观看| 卡一精品卡二卡三网站乱码| 国产精品久久久久久久久久| 女人天堂av在线播放| 亚洲欧美一区二区激情| 国产99视频在线| 91国偷自产一区二区开放时间| 午夜激情福利网| 久久色.com| 日日夜夜精品视频免费观看| 亚洲影音一区| 潘金莲一级淫片aaaaaa播放1| 全球av集中精品导航福利| 91精品久久久久久| 欧美aa在线观看| 欧美日韩福利在线观看| 草碰在线视频| 亚洲国产中文字幕在线观看| 国产又黄又爽视频| 狠狠干狠狠久久| 波多野结衣亚洲色图| 欧美激情一区三区| jlzzjizz在线播放观看| 国产在线精品一区二区不卡了| 国产高清精品在线观看| 欧美不卡在线| 中文字幕欧美日韩一区二区三区| 欧美一区二区三区红桃小说| 91中文字幕在线| 九九热这里有精品| 日韩女优人人人人射在线视频| 美足av综合网| 欧美成人合集magnet| 番号在线播放| 亚洲欧美激情一区| 天堂成人在线观看| 精品国产网站在线观看| 国产丝袜在线视频| 久久久久久久久久免费视频| 亚洲国产日韩av| 精品人妻在线播放| 亚洲精品老司机| 日本黄色片免费观看| 国产精品污污网站在线观看| 亚洲第一综合网| 久久蜜桃一区二区| 中文字幕在线观看的网站| 成人h动漫精品一区二区| 乳色吐息在线观看| 国产综合成人久久大片91| 色戒在线免费观看| 久久精品国产精品亚洲精品| 五月婷婷丁香色| 美女网站在线免费欧美精品| 亚洲黄色a v| 日韩电影在线免费| 91av俱乐部| 日本欧美一区二区| 五月婷婷丁香综合网| 日韩精品乱码av一区二区| 欧美少妇性生活视频| 丝袜亚洲另类丝袜在线| wwwxxx黄色片| 玖玖在线精品| www.99av.com| 精品一区在线看| 绯色av蜜臀vs少妇| 成人国产精品免费观看视频| av2014天堂网| 国产人久久人人人人爽| 日韩av网站在线播放| 亚洲欧洲国产日韩| 欧美黄色一级网站| 午夜精品福利一区二区三区av| 日韩三级小视频| 一本大道久久a久久综合| 中文字幕人成人乱码亚洲电影| 欧美日韩精品欧美日韩精品一综合| 一区二区三区免费在线| 日韩欧美一二三区| 污视频网站免费观看| 亚洲色图狂野欧美| 免费高清在线观看| 日韩精品在线观看视频| 国产一级片在线播放| 北条麻妃久久精品| 大香伊人中文字幕精品| 日韩美女主播视频| 国产精品国产亚洲精品| 国内不卡一区二区三区| 欧美手机视频| 91成人综合网| 人妖欧美一区二区| 亚洲av无一区二区三区久久| 成人av在线观| 国产精品18在线| 亚洲午夜精品一区二区三区他趣| 少妇高潮av久久久久久| 91精品国产美女浴室洗澡无遮挡| 色婷婷综合视频| 色阁综合伊人av| 手机看片福利在线观看| 最近2019年日本中文免费字幕| 羞羞视频在线观看免费| 国产97在线观看| 中文字幕视频精品一区二区三区| 欧美人与物videos另类| 中文字幕一区二区精品区| 国产综合免费视频| 国产精品亚洲综合一区在线观看| av在线网站观看| 99这里只有久久精品视频| 国产激情av在线| 亚洲国产成人精品视频| 在线免费观看一级片| 亚洲精品国产综合区久久久久久久| 日本在线免费网| 日本高清不卡的在线| 亚洲第一二区| 亚洲一卡二卡区| 久久性色av| 五十路六十路七十路熟婆| 成人欧美一区二区三区黑人麻豆 | 亚洲黄色在线网站| 亚洲女厕所小便bbb| 久久人人爽人人爽人人片av免费| 精品欧美一区二区久久| 丝袜美腿美女被狂躁在线观看| 青青久久av北条麻妃海外网| 岛国精品一区| 欧美交换配乱吟粗大25p| 日本视频在线一区| 波多野结衣 在线| 无吗不卡中文字幕| 亚洲乱熟女一区二区| 色综合久综合久久综合久鬼88| 久久久免费人体| 天堂√在线观看一区二区| 久久国产精品99国产| 人妻激情偷乱频一区二区三区| 亚洲柠檬福利资源导航| 97超碰中文字幕| 深夜福利国产精品| 福利一区二区三区视频在线观看| 欧美日韩日本网| 香蕉久久夜色精品| 野外性满足hd| 狠狠躁夜夜躁人人爽天天天天97| 黄色aaa大片| 韩日欧美一区二区| 精品av导航| 久色视频在线播放| 99精品久久99久久久久| aaa人片在线| 亚洲欧美福利视频| 午夜精品成人av| 日韩一区国产在线观看| 免费的成人av| 五月婷婷六月香| 欧美军同video69gay| 欧美精品hd| 92国产精品久久久久首页| 欧美一区亚洲| 亚洲色图欧美日韩| 欧美视频第一页| 精品三级久久久久久久电影聊斋| 日本精品一区二区三区在线播放视频| 九九热爱视频精品视频| 在线一区亚洲| 国产一区二区不卡在线| 国产亚洲精品久久久久久无几年桃 | 精品av一区二区| 亚洲成人av免费看| 亚洲欧洲一区二区三区| 国产视频手机在线观看| 久久久久久97| 欧美精品第一区| 午夜剧场在线免费观看| 一区二区日韩电影| 人妻偷人精品一区二区三区| 青草青草久热精品视频在线观看| 欧美中文一区二区| 亚洲天堂一区二区在线观看| 亚洲成人资源网| 黄色大片在线看| 亚洲在线第一页| 小嫩嫩精品导航| 乱h高h女3p含苞待放| 亚洲国产精品成人av| 欧美日韩精品免费观看视完整| 亚洲精品在线免费看| 国产精品一区二区x88av| 国产精品人人人人| 日韩性生活视频| 国产亚洲精品美女久久| 美女一区二区三区视频| 一区二区三区视频在线观看 | 久久亚洲综合国产精品99麻豆精品福利| 国产精品视频一区视频二区| 日韩精品 欧美| 亚洲天堂久久久久久久| 国产又粗又猛又爽又| 不卡av电影院| 免费欧美视频| 国产香蕉精品视频| 欧美午夜在线一二页| 日本无删减在线| 午夜精品视频在线观看一区二区| 高清日韩电视剧大全免费| 最近国语视频在线观看免费播放| 久久久视频精品| 91精品国产调教在线观看| 国产精品1000部啪视频|