精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

IBM開源了5億行代碼數(shù)據(jù)集,里面最多的編程語言卻不是Python

新聞 人工智能
近日,IBM 研究院發(fā)布了一個名為 CodeNet 的數(shù)據(jù)集,該數(shù)據(jù)集包含 1400 萬個代碼樣本,用于訓(xùn)練面向編程任務(wù)的機(jī)器學(xué)習(xí)模型。

谷歌服務(wù)包含 20 億行代碼,一輛汽車的系統(tǒng)包含 1 億行代碼——寫代碼、debug 這么大的工作量不交給 AI 來做能行?

讓 AI 自動生成代碼,是很多開發(fā)者的夢想,近些年來,有關(guān)這一方面的研究屢見不鮮。但要想訓(xùn)練一個好用的 AI,最重要的工作或許就是找到優(yōu)質(zhì)數(shù)據(jù)。

近日,IBM 研究院發(fā)布了一個名為 CodeNet 的數(shù)據(jù)集,該數(shù)據(jù)集包含 1400 萬個代碼樣本,用于訓(xùn)練面向編程任務(wù)的機(jī)器學(xué)習(xí)模型。該數(shù)據(jù)集的主要特點(diǎn)包括:

  • 迄今為止最大的編碼數(shù)據(jù)集,其中包含 4000 個問題,1400 萬個代碼樣本,50 + 種編程語言;
  • 該數(shù)據(jù)集添加了注釋,包括問題描述、內(nèi)存 / 時間限制、語言、代碼通過 / error 等。

IBM 希望 CodeNet 仿效大型圖像數(shù)據(jù)集 ImageNet,并成為教軟件理解軟件開發(fā)藍(lán)圖的領(lǐng)先數(shù)據(jù)集。IBM 希望 CodeNet 可以用于訓(xùn)練具有如下功能的開發(fā)工具:

  • 從一種編程語言轉(zhuǎn)換到另一種編程語言;
  • 代碼推薦與補(bǔ)全;
  • 代碼優(yōu)化;
  • 搜索應(yīng)用程序和庫來源以查找所需例程;
  • 將一種語言轉(zhuǎn)換成另一種語言;
  • 識別錯誤 / 正確的實(shí)現(xiàn)機(jī)制。

利用深度學(xué)習(xí)進(jìn)行自動化編程

近年來,機(jī)器學(xué)習(xí)領(lǐng)域取得了令人矚目的進(jìn)步,AI 讓多種工作任務(wù)實(shí)現(xiàn)了自動化,包括編程。但是 AI 在軟件開發(fā)中的滲透卻遇到了極大的困難。

人們在編程時通常會使用大量的有意識和潛意識思維機(jī)制發(fā)現(xiàn)新的問題并探索不同的解決方案。相比之下,大多數(shù)機(jī)器學(xué)習(xí)算法都需要定義明確的問題和大量帶有注釋的數(shù)據(jù)才能夠開發(fā)出解決相同編程問題的模型。

為了解決這一難題,研究者與開發(fā)者們已經(jīng)做出了很多努力,包括創(chuàng)建數(shù)據(jù)集和基準(zhǔn),以開發(fā)和評估「用于編程的 AI」系統(tǒng)。但是,鑒于軟件開發(fā)的創(chuàng)造性和開放性,很難為編程創(chuàng)建完美的數(shù)據(jù)集。

IBM 的研究人員試圖創(chuàng)建一個多用途的數(shù)據(jù)集,可用于訓(xùn)練各種任務(wù)的機(jī)器學(xué)習(xí)模型。CodeNet 的創(chuàng)建者將其描述為「非常大規(guī)模,多樣且高質(zhì)量的數(shù)據(jù)集,能夠加快使用 AI 編程的步伐」。該數(shù)據(jù)集包含 1400 萬個代碼樣本,共有用 55 種編程語言編寫的 5 億行代碼,其中 C++ 是樣本中使用最多的語言,Python 位居第二。這些代碼樣本是從提交給在線編程平臺 AIZU 和 AtCoder 上的近 4,000 項(xiàng)挑戰(zhàn)的提交中獲得的,代碼樣本包括這些挑戰(zhàn)的正確答案和錯誤答案。

CodeNet 項(xiàng)目地址:https://github.com/IBM/Project_CodeNet

CodeNet 的主要特點(diǎn)之一是代碼樣本中添加了注釋。數(shù)據(jù)集中包含的每個編程挑戰(zhàn)都有一個文本說明以及 CPU 時間和內(nèi)存限制。每個代碼提交都包含十幾條信息,包括語言,提交日期,內(nèi)存占用大小,執(zhí)行時間,接受和 error 類型。為了確保該數(shù)據(jù)集在編程語言,接受和 error 類型等多個維度上保持平衡,IBM 的研究人員付出了巨大的努力。

機(jī)器學(xué)習(xí)編程任務(wù)

CodeNet 并不是訓(xùn)練機(jī)器學(xué)習(xí)模型來執(zhí)行編程任務(wù)的唯一數(shù)據(jù)集。相比于其他數(shù)據(jù)集,CodeNet 具有以下特點(diǎn):首先是數(shù)據(jù)集的規(guī)模,包括樣本數(shù)量和語言的多樣性;但更重要的是編碼樣本附帶的元數(shù)據(jù)。CodeNet 中添加的豐富注釋使其能夠適用于多種任務(wù),不再只是用于特定編程任務(wù)。

使用 CodeNet 開發(fā)用于編程任務(wù)的機(jī)器學(xué)習(xí)模型包括以下方式:

  • CodeNet 可以用來進(jìn)行語言翻譯任務(wù)。由于數(shù)據(jù)集中包含的每個編程挑戰(zhàn)都包含不同編程語言的提交,因此數(shù)據(jù)科學(xué)家們可以用它來創(chuàng)建機(jī)器學(xué)習(xí)模型,將代碼從一種語言轉(zhuǎn)換成另一種語言。對于希望將舊代碼移植成新語言、使新一代程序員能夠訪問并使用新型開發(fā)工具進(jìn)行維護(hù)的人們而言,這可能很方便;
  • CodeNet 還可以用來開發(fā)完成代碼推薦任務(wù)的機(jī)器學(xué)習(xí)模型開發(fā)。推薦工具既可以像完成當(dāng)前代碼行的自動完成樣式模型一樣簡單,也可以是編寫完整函數(shù)或代碼塊的更復(fù)雜系統(tǒng)。

由于 CodeNet 擁有大量關(guān)于內(nèi)存和執(zhí)行時間指標(biāo)的元數(shù)據(jù),數(shù)據(jù)科學(xué)家也可以使用它來開發(fā)代碼優(yōu)化系統(tǒng)。或者,可以使用 error 類型的元數(shù)據(jù)來訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng),以標(biāo)記源代碼中的潛在缺陷。

CodeNet 更高級的用例是代碼生成。CodeNet 是一個豐富的問題文本描述庫,并包含對應(yīng)的源代碼。已經(jīng)有開發(fā)人員使用高級語言模型(如 GPT-3)從自然語言描述生成代碼,CodeNet 或許能夠幫助微調(diào)這些語言模型,使其在代碼生成中更加一致。

IBM 的研究人員已經(jīng)對 CodeNet 進(jìn)行了一些實(shí)驗(yàn),這些實(shí)驗(yàn)包括代碼分類、代碼相似性評估和代碼補(bǔ)全。使用的深度學(xué)習(xí)體系架構(gòu)包括簡單的多層感知器、卷積神經(jīng)網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)、Transformer。

IBM 和 MIT-IBM Watson AI 實(shí)驗(yàn)室團(tuán)隊(duì)聯(lián)合開發(fā)了該數(shù)據(jù)集,研究中的實(shí)驗(yàn)結(jié)果顯示大多數(shù)任務(wù)都能獲得90%以上的準(zhǔn)確率。

論文地址:https://github.com/IBM/Project_CodeNet/blob/main/ProjectCodeNet.pdf

建立高效的機(jī)器學(xué)習(xí)系統(tǒng),需付出巨大努力

IBM 的工程師們進(jìn)行了大量的工作來管理 CodeNet 數(shù)據(jù)集并開發(fā)其輔助工具。

首先,研究團(tuán)隊(duì)需要從 AIZU 和 AtCoder 收集代碼樣本。二者中只有一個平臺有應(yīng)用程序接口(API),可以很容易地獲取代碼,而另一個平臺沒有易于訪問的接口,研究團(tuán)隊(duì)需要開發(fā)新工具,從平臺的網(wǎng)頁上抓取數(shù)據(jù),并將其分解成表格格式。然后研究者們需要手動將兩個數(shù)據(jù)集合并到一個統(tǒng)一的模式中。

接下來,研究團(tuán)隊(duì)需要開發(fā)用于識別和刪除重復(fù)代碼和樣本(包含大量無效代碼,運(yùn)行時未執(zhí)行的源代碼)的工具,以清除無用數(shù)據(jù)。

此外,該研究團(tuán)隊(duì)還開發(fā)了預(yù)處理工具,使得在 CodeNet 語料庫上訓(xùn)練機(jī)器學(xué)習(xí)模型變得更容易,包括用于不同編程語言的 tokenizer、分析樹(parse tree)和用于圖神經(jīng)網(wǎng)絡(luò)的圖表征生成器。

所有這些都提醒我們,要創(chuàng)建高效的機(jī)器學(xué)習(xí)系統(tǒng),需要付出巨大的努力。人工智能要取代程序員還有很長的路要走。

 【責(zé)任編輯:張燕妮 TEL:(010)68476606】

 

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2021-05-21 10:46:55

AI 代碼人工智能

2023-03-26 19:38:09

2015-07-16 17:23:27

2018-05-08 10:28:53

Oracle云轉(zhuǎn)型Adobe

2021-12-29 21:36:12

微信支付寶移動支付

2020-07-17 10:09:44

程序員技術(shù)開發(fā)

2024-12-19 07:50:00

2013-04-11 09:37:51

編程語言

2023-07-18 18:10:04

2022-03-09 07:29:55

AI開源C語言

2011-09-23 09:47:48

編程

2009-04-27 12:42:54

技術(shù)周刊收購Oracle

2021-11-02 15:49:46

低代碼編程Power Fx微軟

2013-08-23 11:06:34

編程語言

2018-11-25 20:29:24

編程語言PythonJava

2022-05-26 07:53:33

Python代碼編程語言

2021-05-14 13:05:20

AI 數(shù)據(jù)人工智能

2021-03-04 08:41:02

微軟Powr Fx低代碼

2020-12-08 06:20:00

Python自動化工具開源

2020-02-05 17:09:28

編程語言代碼Ruby
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

久久日韩精品一区二区五区| 狠狠入ady亚洲精品| 欧美日韩mp4| 日韩一级片一区二区| 午夜精品在线播放| 老司机精品福利视频| 久久久黄色av| 丰满少妇在线观看资源站| 精品美女一区| 天天操天天综合网| 热这里只有精品| 婷婷在线免费观看| 狠狠狠色丁香婷婷综合久久五月| 午夜精品久久久久久久白皮肤| 黄色激情小视频| 麻豆精品少妇| 91精品国产手机| 久久精品.com| 国产又色又爽又黄刺激在线视频| 久久久久国产精品厨房| 成人在线观看av| 亚洲熟女乱色一区二区三区久久久| 亚洲激情精品| 美女国内精品自产拍在线播放| 久久久久久九九九九九| 北条麻妃在线一区二区免费播放| 欧美日韩一卡二卡| 久草综合在线观看| 国模私拍一区二区国模曼安| 亚洲色大成网站www久久九九| 青青成人在线| 深夜福利视频一区| 成人激情视频网站| av资源一区二区| 96日本xxxxxⅹxxx17| 日韩精品国产欧美| 欧美自拍大量在线观看| 国产精品成人免费一区二区视频| 7777久久香蕉成人影院| 尤物九九久久国产精品的特点| 欧美做受喷浆在线观看| 国产精品qvod| 精品剧情在线观看| 伊人av在线播放| 日本免费一区二区三区视频| 91精品综合久久久久久| 三上悠亚在线一区| 欧美视频精品| 欧美日韩精品一区二区三区四区 | 欧美日本一道本在线视频| jizzjizzxxxx| 日韩久久一区二区三区| 日本韩国欧美在线| 别急慢慢来1978如如2| 欧美www.| 欧美在线观看视频一区二区三区 | 国产第一页第二页| 狠狠综合久久av一区二区老牛| 久久99国产精品自在自在app| 亚洲伦理一区二区三区| 国产韩国精品一区二区三区| 久久精品福利视频| 九九热国产在线| 亚洲三级网站| 日本乱人伦a精品| 中文字幕免费高清网站| 蜜桃av一区二区三区| 成人疯狂猛交xxx| 亚洲av无码国产精品永久一区| 成人综合在线观看| 九色91视频| 国产日韩精品在线看| 国产精品网曝门| 亚洲爆乳无码精品aaa片蜜桃| 国产精品yjizz视频网| 亚洲最新视频在线播放| 六月丁香激情网| 国语自产精品视频在线看抢先版结局 | 91丨九色porny丨蝌蚪| 日本一区二区视频| 黄色动漫在线| 五月激情综合网| 性生交免费视频| 国产成人视屏| 日韩电影网在线| 国内毛片毛片毛片毛片毛片| 欧美体内she精视频在线观看| 91精品国产乱码久久久久久久久 | 国产一区二区日韩精品| 国产另类自拍| 91精品专区| 亚洲第一主播视频| 9久久婷婷国产综合精品性色 | 日本午夜小视频| 视频一区中文字幕国产| 114国产精品久久免费观看| 亚洲欧洲国产综合| 亚洲天堂免费看| 欧洲黄色一级视频| 白嫩亚洲一区二区三区| 日韩激情av在线免费观看| 亚洲不卡的av| 麻豆9191精品国产| 国产精品一区在线观看| www 日韩| 欧美性xxxxx极品| 五月天国产视频| 激情综合网站| 韩国三级日本三级少妇99| 一道本无吗一区| 91免费观看视频在线| 欧洲精品视频在线| 日韩漫画puputoon| 亚洲美女www午夜| 久久久.www| 精品中文字幕一区二区| 欧美欧美一区二区| av资源中文在线天堂| 欧美一区二区三区的| 成人无码av片在线观看| 99在线热播精品免费99热| 91亚洲va在线va天堂va国| 国产www.大片在线| 狠狠躁夜夜躁久久躁别揉| 国产成人av免费观看| 久久资源中文字幕| 国产精品久久久久久亚洲影视 | 乱妇乱女熟妇熟女网站| 日韩精品一区二区三区中文在线| 色爱av美腿丝袜综合粉嫩av| 亚洲毛片一区二区三区| 91麻豆免费视频| 玩弄中年熟妇正在播放| 丁香婷婷成人| 国内精品久久久久影院优| 不卡视频在线播放| 一区二区三区中文字幕电影| av在线网站免费观看| 欧美成人自拍| 成人免费淫片aa视频免费| 97超碰人人在线| 欧美视频在线不卡| 国产精品视频在| 美女精品自拍一二三四| 先锋影音网一区| 国产成人午夜性a一级毛片| 国产亚洲视频在线观看| 国产情侣小视频| 中文字幕免费观看一区| 欧美亚洲日本在线观看| 精品盗摄女厕tp美女嘘嘘| 国产成人久久精品| 成年午夜在线| 欧美日韩午夜在线| 中国一级片在线观看| 国产精品一区三区| 中文精品无码中文字幕无码专区| 国产精品久久久久av蜜臀| 午夜精品久久久久久久男人的天堂| 后进极品白嫩翘臀在线视频| 午夜成人免费视频| 伊人网伊人影院| 奇米色一区二区| 爱爱爱视频网站| 日韩在线亚洲| 7777精品视频| 自拍视频在线播放| 日韩欧美一级精品久久| 国产精品7777777| 国产日产欧产精品推荐色| 97超碰人人爽| 欧美日韩午夜| 日本福利一区二区三区| 电影一区中文字幕| 久久人人爽人人| 久久久久久久影视| 在线91免费看| 天天操中文字幕| 国产精品视频yy9299一区| 欧美性猛交xx| 老鸭窝毛片一区二区三区| 一区在线电影| 日韩a级大片| 国产欧美欧洲在线观看| 538在线视频| 日韩在线播放av| 色偷偷在线观看| 欧美日韩国产在线观看| 国产无遮挡aaa片爽爽| 国产婷婷色一区二区三区在线| 天天干天天色天天干| 日韩视频久久| 午夜啪啪免费视频| 综合伊思人在钱三区| 亚洲japanese制服美女| 美女100%一区| 欧美日韩国产成人在线| 东热在线免费视频| 亚洲第一综合天堂另类专| 亚洲视频一区在线播放| 欧美日韩亚洲一区二| 精品人妻伦九区久久aaa片| 91色在线porny| 不许穿内裤随时挨c调教h苏绵| 日韩**一区毛片| 精品这里只有精品| 欧美a级片一区| 日本一区免费观看| 成人另类视频| 亚洲自拍偷拍色图| 视频欧美精品| 青青草99啪国产免费| 久久不射影院| 不卡av电影院| 麻豆传媒在线观看| 亚洲色图欧美制服丝袜另类第一页| 免费看国产片在线观看| 在线不卡一区二区| 中文字幕有码无码人妻av蜜桃| 婷婷成人综合网| 久久这里只有精品国产| 亚洲欧美激情小说另类| 东京热无码av男人的天堂| 久久日一线二线三线suv| yy6080午夜| 成人视屏免费看| 国产又粗又猛又爽又黄| 国产在线精品一区二区夜色 | 99国内精品久久| 中文字幕第10页| 国产呦萝稀缺另类资源| 亚洲va在线va天堂va偷拍| 日本女优在线视频一区二区| 国产一区视频免费观看| 玖玖精品视频| 日韩在线xxx| 久久国产免费| av动漫在线观看| 国产精品久久久亚洲一区| 男的插女的下面视频| 伊人成年综合电影网| bt天堂新版中文在线地址| 欧美午夜国产| 人妻无码久久一区二区三区免费| 今天的高清视频免费播放成人| 久久人人爽人人爽人人av| 亚洲国内自拍| 免费国产a级片| 国产欧美日韩亚洲一区二区三区| 欧美v在线观看| 久久激情一区| 亚洲国产高清av| 精品一区二区三区av| www.51色.com| 丁香激情综合国产| 污片免费在线观看| 久久久噜噜噜久久人人看| 麻豆av免费观看| 中文字幕第一区综合| 青青操在线播放| 亚洲精品成人悠悠色影视| 国产第一页在线播放| 色综合久久久久综合99| 欧美一级特黄视频| 欧美撒尿777hd撒尿| 国产美女精品视频国产| 亚洲成avwww人| 三区在线观看| 日韩中文字幕不卡视频| а√中文在线8| 亚洲91av视频| 国产在线|日韩| 91免费欧美精品| 嫩草国产精品入口| 亚洲成色www久久网站| 午夜视频一区| 日韩av片在线看| 国内精品免费**视频| 无码成人精品区在线观看| 国产日韩欧美电影| 久久网免费视频| 色噜噜狠狠色综合欧洲selulu| 91片黄在线观看喷潮| 精品国产一区二区三区久久久蜜月| 欧美18xxxxx| 成人97在线观看视频| 日韩深夜视频| 亚洲综合在线做性| 国产欧美日韩在线一区二区| 免费观看黄色大片| 蜜桃av一区| 伊人av在线播放| 中文字幕国产一区| 久久久久久久久久影院| 欧美一区二区三区不卡| 裸体xxxx视频在线| 欧美激情性做爰免费视频| 朝桐光一区二区| 国产日韩欧美一区二区| 俺要去色综合狠狠| 欧美大片在线播放| 国产美女精品一区二区三区| 久操视频免费看| 午夜激情一区二区| 国产福利第一页| 日韩中文理论片| 三上悠亚一区二区| 国内精品久久国产| 亚洲有吗中文字幕| 天堂av在线网站| 91碰在线视频| 国产网友自拍视频| 5858s免费视频成人| 国产1区2区3区在线| 81精品国产乱码久久久久久| 日本超碰一区二区| 日本丰满少妇黄大片在线观看| 日本vs亚洲vs韩国一区三区 | 亚洲欧美在线视频| 欧美日韩在线视频播放| 国产视频欧美视频| 99爱在线观看| 国产日韩欧美一区二区| 欧美日韩亚洲一区| 中文字幕一二三| 亚洲素人一区二区| 亚洲字幕av一区二区三区四区| 亚洲网站在线看| 欧美羞羞视频| 欧美日韩一区综合| 久久久亚洲一区| 黄色aaa视频| 91久久一区二区| 精品亚洲综合| 日韩免费av在线| 九九久久电影| 久久久久久久久久久久久久国产| 99re6这里只有精品视频在线观看| 国产精品不卡av| 亚洲国产毛片完整版| 国产蜜臀一区二区打屁股调教| www日韩av| 亚洲国产一区二区精品专区| 大乳护士喂奶hd| 精品美女永久免费视频| 天堂视频中文在线| 国产成人精品免费久久久久 | 日本在线视频一区二区三区| 美国av在线播放| 处破女av一区二区| 三级黄色在线视频| 精品香蕉一区二区三区| 亚洲成人激情社区| 亚洲国产精品一区二区第一页 | 91精品国产色综合久久ai换脸| 黄网站视频在线观看| 亚洲一区久久久| 亚洲成人中文| 亚洲午夜久久久久久久久红桃| 91久久一区二区| 国产调教视频在线观看| 99久久久久国产精品免费| 99热这里只有精品8| 欧美图片第一页| 欧美日韩高清一区二区三区| 在线观看男女av免费网址| 高清国产在线一区| 丝袜国产日韩另类美女| 波多野结衣欲乱| 欧美成人激情免费网| 成人性生活视频| 国产成年人在线观看| 成人网页在线观看| 欧美特级黄色片| 欧美成人精品在线播放| 欧美美女在线直播| 中文字幕视频在线免费观看| 亚洲欧美日韩在线不卡| 天堂av中文字幕| 国产日本欧美在线观看| 亚洲国产二区| 美女网站视频色| 亚洲精品乱码久久久久久金桔影视| 日本欧美一区| 成人性生活视频免费看| 国产精品午夜久久| 天天干,夜夜操| 国产一区红桃视频| 国内成人在线| 久久精品三级视频| 亚洲电影在线观看| 久久精品国产福利| 欧美视频在线播放一区| 亚洲欧美日韩一区| 免费在线视频你懂得| 51国偷自产一区二区三区的来源| 日韩影院免费视频| www.av视频在线观看| 精品国产美女在线| 红桃视频在线观看一区二区|