精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!

發布于 2024-5-28 10:36
瀏覽
0收藏

比GPT4還要厲害的開源模型

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

今天這篇論文介紹了一個最新的大語言模型 AutoCoder,一個只有33B的大語言模型。AutoCoder-33B在HumanEval基準測試中Pass@1的達到90.9%,領先于當前所有頂級的代碼生成大型語言模型。在HumanEval+上,它的Pass@1為78%,僅次于GPT-4 Turbo和CodeQwen1.5-Chat。

模型下載地址:https://huggingface.co/Bin12345/AutoCoder

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

其中,盡管AutoCoder-S只有6.7B參數,它在HumanEval和HumanEval+上的Pass@1比率依然達到了78.7%和72%。在MBPP和MBPP+基準測試中,它的性能分別為79.4%和69.8%,在MBPP+的測試中,其表現在70B參數級別內僅次于DeepSeek-Coder-instruct (33B)。

為了測試AutoCoder在多種程序語言上的表現,作者采用MultiPL-E基準測試AutoCoder。實驗結果顯示,AutoCoder在Java、C++和Rust語言上的Pass@1成績分別為61.4%、68.9%和60.8%,表現卓越。在其他三種語言上,它的表現也僅次于CodeQwen1.5-Chat等少數模型,彰顯了AutoCoder在多語言代碼生成上的強勁實力。

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

為什么AutoCoder這么強?

AutoCoder之所以能強國GPT-4o的原因,是因為作者采用了 AIEV-INSTRUCT方法來構建高質量的代碼指令集數據。

AIEV-INSTRUCT通過智能體(Agent)交互模擬程序員編碼和執行單元測試的過程,并通過執行驗證確保數據的準確性。AIEV-INSTRUCT包含教學階段和自學階段,減少了在數據注釋過程中對成本高昂的閉源模型的依賴。

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

上圖展示了AIEV-INSTRUCT的整體架構,分為兩個階段:教學階段和自我學習階段。

  • ? 在教學階段,模型主要通過吸收教師模型的知識來學習;
  • ? 而在自我學習階段,它則獨立進行學習。

在教學階段,作者收集了開源代碼片段,并引入GPT-4 Turbo作為教師模型,以補充和修正這些代碼。整個流程包含四個關鍵步驟:

  • ? 在初始化階段(I),配置了必要的組件,GPT-4 Turbo扮演著提問者和程序員的雙重角色,確保生成的數據多樣化,從而形成一個更加均衡的概率分布,避免對話模板的單一化。對話消息以空列表的形式初始化,用于在整個過程中存儲數據。最終,這個列表將包含多輪對話,并將整個對話作為單一數據項加入到我們的最終數據集中。此外,還需要設置一個Docker容器,作為我們的代碼解釋器,負責安裝必要的外部包并執行需要驗證的代碼。
  • ? 在提出問題階段(II),首先利用GPT-4 Turbo執行OSS-Instruct ,構建問題描述和具體解決方案,包括基于開源代碼片段的代碼片段。不同的是,要求GPT-4 Turbo提供一些單元測試,以進一步確保數據集中代碼的準確性。前一步驟中初始化的對話消息將依次添加問題描述(?)、解決方案和單元測試(?)。
  • ? 在執行反饋階段(III),通過多輪執行反饋來檢驗生成的代碼,提升數據集的質量。首先,將第二步生成的代碼片段輸入代碼解釋器。如果執行出錯,對話消息將添加詳細的錯誤輸出(Stderr)(?)。同時,這些錯誤信息將提供給提問者,他將基于錯誤輸出生成自然語言描述,該描述也將添加到對話消息中(?)。然后,自然語言描述和錯誤輸出作為新問題提交給程序員,程序員將繼續修改代碼。對話消息將添加新生成的代碼(?),并重復這一過程。
  • ? 在終止階段(IV),同樣使用代碼解釋器運行程序員生成的代碼。如果程序運行成功,輸出結果(Stdout)將添加到對話消息中(?),完成單個數據項的分析。每分析2000個數據項后,將新數據按1:9的比例劃分為測試集和訓練集。訓練集用于訓練學生模型(AutoCoder)。訓練完成后,使用測試集來評估教師模型和學生模型。評估完成后,將比較兩個模型的首次通過率(Pass@1)。如果教師模型表現更佳,我將繼續教學階段;如果學生模型表現更佳,將轉向自我學習階段。自我學習階段與教學階段的主要區別在于,自我學習階段中,用學生模型取代了原始的教師模型,學生模型自己擔任提問者和程序員的角色,獨立完成整個執行反饋過程。

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區圖片

作者將AutoCoder-AIEV-Instruct數據集與幾個現有的大型代碼指令數據集進行了對比,對比結果如上圖。AutoCoder-AIEV-Instruct數據集包含169K個數據樣本,累計達到241K輪對話。其中,150K輪對話數據來源于多輪對話樣本。該數據集不僅包含主要功能,還涵蓋了后續的包安裝、代碼執行錯誤或結果,以及多樣化的錯誤分析。與Magicoder-Evol-Instruct和Magicoder-OSSInstruct原始數據集相比,新增的單元測試進一步提高了代碼相關任務的準確性。此外,與Code-Feedback 相比,AutoCoder-AIEV-Instruct包含了更豐富的執行反饋結果,減少了代碼塊拼接所需的多輪對話,從而增強了上下文的連貫性。

訓練過程

AutoCoder模型的基礎模型是Deepseek-Coder的兩個基礎版本,即6.7B和33B,作者在這兩個模型的基礎上進行了細致的微調,借助AutoCoder-AIEV-Instruct數據集,成功打造出了AutoCoder 33B和AutoCoder-S 6.7B。

為了賦予AutoCoder代碼解釋器的能力,利用transformer庫中的AutoTokenizer工具包,為模型引入了四個特殊標記。硬件配置上,使用了10個節點,配備了總計40塊80GB的A100 GPU,這些GPU部署在一個基于SLURM的集群中。GPU間的通信由NVIDIA的集體通信庫(NCCL)負責。在訓練參數的設置上,使用了deepspeed庫中的ZeRO-Stage 3特性,以實現模型參數的分割,每個GPU的批次大小設為8,梯度累積步數為4,學習率設為5e-5,參數類型選用了bf16。序列的最大長度被設定為5120,而訓練的總周期則為2。整個訓練過程中,采取了全面的參數調優策。

demo演示方法

git clone https://github.com/bin123apple/AutoCoder

conda create -n AutoCoder pythnotallow=3.11
conda activate AutoCoder
pip install -r requirements.txt


cd /Web_demo
pip install -r requirements.txt

python chatbot.py

AutoCoder:性能超越GPT-4o的模型,居然只有33B,還是開源!-AI.x社區

本文轉載自??大語言模型論文跟蹤??,作者: HuggingAGI ????

收藏
回復
舉報
回復
相關推薦
日本精品不卡| 国产18精品乱码免费看| 欧美精品第一区| 色www精品视频在线观看| 欧美中文娱乐网| 国产精品熟女视频| 精品视频黄色| 欧美色图第一页| 亚洲自拍偷拍一区二区三区| 成人免费一级视频| 欧美亚洲在线| 日韩一区av在线| 在线观看你懂的视频| 99久久精品免费看国产小宝寻花| 丁香亚洲综合激情啪啪综合| 2020国产精品视频| 四虎影视一区二区| 草草视频在线一区二区| 日韩欧美国产成人| 在线观看国产一区| 欧美性受xxxx狂喷水| 日韩精品乱码av一区二区| 久久成人亚洲精品| 国产特黄级aaaaa片免| 外国成人毛片| 性感美女极品91精品| 色一情一乱一伦一区二区三欧美| a级片在线视频| 久久av一区二区三区| 久久精品国产免费观看| 亚洲第一黄色网址| 日本亚州欧洲精品不卡| 色天天综合久久久久综合片| 欧美 日韩 国产 在线观看| 无码精品在线观看| 国产精品自拍av| 日本人成精品视频在线| 希岛爱理中文字幕| 国产精品自拍区| 日韩免费高清视频| 在线观看免费黄网站| hd国产人妖ts另类视频| 中文字幕日韩欧美一区二区三区| 久久精品美女| 99国产精品欲| 免费成人美女在线观看.| 国内精品久久久久影院 日本资源 国内精品久久久久伊人av | 99久久人爽人人添人人澡 | 亚洲国产成人精品女人久久| 亚洲激情中文| 在线播放精品一区二区三区| 少妇一级淫片免费放播放| av成人在线网站| 在线观看亚洲a| 欧美三级一级片| 青春草免费在线视频| 国产精品麻豆网站| 天堂精品视频| 韩国福利在线| 成人av在线一区二区三区| 亚洲自拍av在线| 中文字幕第31页| 久久激情网站| 欧美在线一区二区视频| 国产精品第九页| 欧美三区不卡| 久久91亚洲精品中文字幕| 神马久久精品综合| 欧美韩日高清| 久久精品福利视频| 欧美日韩色视频| 久久久久国产| 欧美另类老女人| 中文字幕av久久爽av| 欧美韩日精品| 欧美激情第99页| 久久久精品国产sm调教网站| 欧美先锋影音| 久久免费视频在线| 国产福利拍拍拍| 亚洲一区欧美二区| 国产精品91久久久久久| 中文字幕一区二区在线视频| 热久久一区二区| 国产精品自拍小视频| 亚洲影院一区二区三区| 国模无码大尺度一区二区三区| 成人精品久久久| 国产高清视频免费观看| 国产99久久久国产精品潘金| 国产91精品入口17c| 日韩一级片免费观看| 91色九色蝌蚪| 日日骚一区二区网站| 91露出在线| 自拍偷拍亚洲欧美日韩| 777久久精品一区二区三区无码 | 搞黄网站在线看| 午夜视频在线观看一区二区| 丰满爆乳一区二区三区| 国产综合色区在线观看| 91精品国产91综合久久蜜臀| 中文在线观看免费视频| 国产亚洲一区二区三区不卡| 久久久av网站| 久久久国产精品成人免费| 日本vs亚洲vs韩国一区三区二区| 成人精品aaaa网站| 亚洲 美腿 欧美 偷拍| 亚洲国产精品国自产拍av| 超碰超碰超碰超碰超碰| 成人美女黄网站| 欧美日韩精品免费观看视频| 中文在线字幕观看| 九色精品国产蝌蚪| 欧美精品午夜视频| www.欧美色| 国产精品白丝jk黑袜喷水| 美女三级99| 182tv在线播放| 日本精品一区二区三区高清| 三级网站免费看| 教室别恋欧美无删减版| 欧美日韩xxx| 免费一级a毛片| 丁香激情综合国产| 尤物国产精品| 亚洲天堂一区二区| 精品国产乱码久久久久久牛牛 | 中文字幕精品一区| 你真棒插曲来救救我在线观看| 韩国成人在线| 亚洲国产福利在线| 免费中文字幕在线| 欧美a一区二区| 精品一卡二卡三卡四卡日本乱码| 日本不卡三区| 91黄色在线观看| 欧美一区二区免费在线观看| 久久久五月天| 国产精品免费久久久久久| 人妻视频一区二区三区| 亚洲欧美日韩成人高清在线一区| 日韩欧美xxxx| 日本国产精品| 欧美激情综合色综合啪啪五月| 在线观看免费高清视频| 久久精品网站免费观看| 天天夜碰日日摸日日澡性色av| 国产成年精品| 日韩在线精品视频| 国产91av在线播放| 久久久一区二区三区捆绑**| 精品少妇在线视频| baoyu135国产精品免费| 久久国产精品99国产精| 一区二区三区日| 国产日产欧产精品推荐色| 91猫先生在线| 欧美在线关看| 欧美激情综合色综合啪啪五月| 精品久久国产视频| 亚洲人成网站精品片在线观看| 免费涩涩18网站入口| 欧美丝袜一区| 国产精品福利观看| 国产视频三级在线观看播放| 裸体在线国模精品偷拍| 国产美女精品在线观看| 国产99re66在线视频| 亚洲电影免费观看高清完整版在线| 深夜福利影院在线观看| 国产成人在线电影| 大伊香蕉精品视频在线| japanese色系久久精品| 久久久久免费视频| 精品久久久无码中文字幕| 一区二区三区在线不卡| 在线精品视频播放| 国产日韩一区二区三区在线| 快播亚洲色图| 国产在线|日韩| www.xxxx精品| 国产黄色一区二区| 亚洲a一区二区| 国产福利在线观看视频| 久久亚洲影院| 亚洲一区三区电影在线观看| 久久爱www.| 国内揄拍国内精品少妇国语| 香蕉视频国产在线| 欧美在线观看禁18| 欧洲美女女同性互添| 丁香婷婷综合五月| 久久久久久香蕉| 99精品全国免费观看视频软件| 91麻豆蜜桃| 精精国产xxxx视频在线野外| 亚洲性生活视频在线观看| 一本色道久久综合亚洲| 亚洲在线中文字幕| 在线观看日本中文字幕| 国内精品国产三级国产a久久| 免费网站永久免费观看| 久久99国内| 亚洲sss综合天堂久久| 国产精品一二三产区| 一区二区欧美亚洲| 亚洲成a人片77777精品| 色94色欧美sute亚洲线路二| avtt天堂在线| 久久久噜噜噜久久中文字幕色伊伊 | 一区二区三区国产视频| 国产日韩精品suv| 精品日本美女福利在线观看| 少妇的滋味中文字幕bd| 东方欧美亚洲色图在线| 亚洲xxx在线观看| 在线欧美三区| 一本久道久久综合| 国产精品主播在线观看| 国产精品吴梦梦| av女在线播放| 美日韩丰满少妇在线观看| 日产精品久久久久久久性色| 91精品国产综合久久久蜜臀图片| 亚州国产精品视频| 亚洲免费三区一区二区| 亚洲精品国产熟女久久久| 国产91高潮流白浆在线麻豆| 三级a三级三级三级a十八发禁止| 亚洲激情午夜| 天堂а√在线中文在线| 97视频精品| 欧美一进一出视频| 日韩母乳在线| 国产精品青青草| 精品91福利视频| 国产精品自产拍在线观| 高清成人在线| 全亚洲最色的网站在线观看| 欧美人动性xxxxz0oz| 俺去亚洲欧洲欧美日韩| 成人免费高清在线播放| 亚洲精品福利视频| 成人午夜视频一区二区播放| 欧美一区二区精品在线| 国产精品一区二区av白丝下载| 欧美专区在线观看一区| 少妇高潮av久久久久久| 欧美日韩国产中文精品字幕自在自线| 国产盗摄x88av| 亚洲欧洲日韩av| 日韩一区二区三区四区视频| 国产欧美一区二区精品性色 | 亚洲另类欧美日韩| 亚洲资源在线观看| 国产亚洲成人av| 一区二区成人在线观看| www青青草原| 亚洲精品老司机| 男人与禽猛交狂配| 亚洲蜜臀av乱码久久精品蜜桃| 国产美女高潮视频| 国产精品福利av| av在线免费播放网址| 中文字幕在线免费不卡| 国产麻豆a毛片| 国产精品伦一区| 免费成人深夜夜行网站| 亚洲精品视频在线看| 男的操女的网站| 亚洲综合丁香婷婷六月香| 国产性一乱一性一伧一色| 午夜影院久久久| 国产又黄又粗又爽| 在线欧美日韩精品| 国产一区二区在线播放视频| 在线综合+亚洲+欧美中文字幕| 国产情侣av在线| 欧美成人精品高清在线播放| 免费av网站观看| 日韩高清av在线| 国产高清在线观看| 久久夜色精品国产亚洲aⅴ| 三级福利片在线观看| 性日韩欧美在线视频| xx欧美xxx| 国产日韩在线亚洲字幕中文| 日韩精品中文字幕一区二区| 国产亚洲欧美一区二区三区| 伊甸园亚洲一区| 尤物一区二区三区| 亚洲国产黄色| 免费看a级黄色片| 九九国产精品视频| 丰满岳乱妇一区二区| 国产色婷婷亚洲99精品小说| 色欲一区二区三区精品a片| 亚洲一区二区免费视频| 日本中文字幕第一页| 欧美精品黑人性xxxx| 无码h黄肉3d动漫在线观看| 永久免费毛片在线播放不卡| 国产成人在线视频免费观看| 17婷婷久久www| 欧美性生活一级| 国产精品乱码| 精品日韩毛片| 欧美这里只有精品| 日韩精品一区第一页| 午夜免费一级片| 97久久精品人人澡人人爽| 2014亚洲天堂| 欧美日韩一区免费| 国产口爆吞精一区二区| 精品视频在线导航| 在线视频国产区| 国产精品678| 久草在线综合| 天天干天天色天天爽| 日精品一区二区| 美女搡bbb又爽又猛又黄www| 国产精品久久久久久户外露出 | 中文字幕在线一区免费| 97久久久久久久| 日韩欧美成人一区二区| 成a人v在线播放| 91福利视频网| 伊色综合久久之综合久久| 亚洲午夜精品久久久中文影院av| 国产情侣一区| 日批视频免费看| 亚洲素人一区二区| 亚洲精品国产欧美在线观看| 日韩国产高清污视频在线观看| 国产91在线视频蝌蚪| 国产精品久久久久免费a∨| 欧美激情影院| 污污污污污污www网站免费| 精品亚洲porn| 国产又粗又硬视频| 色一情一伦一子一伦一区| 少妇精品高潮欲妇又嫩中文字幕| 欧美另类交人妖| 国语精品视频| 欧美日韩视频免费在线观看| 日本午夜一区二区| 精品人妻无码一区二区三区 | 国产91av视频在线观看| 日日摸夜夜添夜夜添精品视频 | 中文字幕av导航| 男人操女人的视频在线观看欧美| 法国伦理少妇愉情| 日韩欧美在线视频日韩欧美在线视频| 欧美视频xxx| 午夜精品一区二区三区在线播放| 91成人精品在线| 免费看日b视频| 国产99一区视频免费| 久久婷婷综合国产| 精品国产乱码久久久久久夜甘婷婷| 视频在线这里都是精品| 97夜夜澡人人双人人人喊| 亚洲综合自拍| 国产在线a视频| 亚洲一区二区三区四区不卡| 亚洲第一视频在线| 欧美精品久久久久久久久| 国产成人aa在线观看网站站| 日本中文字幕亚洲| www.av精品| 国产精品视频一区在线观看| 亚洲人成五月天| 日本另类视频| 中文字幕成人一区| 国产精品亚洲一区二区三区妖精 | 91精品国产99| 西野翔中文久久精品国产| 999香蕉视频| 中文字幕精品在线不卡| 国产精品一级视频| 久久久久亚洲精品| 国产区精品区| 自拍偷拍一区二区三区四区| 日韩码欧中文字| 国产黄色片av| 91精品国产高清自在线看超| 国产欧美高清视频在线| 在线观看免费污视频| 亚洲激情图片小说视频| 日韩精品123| 国产原创欧美精品| 亚洲第一区色| 91视频免费看片| 日韩精品在线看片z| 亚洲三级欧美| 亚洲一区二三| zzijzzij亚洲日本少妇熟睡| 伊人久久久久久久久久久久|