精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

流量工程將代碼生成的準確率提高一倍:由19%提高至44%

譯文
人工智能
代碼生成是人工智能中一項越來越重要的能力。它指訓練機器學習模型,基于對所需程序功能的自然語言描述自動生成計算機代碼,并有許多潛在的應用,從將軟件規格轉換成實用代碼、自動化后端開發到協助人類程序員,不一而足。

一篇新論文的作者提出了一種“強化”代碼生成的方法。

代碼生成是人工智能中一項越來越重要的能力。它指訓練機器學習模型,基于對所需程序功能的自然語言描述自動生成計算機代碼,并有許多潛在的應用,從將軟件規格轉換成實用代碼、自動化后端開發到協助人類程序員,不一而足。

然而,與翻譯或總結等相關語言任務相比,生成高質量代碼對AI系統依然具有挑戰性。代碼必須精確匹配目標編程語言的語法,優雅地處理極端情況和意外輸入,并準確地處理問題描述中指定的許多小細節。就連在其他領域無害的小錯誤也可能完全破壞程序的功能,導致編譯或運行失敗。

最近,CodiumAI的研究人員提出了一種名為AlphaCodium的新方法,可大幅提高GPT-4等大語言模型的代碼生成能力。他們的主要觀點是,僅僅調整提示的措辭對于復雜的編碼問題具有固有的局限性。相反,他們設計了一個多階段流程,專注于對照測試用例迭代地生成、運行和調試代碼,從而使模型能夠從經驗中學習。

提示工程的局限性

在自然語言任務中,提示工程指仔細調整提示的措辭和結構,以指導模型生成所需的輸出。比如說,在輸入文本之前添加短語“寫簡明的摘要:”可以從模型中得到針對性更強的摘要。

提示工程已被證明在做文本生成引導大語言模型行為方面非常有效。然而針對編碼問題,研究人員發現,就連廣泛的及時調整也只能獲得極小的效益。原因發人深省。生成高質量的代碼需要:

  • 精確匹配目標編程語言的語法
  • 優雅地處理極端情況和意外輸入
  • 解決問題陳述中描述的所有小細節和需求
  • 為所有的有效輸入確保代碼正確編譯和運行

這些結構性需求遠遠超出了文本生成的范疇。將它們硬編碼到提示中對于復雜的問題是行不通的。單單提示本身缺乏模型學習這些的編碼技巧和細微差別所需要的具體反饋。

AlphaCodium迭代流程

為了應對這些挑戰,研究人員設計了一個針對代碼生成問題結構的迭代流程。關鍵的創新在于針對測試用例利用所生成代碼的執行,以提供直接的學習信號。

AlphaCodium的流程有兩個主要階段:

預處理

  • 模型將問題描述釋義為項目符號,以提取關鍵細節。
  • 解釋每個示例輸入/輸出背后的預期邏輯。
  • 提供兩三個自然語言解決方案。
  • 為代碼覆蓋生成額外的不同測試用例。

代碼迭代

  • 模型生成初始代碼解決方案。
  • 針對公共測試用例重復運行該代碼,修復出現的錯誤。
  • 對模型生成的測試用例執行同樣的事情。
  • 額外的測試用例被添加到不斷增大的“測試錨”(test anchor)套件中,以防止回歸。

通過增量推理問題、開發解決方案假設、擴展測試覆蓋,以及反復生成和調試代碼,模型通過經驗來學習——這正是高質量代碼生成所需的技能。

圖1. 具有結構化輸出的提示示例(生成可能的解決方案階段)

研究人員發現,與端到端模型相比,將流程設計為具有清晰接口和目標的模塊可以獲得更好的結果。每個階段首先專注于更簡單的子任務,以積累知識,并發掘為下游階段提供依據的洞察力。像測試生成這樣的上游階段不需要完整的解決方案,只需要基本的推理。

實驗結果

研究人員依據CodeContests衡量基準對AlphaCodium進行了評估,該衡量基準包含來自競爭性編程比賽的數百個編碼問題。

圖2. 問題描述和反思——一個典型的CodeContests問題的例子,基于人工智能對問題進行自我反思。雖然最初的描述冗長而復雜,但適當的自我反思可以使問題更清晰、更連貫,從而改進代碼解決方案

針對GPT-4模型,與經過大量優化的單個提示相比,AlphaCodium將驗證集上的代碼生成準確率從19%提高到了44%。面對不同的模型大小和測試集,這個好處依然適用,與單獨的提示工程相比收效顯著。

AlphaCodium的性能也顯著優于之前發布的方法,比如AlphaCode和CodeChain,同時使用更少的計算資源。比如說,它通過避免不必要的蠻力生成,其準確性可以媲美AlphaCode,而模型查詢少10000倍。

這些結果證明了圍繞任務結構整體設計AI系統的價值,而不是將其視為通用文本生成器。通過合并迭代代碼運行和調試,AlphaCodium更好地將訓練過程與生成健壯實用代碼的最終目標結合起來。

更廣泛的影響

雖然針對競爭性編程問題進行了演示,但AlphaCodium中使用的概念為AI推進代碼生成提供了更廣泛的適用經驗:

  • 單單提示工程對于處理復雜的代碼任務具有局限性。具體解決問題的經驗至關重要。
  • 基于測試的開發規范可以為模型訓練提供依據。測試提供了明確的適應度函數。
  • 迭代代碼調試將模型改進的重點放在實際發生的錯誤上。
  • 測試覆蓋擴展突出了提示中不可見的泛化性差距。
  • 具有雙重驗證的軟決策減少了脆弱性和偏差。

AlphaCodium為基于軟件工程最佳實踐的代碼生成提供了一種大有前途的新范式。關于泛化性和計算開銷仍然存在有待商榷的研究問題。但這里展示的原則(從經驗中學習、測試驅動開發、模塊化推理和迭代式調試)似乎為提高AI的編碼能力提供了堅實的基礎。

論文鏈接:https://arxiv.org/pdf/2401.08500.pdf

代碼庫:https://github.com/Codium-ai/AlphaCodium

原文標題:"Flow engineering" doubles code generation accuracy (19% vs 44%),作者:Mike Young

鏈接:https://notes.aimodels.fyi/flow-engineering-intensifies-for-code-generation/

責任編輯:姜華 來源: 51CTO
相關推薦

2009-09-16 10:05:06

GoogleChrome 3.0瀏覽器

2022-06-24 08:20:56

requests爬蟲Python

2017-09-28 09:40:36

圖像分類準確率

2012-07-04 09:30:49

程序員開發效率

2023-04-10 14:22:26

PCIe6.0PCIe

2012-07-04 08:48:59

程序員

2023-06-27 09:48:40

谷歌AML AI 工具

2022-11-21 10:18:24

AI谷歌

2023-06-28 13:49:12

AI人工智能

2020-05-12 10:43:30

谷歌算法人工智能

2011-02-22 09:29:33

無線網絡無線網速

2020-10-12 11:01:53

AWSSageMaker德比軟件

2020-09-14 14:10:04

開發技能代碼

2016-01-27 13:37:53

機器學習數據模型算法

2019-04-02 11:36:11

AI

2024-04-02 10:13:25

在線小工具開發

2020-12-24 19:29:08

PCIntel芯片

2019-05-10 14:28:27

MySQL技巧數據庫

2020-04-22 09:04:27

Linux命令行搜索工具

2009-06-15 08:47:33

微軟Windows 7操作系統
點贊
收藏

51CTO技術棧公眾號

99精品中文字幕| 92看片淫黄大片一级| 国内精品国产成人国产三级| 国产一区日韩一区| 亚洲男人7777| 亚洲免费成人在线视频| av中文字幕在线观看第一页| 国产欧美一区二区三区沐欲| 91手机在线观看| 中文字幕第四页| 一区二区三区在线电影| 日韩精品欧美国产精品忘忧草 | aa日韩免费精品视频一| 日韩乱码一区二区| 99久久精品网站| 亚洲精品国产精品乱码不99按摩 | 成人永久免费视频| 国产精品九九久久久久久久| 精品午夜福利视频| 久久综合88| 日韩麻豆第一页| 性折磨bdsm欧美激情另类| 国产综合色区在线观看| 亚洲v中文字幕| 超碰97免费观看| 国产日韩精品在线看| 91小视频在线免费看| 91免费版网站入口| 伊人精品一区二区三区| 免费日韩av| 91国产中文字幕| 免费中文字幕视频| 综合久久99| 久久视频在线视频| 国产精品一区二区亚洲| av亚洲免费| 亚洲视频欧美视频| 久久久久久亚洲中文字幕无码| 盗摄牛牛av影视一区二区| 日韩午夜中文字幕| 亚洲精品国产久| 四虎影视精品永久在线观看| 在线精品观看国产| 欧洲熟妇精品视频| 亚洲成av在线| 欧日韩精品视频| 亚洲xxxx2d动漫1| 成人日韩精品| 欧美在线三级电影| 欧美性猛交xxx乱久交| 深夜视频一区二区| 在线免费亚洲电影| 黄色手机在线视频| 欧洲亚洲精品| 欧美一区二区三区在线看 | 国产91精品久久久久久久网曝门| 92看片淫黄大片欧美看国产片| 一本色道久久综合精品婷婷| 蜜臀av性久久久久蜜臀aⅴ| 国产精品第一视频| 国产成人精品一区二区色戒| 琪琪一区二区三区| 国产日韩一区在线| 国产探花精品一区二区| 高清不卡一二三区| 久久99精品久久久久久久久久| 天天操天天干天天操| 2024国产精品| 日韩精品一线二线三线| 免费网站免费进入在线| 亚洲激情成人在线| 无码播放一区二区三区| 性欧美超级视频| 欧美日韩一级大片网址| 一级淫片在线观看| 亚洲精品在线a| 日韩激情视频在线播放| 波多野结衣家庭教师在线观看| 国产精品久久久久久久久久10秀| 欧美高跟鞋交xxxxxhd| av大全在线观看| 青青草一区二区三区| 91性高湖久久久久久久久_久久99| 精品人妻一区二区三区四区不卡| www.欧美日韩国产在线| 日日噜噜噜噜夜夜爽亚洲精品| 黄色免费网站在线观看| 午夜不卡在线视频| 五月天亚洲视频| 中文字幕亚洲在线观看 | 老司机福利在线视频| 亚洲国产一区二区在线播放| 哪个网站能看毛片| 亚洲精品无播放器在线播放| 亚洲韩国日本中文字幕| 欧美日韩生活片| 亚洲毛片在线| 成人观看高清在线观看免费| 三级在线观看网站| 国产精品国产三级国产三级人妇| 日韩美女爱爱视频| 日本国产欧美| 日韩精品在线免费观看| 黄色一级片中国| 玖玖精品视频| 国产精品美女xx| 日韩伦理在线观看| 精品久久久久人成| 在线免费观看av网| 欧美色图在线播放| 97在线观看视频| 国产av无码专区亚洲a∨毛片| 久久免费看少妇高潮| 国产91在线亚洲| 日日狠狠久久| 国产亚洲精品美女久久久| 久久久久久久99| 国产成人在线免费观看| 亚洲激情一区二区| 亚洲成人激情社区| 亚洲精品第一国产综合精品| 久草视频手机在线观看| 韩日av一区二区| 亚洲一区二区四区| 免费欧美电影| 亚洲欧美中文日韩v在线观看| www.youjizz.com亚洲| 韩国av一区二区三区四区| 亚洲欧美精品| 在线成人视屏| 亚洲人成电影网站色xx| 麻豆久久久久久久久久| 成人午夜看片网址| 久久人人爽人人爽人人av| crdy在线观看欧美| 精品国模在线视频| 91欧美日韩麻豆精品| 日本一区二区成人在线| 免费国产成人av| 欧美男gay| 国产精品久久二区| porn亚洲| 欧美猛男男办公室激情| 天天色天天综合| 麻豆91精品91久久久的内涵| 色吧亚洲视频| 黄色精品视频网站| 色偷偷av亚洲男人的天堂| 制服丝袜在线一区| 国产精品欧美极品| av在线网址导航| 中文字幕一区二区精品区| 91性高湖久久久久久久久_久久99| 黄色网页在线免费看| 欧美一区二区久久| 久久精品这里只有精品| 不卡高清视频专区| 99色精品视频| 成人直播大秀| 成人午夜激情免费视频| 综合久久2019| 亚洲国产一区二区三区在线观看| 九九精品免费视频| 国产精品美女久久久久久久久| 亚洲无在线观看| 黄色日韩在线| 你懂的网址一区二区三区| av有声小说一区二区三区| 久久精品99久久香蕉国产色戒| 国产视频在线一区| 欧美日韩国产精品一区二区不卡中文| 91黄色免费视频| 日本大胆欧美人术艺术动态| 在线国产精品网| 一区二区三区四区精品视频| 97av在线影院| 日本综合在线| 精品久久久久99| 日本中文字幕第一页| 中文字幕在线视频一区| 年下总裁被打光屁股sp | 日韩免费av| 成人毛片网站| 四虎4545www精品视频| 久久电影一区二区| 日本在线视频1区| 4438亚洲最大| 国内免费精品视频| 成人免费一区二区三区在线观看| 国产婷婷在线观看| 蜜臀av在线播放一区二区三区| 伊人久久在线观看| 欧美日韩爱爱| 国产 高清 精品 在线 a| 欧美free嫩15| 久久久亚洲网站| 自拍视频在线播放| 亚洲国产第一页| 国产又粗又长又黄| 一道本成人在线| 久久久国产成人| 国产精品丝袜91| 最近中文字幕无免费| 精品一区二区三区久久| 丁香啪啪综合成人亚洲| 欧美日本一区| 一区二区三区四区欧美| 亚洲另类春色校园小说| 99在线影院| 福利一区二区| 日本免费一区二区三区视频观看| 天堂8中文在线| 色香阁99久久精品久久久| 日本成人一区二区三区| 精品免费视频一区二区| 国产乱码精品一区二三区蜜臂| 91久久精品一区二区三区| 精品成人av一区二区在线播放| 亚洲色图丝袜美腿| 欧美日韩生活片| 国产女主播一区| aa一级黄色片| av亚洲精华国产精华精华| 人妻av一区二区三区| 国产一区 二区 三区一级| 少妇网站在线观看| 奇米精品一区二区三区四区| 日本精品一区二区三区四区| 亚洲欧洲另类| 欧美 日韩 亚洲 一区| 亚洲国产精品一区| 成人小视频在线观看免费| 欧美韩国一区| 国产女主播av| 欧美日韩网址| 精品嫩模一区二区三区| 欧美一区二区三区免费看| 人人妻人人澡人人爽精品欧美一区| 欧美色婷婷久久99精品红桃| 日本视频一区二区不卡| 欧美日韩国产免费观看视频| 欧美一区免费视频| 国产一区网站| 色噜噜色狠狠狠狠狠综合色一| 精品久久成人| 影音先锋欧美资源| 婷婷综合网站| 超薄肉色丝袜足j调教99| 欧美激情日韩| 天堂…中文在线最新版在线| 国产亚洲毛片在线| 免费观看成人网| 青青草视频一区| 亚洲图片 自拍偷拍| 国产成人综合精品三级| 亚洲色偷偷色噜噜狠狠99网| www.亚洲国产| 色屁屁草草影院ccyy.com| 国产精品视频一二三| 侵犯稚嫩小箩莉h文系列小说| 亚洲欧美日韩国产手机在线| 久草资源在线视频| 欧美午夜丰满在线18影院| 天堂网一区二区| 7777精品伊人久久久大香线蕉的 | 国产精品网曝门| 人妻人人澡人人添人人爽| 亚洲最新视频在线观看| 日韩aaaaaa| 欧美丝袜第三区| 国产高清免费av| 精品亚洲aⅴ在线观看| 在线观看精品一区二区三区| 欧美巨大黑人极品精男| 小早川怜子影音先锋在线观看| 国产精品99一区| 亚洲综合网站| 欧美午夜精品久久久久久蜜| 欧美wwwww| 男人的天堂狠狠干| 免费观看在线综合色| 色婷婷狠狠18禁久久| 成人午夜激情影院| 三上悠亚影音先锋| 亚洲美女淫视频| av毛片在线免费观看| 91精品国产欧美一区二区| 天堂中文在线看| 日韩中文字幕av| 国产美女情趣调教h一区二区| 5566成人精品视频免费| 爱情电影网av一区二区| 久久久久网址| 中文字幕午夜精品一区二区三区| 妺妺窝人体色www在线小说| 蓝色福利精品导航| 亚洲精品乱码久久久久久久| 中文字幕色av一区二区三区| 久久午夜免费视频| 欧美一区二区三区视频在线| 国产大片在线免费观看| 欧美国产第一页| 欧美97人人模人人爽人人喊视频| 久久超碰亚洲| 亚洲欧美文学| 九一精品久久久| 国产亚洲精品免费| 日韩成人免费在线视频| 日韩欧美综合一区| 888av在线| 欧美孕妇与黑人孕交| 在线一区二区三区视频| 中文字幕中文字幕99| 日本在线不卡视频| 香蕉网在线播放| 亚洲国产成人高清精品| 国产喷水福利在线视频| 国产亚洲人成网站在线观看| 在线看片福利| 另类视频在线观看+1080p| 亚洲手机视频| 极品白嫩少妇无套内谢| 亚洲精品国久久99热| 国产乱子伦精品无码码专区| 在线性视频日韩欧美| 激情开心成人网| 日本高清不卡一区二区三| 欧美亚洲免费| 全黄一级裸体片| 丁香五六月婷婷久久激情| 三级网站在线看| 97超级碰碰人国产在线观看| 美女视频亚洲色图| 日韩网站在线免费观看| 污污视频网站在线免费观看| 午夜伦欧美伦电影理论片| 亚洲精品久久久狠狠狠爱| 欧美精品在线极品| 日本亚洲视频| 日本香蕉视频在线观看| 国产成人99久久亚洲综合精品| 印度午夜性春猛xxx交| 欧美一区二区精品| 99热国产在线中文| 亚洲自拍偷拍福利| 欧美福利电影在线观看| 少妇极品熟妇人妻无码| 成人51免费| 亚洲欧美日韩另类精品一区二区三区 | www国产无套内射com| 国产精品一级片| 精品无码m3u8在线观看| 亚洲国产精品久久久久秋霞不卡| 国产福利电影在线播放| 久久精品成人一区二区三区蜜臀| 亚洲少妇诱惑| 欧美18—19性高清hd4k| 欧美日韩aaa| 91麻豆免费在线视频| 国产精品免费看一区二区三区| 亚洲区欧美区| 亚洲精品视频久久久| 欧美视频一区二区| 福利视频在线| 国产精品一区二区三区免费观看| 在线一区视频| 中文字幕欧美激情极品| 欧美一区二区三区白人| a国产在线视频| 欧美视频1区| 久草精品在线观看| 国产精品6666| 在线电影av不卡网址| 韩国一区二区三区视频| 精品久久久久久久久久中文字幕| 久久精品夜夜夜夜久久| 国产黄色片av| 日韩av免费在线| 91成人精品| 中出视频在线观看| 6080亚洲精品一区二区| 看黄在线观看| 午夜在线视频免费观看| 972aa.com艺术欧美| 91精东传媒理伦片在线观看| 国模视频一区二区三区| 成人在线丰满少妇av| 国产+高潮+白浆+无码| 欧美色国产精品| 2001个疯子在线观看| 亚洲欧美久久久久一区二区三区| 国产ts人妖一区二区| 国产美女www| 久久久女女女女999久久| 大片网站久久| 无码国产精品一区二区免费式直播| 在线观看一区日韩| 99色在线观看| 成年人三级视频| 国产日韩欧美麻豆|