精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChatGPT代碼生成飆升10%!北大華人一作:細(xì)化prompt,大幅改進(jìn)大模型代碼能力

人工智能 新聞
來自北大實(shí)驗(yàn)室的研究團(tuán)隊(duì)提出了,通過與LLM聊天來細(xì)化需求的方法——ChatCoder。

在大模型時(shí)代,高質(zhì)量的代碼生成已經(jīng)強(qiáng)大到,讓人驚嘆。

從通過HumEval中67%測(cè)試的GPT-4,到近來各種開源大模型,比如CodeLlama,有望成為碼農(nóng)編碼利器。

然而,現(xiàn)實(shí)中,程序員們不會(huì)精煉表達(dá)需求,因此誤導(dǎo)、限制了LLM生成優(yōu)秀代碼的能力。

說白了,大模型代碼能力行不行,取決于你的提示妙不妙。

對(duì)此,來自北大實(shí)驗(yàn)室的研究團(tuán)隊(duì)提出了,通過與LLM聊天來細(xì)化需求的方法——ChatCoder。

論文地址:https://arxiv.org/pdf/2311.00272.pdf

具體來說,他們?cè)O(shè)計(jì)了一種聊天方案,大模型引導(dǎo)用戶細(xì)化需求表達(dá),進(jìn)而比以前更精確、更完整,同時(shí)提高了大模型的性能。

大模型是「碼農(nóng)」,你就是「產(chǎn)品經(jīng)理」

這里先舉個(gè)例子,如下圖,用戶提出了需求:

數(shù)據(jù)集#MBPP/443,要求ChatGPT編寫一個(gè)python函數(shù)從給定的列表中找到「最大的負(fù)數(shù)」。

基于原始需求,ChatGPT生成一個(gè)程序,該程序可以正確提取實(shí)際值最大的負(fù)數(shù)。

然而,sanitized-MBPP的作者認(rèn)為「最大負(fù)數(shù)」應(yīng)該是指「絕對(duì)值最大的數(shù)」。

因此由于「最大」這個(gè)表達(dá)不明確,導(dǎo)致LLM生成了錯(cuò)誤的代碼。

而這里,可以通過需求細(xì)化(requirements refinement)來解決這個(gè)問題。

需求細(xì)化就是揭示需求中的隱含依賴和隱藏結(jié)構(gòu)的過程。通過提供更多細(xì)節(jié),在需求細(xì)化的過程中可以補(bǔ)充不完整的信息,消除模糊不清的地方。

在前面舉的例子中,我們可以簡(jiǎn)單地向大語(yǔ)言模型說明「最大的」在這里特指「絕對(duì)值最大的」,揭示了「最大」這個(gè)詞的隱藏結(jié)構(gòu)。

有了這一改進(jìn)后的需求,大模型就可以生成符合MBPP作者期望的代碼。

不得不提的是,需求細(xì)化,需要人類用戶和大模型的協(xié)作。

一般來說,在需求工程的背景下,需求細(xì)化是通過軟件供應(yīng)商(編碼人員)和軟件客戶(用戶)之間的一系列交互來執(zhí)行的。

軟件供應(yīng)商分析客戶需求的初始表達(dá),并提出細(xì)化點(diǎn)。軟件客戶則需要根據(jù)這些點(diǎn)來作出響應(yīng),供應(yīng)商才能完成一輪需求細(xì)化。

無論是軟件客戶還是軟件供應(yīng)商,任何一方都不具備單獨(dú)進(jìn)行需求細(xì)化的資格。

這樣的劣勢(shì)在于,客戶通常不夠了解軟件設(shè)計(jì)和開發(fā)過程,無法撰寫可用的需求說明;而供應(yīng)商通常也不夠了解客戶的問題和業(yè)務(wù)領(lǐng)域,無法為滿意的系統(tǒng)制定需求。

而現(xiàn)在,在大模型時(shí)代,人類用戶是客戶,LLM是「供應(yīng)商」。

為了通過需求細(xì)化讓大模型生成更好地滿足用戶需求的代碼,就需要研發(fā)人類和LLM協(xié)作的方法。

ChatCoder:聊天細(xì)化,生成代碼

北大提出了ChatCoder,這是通過聊天進(jìn)行需求細(xì)化的大模型代碼生成的新方法。

整體框架如下圖,非常簡(jiǎn)潔,通過聊天來輔助LLM和人類在需求細(xì)化方面的協(xié)作。

關(guān)鍵是,如何與大型語(yǔ)言模型聊天。

ChatCoder便提供了一個(gè)全新的聊天模式,其設(shè)計(jì)靈感來自IEEE SRS。

接下來,我們具體看下ChatCoder這個(gè)框架。

其整體結(jié)構(gòu)是一個(gè)兩輪的對(duì)話。

第一階段:Paraphrase和Exend

由于人類用戶表達(dá)需求可能語(yǔ)意模糊、不完整,ChatCoder使用提示要求LLM從幾個(gè)角度解釋用戶的原始需求,即完整的需求規(guī)范必須清晰。

對(duì)于需要改進(jìn)的遺漏或有野心的論點(diǎn),ChatCoder讓大語(yǔ)言模型基于它從訓(xùn)練數(shù)據(jù)中獲得的假設(shè)來擴(kuò)展它們。

人類用戶需要查看細(xì)化的規(guī)范并糾正其中的錯(cuò)誤。

第二階段:Going-deep和Loop-back

在這一輪中,ChatCoder要求LLM詢問人類用戶,關(guān)于第一輪Paraphrase和Exend中信息損失,以及需要進(jìn)一步改進(jìn)的規(guī)范方面的困惑。

人類用戶需要回答這些問題,并回環(huán)糾正細(xì)化后的規(guī)范。

經(jīng)過兩輪細(xì)化后,得到細(xì)化后的需求,然后發(fā)送給大型語(yǔ)言模型,得到用戶想要的程序。

ChatGPT代碼能力10%

實(shí)驗(yàn)設(shè)置

數(shù)據(jù)集:Sanitized-MBPP、HumanEval。

基準(zhǔn):gpt-3.5-turbo、gpt-4。

研究問題

為了評(píng)估ChatCoder,研究人員提出并測(cè)試了以下研究問題:

1)與現(xiàn)有代碼生成模型相比,ChatCoder的表現(xiàn)如何?

2)ChatCoder是LLM和人類用戶交流以進(jìn)行需求細(xì)化的有效方法嗎?

3)人類參與ChatCoder帶來了多少改進(jìn)?

ChatCoder性能表現(xiàn)

首先我們來看第一個(gè)問題,主要是為了評(píng)估ChatCoder與基線相比的整體代碼生成性能。

如表1所示,ChatCoder通過大幅細(xì)化的需求,成功幫助LLM提高了其生成程序的執(zhí)行精度。

例如,對(duì)于gpt-3.5-turbo,其在Saniticed-MBPP上的pass@1從57.04%提高到71.25%,提升了14%。

橫向比較,對(duì)于gpt-3.5-turbo和gpt-4,Saniticed-MBPP上的性能改進(jìn)比HumEval上的更突出。

溝通效率的表現(xiàn)

第二個(gè)問題是,評(píng)估ChatCoder是否是大模型和人類進(jìn)行需求細(xì)化交流的有效方式。

根據(jù)表2,所有3種與LLM進(jìn)行需求細(xì)化的通信方法都有助于LLM改進(jìn)其代碼生成結(jié)果。

這一發(fā)現(xiàn)指出,任何形式的需求細(xì)化在應(yīng)用LLM生成代碼時(shí)都是有用和重要的。

與ChatCoder相比,F(xiàn)ree Paraphrase和Free QA不會(huì)指示LLM執(zhí)行某些類型的細(xì)化,從而導(dǎo)致較低的改進(jìn)。

人工干預(yù)評(píng)估

如下評(píng)估了人工干預(yù)對(duì)ChatCoder的重要性,結(jié)果見表3。

由于ChatCoder利用需求細(xì)化來提高大語(yǔ)言模型的代碼生成性能,因此人工干預(yù)是必要的,也是不可忽視的。

ChatCoder的過程是從給定的角度揭示需求的內(nèi)部結(jié)構(gòu),這些角度沒有明確表達(dá),即使有歧義。解決歧義的答案只有人類用戶知道。

案例研究

如下,作者提出了幾個(gè)真實(shí)的測(cè)試用例,說明ChatCoder如何幫助LLM生成具有細(xì)化需求的代碼。

由于頁(yè)面限制,研究人員從MBPP中選擇了3個(gè)案例,涵蓋了關(guān)于輸入、輸出和目的的細(xì)化,因?yàn)樗鼈冎苯佑绊懝δ苄枨蟆?/span>

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-10-26 15:38:03

混元大模型騰訊

2021-11-19 10:13:01

模型人工智能計(jì)算

2023-10-07 08:28:06

語(yǔ)言模型代碼技術(shù)

2023-10-16 12:31:17

人工智能數(shù)據(jù)

2023-06-09 13:29:58

2024-11-27 14:30:00

模型訓(xùn)練

2024-08-20 13:30:17

2023-09-10 10:51:22

算法結(jié)構(gòu)

2023-04-27 13:46:08

語(yǔ)言模型ChatGPT人工智能

2021-12-09 09:45:44

AI 數(shù)據(jù)神經(jīng)網(wǎng)絡(luò)

2023-04-11 07:56:54

2023-09-18 11:25:00

2024-09-29 13:40:00

2024-03-04 08:15:00

2024-01-08 13:37:00

人工智能技術(shù)

2025-02-12 13:34:40

2025-02-18 10:25:10

2023-06-16 09:49:11

人工智能研究
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

久久国产精品99国产| 色狠狠久久av五月综合|| 日本三日本三级少妇三级66| 中文字幕 日本| 香蕉视频在线播放| 美女主播精品视频一二三四| 中文字幕在线不卡| 欧美综合在线第二页| 韩国一区二区三区四区| 日本在线免费| 成人成人成人在线视频| 啊v视频在线一区二区三区| 毛片av免费在线观看| 欧美 日韩 国产 成人 在线| 欧美三级午夜理伦三级中文幕| 欧美日韩精品一区二区三区| 欧美精品一区二区三区在线四季 | aaa在线视频| 成人在线tv视频| 亚洲欧美激情在线| 91精品久久久久久久久久 | 国产精品乱战久久久| 亚洲青青青在线视频| 国产日韩欧美夫妻视频在线观看 | 国产精品免费视频xxxx| 极品人妻一区二区三区| 超碰在线99| 东方aⅴ免费观看久久av| 欧美精品免费在线| 999热精品视频| 国产在线激情| 国产一区二区三区免费播放| 久久精品国产一区二区三区| 久久6免费视频| 成人欧美在线| 粉嫩久久99精品久久久久久夜| 欧美成人免费全部| 日本美女bbw| 日本成人一区二区| 中文字幕亚洲一区二区av在线| 精品国产日本| 日韩人妻精品中文字幕| 精品国产一区探花在线观看| 在线免费一区三区| 在线观看欧美激情| 国产成人麻豆精品午夜在线 | 99久久99久久久精品齐齐| 国产最新精品视频| 黄色a一级视频| 日韩在线观看不卡| 中文字幕不卡的av| 91视频免费在线| 精品深夜av无码一区二区老年| 黄色美女久久久| 欧美成人官网二区| 欧美私人情侣网站| 中文在线免费二区三区| 国产精品入口麻豆原神| 成人美女免费网站视频| 九九久久免费视频| 综合国产视频| 91精品国产综合久久精品麻豆| 人妻激情另类乱人伦人妻| 亚洲av电影一区| 卡一卡二国产精品 | 免费在线观看a级片| 亚洲精品一二三**| 狠狠躁夜夜躁人人躁婷婷91| 亚洲毛片aa| 免费成人在线看| 高清av一区二区| 国产在线精品一区二区中文| 正在播放亚洲精品| 欧美三级小说| 亚州成人av在线| 久草视频国产在线| 中文字幕乱码无码人妻系列蜜桃| 777电影在线观看| 欧美亚洲一区| 精品久久久av| 日韩电影免费在线观看中文字幕| 中国 免费 av| 无码精品人妻一区二区| gogogo免费视频观看亚洲一| 国产精品青草久久久久福利99| 亚洲天堂视频在线播放| 99热这里只有成人精品国产| www.欧美三级电影.com| 午夜精品福利在线视频| 久久99国产精品视频| 精品国产欧美一区二区| 怡红院亚洲色图| 日产福利视频在线观看| 亚洲免费大片在线观看| 日本精品福利视频| 婷婷免费在线视频| 一区二区日韩电影| 在线一区亚洲| 日韩免费影院| 亚洲手机成人高清视频| 欧美亚洲色图视频| 亚洲伦乱视频| 色偷偷一区二区三区| 精品少妇人欧美激情在线观看| 超碰在线资源| 一区二区高清视频在线观看| 欧美一区二区三区爽大粗免费| 99在线播放| 亚洲视频一二三区| 久久网站免费视频| caoporn-草棚在线视频最| 一级日本不卡的影视| 日本黄网站免费| 91精品国产自产精品男人的天堂| 亚洲图片欧美午夜| 三级网站在线免费观看| 亚洲精品亚洲人成在线| 美女视频黄免费的亚洲男人天堂| 日韩 欧美 中文| 午夜在线精品| 91中文字精品一区二区| 精品人妻一区二区三区含羞草 | 久久久三级国产网站| 国产成人亚洲欧美| 亚洲黄色小说网址| 岛国一区二区三区| 亚洲aⅴ天堂av在线电影软件| 日本精品600av| 欧美日韩在线播| 嫩草视频免费在线观看| 国产中文欧美日韩在线| 欧美一区二区日韩| 一本色道久久综合亚洲精品图片 | 好吊妞无缓冲视频观看| 黄色污污视频在线观看| 欧美日韩夫妻久久| 中文字幕在线看高清电影| 亚洲精品裸体| 日韩美女激情视频| 国产精品第6页| 97精品电影院| 免费 成 人 黄 色| 荡女精品导航| 欧美日韩成人精品| 制服.丝袜.亚洲.中文.综合懂色| 国产一区二区免费在线| 伊人久久大香线蕉精品| 97精品国产综合久久久动漫日韩| 精品婷婷伊人一区三区三| 中文字幕av网址| 国产精品主播| 国产色视频一区| yw在线观看| 亚洲另类中文字| 手机版av在线| 外国成人免费视频| 97精品一区二区视频在线观看| 亚洲精品久久久蜜桃动漫| 1000部国产精品成人观看| 美脚丝袜脚交一区二区| 99精品在免费线中文字幕网站一区 | 欧美日韩理论| 国产高清在线一区二区| 99在线视频影院| 日韩经典一区二区三区| 6080午夜伦理| 国产日产欧美一区| 特大黑人娇小亚洲女mp4| 成人免费网站观看| 亚洲成人黄色在线观看| 日本猛少妇色xxxxx免费网站| 视频在线观看国产精品| 国产精品美女xx| 992tv免费直播在线观看| 欧美色图一区二区三区| 亚洲 欧美 变态 另类 综合| 国产成人精品网址| 日本一区视频在线| 99爱在线视频| 亚洲欧美成人一区二区在线电影| 日本aⅴ在线观看| 国产精品九九| 国产精品网红福利| 青青草视频在线免费观看| 一区二区三区四区中文字幕| 99视频在线视频| 亚洲aa在线| 国产精品露脸自拍| 成年人网站在线| 日韩经典中文字幕| 国产日韩在线观看一区| 国产日本亚洲高清| 日本丰满少妇xxxx| 日韩影片在线观看| 久久五月情影视| 夜夜嗨aⅴ一区二区三区| 国产午夜亚洲精品午夜鲁丝片| 国产高清视频网站| 精品黄色一级片| av噜噜色噜噜久久| 国产精品一区二区三区视频网站| 精品国产乱码91久久久久久网站| 亚洲天堂视频网站| 久久综合久久99| 337p粉嫩大胆噜噜噜鲁| 日韩欧美一区二区三区在线视频 | 黄色网zhan| 亚洲人成网亚洲欧洲无码| 91精品在线影院| 粉嫩一区二区| 日韩av在线天堂网| 97人人爽人人爽人人爽| 国产精品久久久久久户外露出| 亚洲美女精品视频| 好看不卡的中文字幕| 婷婷久久青草热一区二区| 亚洲男人在线| 欧美乱大交xxxxx另类电影| 嫩草在线播放| 欧美性感一区二区三区| 中文字幕在线观看二区| 老鸭窝一区二区久久精品| www.日本在线播放| 欧美va亚洲va日韩∨a综合色| 91精品中国老女人| 懂色aⅴ精品一区二区三区| 26uuu另类亚洲欧美日本老年| 全色精品综合影院| 日韩免费观看高清完整版| 久久香蕉精品视频| 中文字幕亚洲一区二区va在线| 18禁裸乳无遮挡啪啪无码免费| 盗摄精品av一区二区三区| 中文字幕一区久久| 蜜臀久久99精品久久久画质超高清| 中文网丁香综合网| 成人av二区| 114国产精品久久免费观看| 成人国产一区| 欧洲亚洲免费视频| 在线看的毛片| 5566日本婷婷色中文字幕97| 久草在线新免费首页资源站| 亚洲精品国偷自产在线99热 | 一本色道88久久加勒比精品| 熟女视频一区二区三区| 久久精品青草| 国产精品一区二区a| 视频一区日韩| 97自拍视频| 一区二区在线免费播放| 99在线观看视频网站| 91麻豆精品激情在线观看最新| 97免费资源站| aaa国产精品视频| 国产欧美韩日| 亚洲免费专区| 日本午夜精品电影| 日韩免费高清视频网站| 亚洲直播在线一区| 日本免费久久| 欧美刺激性大交免费视频| 二区三区在线观看| 欧美激情精品久久久久久久变态| 黄色毛片在线看| 欧美成人艳星乳罩| 日韩在线观看视频一区二区三区 | 亚洲欧美高清在线| 美女看a上一区| 久国产精品视频| 国产精品18久久久久久久网站| av不卡中文字幕| 久久久久久亚洲综合影院红桃 | 成人a'v在线播放| 中文字幕色一区二区| 午夜国产欧美理论在线播放| 少妇人妻大乳在线视频| 日日摸夜夜添夜夜添亚洲女人| 国内精品国产三级国产99| 国产精品分类| 亚洲欧洲日产国码无码久久99 | 国模大尺度视频| 日韩国产精品久久久久久亚洲| 999在线免费视频| 日韩午夜免费视频| 少妇激情一区二区三区| 黄网站免费久久| 天天干天天综合| 国产精品 欧美精品| 自拍视频一区二区| 国产精品自拍毛片| 成年人三级黄色片| 成人av网站在线| 国产无遮挡在线观看| 一区二区在线电影| 天天操天天干天天摸| 精品国产精品三级精品av网址| 九九视频免费看| 色综合久久综合网欧美综合网| 国产又粗又猛又爽| 日韩电影中文字幕在线| 蜜桃视频网站在线观看| 中文字幕精品一区久久久久| 黄色小视频在线观看| 久久色在线播放| 第84页国产精品| 99久久精品久久久久久ai换脸| 久久93精品国产91久久综合| 国产在线xxxx| 美国一区二区三区在线播放| 在线黄色免费网站| 亚洲人成影院在线观看| 国产寡妇亲子伦一区二区三区四区| 91精品视频网| 国产aⅴ一区二区三区| 亚洲深夜福利在线| 成人精品一区二区三区校园激情| 欧美精品在线看| 国产精品99久久久久久董美香| 精品国产一区二区三区日日嗨 | 久久婷婷国产麻豆91天堂| av综合电影网站| 精品一区二区视频| 午夜电影亚洲| 色黄视频免费看| 粉嫩av一区二区三区| av在线播放中文字幕| 色综合久久久网| 天堂在线中文网| 亚洲欧美中文字幕在线一区| 国产深夜视频在线观看| 91在线观看免费高清完整版在线观看| 国产一区二区在线| 亚洲精品无人区| 天堂成人国产精品一区| 影音先锋人妻啪啪av资源网站| 亚洲精品中文字幕乱码三区| 91一区二区视频| 精品国产第一区二区三区观看体验| 在线看的av网站| 国产精品美女久久久免费 | 亚洲色图狂野欧美| 在线手机中文字幕| 狠狠色伊人亚洲综合网站色| 亚洲视频精品| www.555国产精品免费| 亚洲主播在线播放| 亚洲精品成人电影| 欧美激情欧美激情| 国产96在线亚洲| 成人毛片一区二区| 97se亚洲国产综合自在线观| 国产又色又爽又黄的| 在线免费观看一区| 国产香蕉视频在线看| 久久视频在线直播| 国产亚洲字幕| 特级西西444| 懂色av中文一区二区三区 | 亚洲黄色影院| 亚洲久久久久久| 色欧美88888久久久久久影院| 中文字幕在线观看欧美| 中文字幕亚洲一区在线观看| 久久夜夜久久| 好吊色欧美一区二区三区| 亚洲国产国产亚洲一二三| 精品视频站长推荐| 91久久精品网| 黄色网址视频在线观看| 成人自拍偷拍| 国产精品呻吟| 91麻豆制片厂| 日韩欧美激情四射| 国产福利电影在线播放| 色姑娘综合网| 国产福利一区在线观看| 国产精品老女人| 尤物九九久久国产精品的分类| 都市激情久久综合| 欧美18视频| 在线观看视频免费一区二区三区| 乌克兰美女av| 亚洲理论在线观看| 四虎影视在线播放| 欧美美女15p| 神马香蕉久久| 久久免费一级片| 国产精品扒开腿做爽爽爽a片唱戏 亚洲av成人精品一区二区三区 | 老熟妇一区二区三区| 中文日韩在线视频| 日韩一区二区三区在线看| 欧美成人xxxxx| 中文字幕亚洲一区二区va在线| 亚洲黄色精品视频| 国产福利视频一区| 日本.亚洲电影| 亚洲高潮无码久久| 久久久综合视频| 国产黄色片网站|