精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用AI,寫代碼只會更慢!但一定更「快樂」

人工智能 新聞
別自欺欺人了!METR重磅實(shí)測揭穿AI編程真相:GPT等工具讓頂尖程序員寫代碼平均慢了整整19%!效率不升反降、體驗(yàn)爽感成了錯(cuò)覺安慰劑?開發(fā)現(xiàn)場變「高科技馬車」,AI正在拖垮真正的高手!

AI進(jìn)化成編程怪物后,這或許是很多程序員/科研人的日常。

但是,用了AI,寫代碼一定更快了嗎?

METR(Model Evaluation & Threat Research)研究發(fā)現(xiàn),如果你夠強(qiáng)、對代碼庫夠熟悉,AI工具反而會給你拖后腿!

圖片

他們進(jìn)行了一系列嚴(yán)謹(jǐn)?shù)碾S機(jī)對照試驗(yàn)(RCT),結(jié)果驚人——

哪怕是寫過百萬行代碼的萬星repo大佬,使用AI工具時(shí),干同樣的任務(wù),也會多花「19%」的時(shí)間!

圖片

更令人「細(xì)思恐極」的是,開發(fā)者完全意識不到AI在拖他們的后腿!

實(shí)驗(yàn)前,他們平均預(yù)計(jì)AI能提升效率24%。

即便在明明白白看到「變慢」的實(shí)驗(yàn)結(jié)果后,他們還是認(rèn)為AI讓他們快了20%。

METR把所有的實(shí)驗(yàn)設(shè)計(jì)和結(jié)果都放在了論文中:

圖片

論文鏈接:https://metr.org/Early_2025_AI_Experienced_OS_Devs_Study.pdf

這項(xiàng)研究是怎么顛覆我們對AI寫代碼的幻

想的?

「變快」是幻覺:AI讓開發(fā)者慢了19%

具體而言,METR把研究限制在了「資深開發(fā)者」和他們熟悉的「大型、成熟開源代碼庫」這個(gè)范圍里。

為了測量AI工具在現(xiàn)實(shí)中的開發(fā)影響,METR招募了16位長期活躍于大型開源項(xiàng)目的資深開發(fā)者。

「資深」二字可不是說說而已,他們?nèi)司?00萬+行代碼,維護(hù)的GitHub項(xiàng)目有22k+顆星。

這些開發(fā)者真刀真槍上陣,從他們?nèi)粘9ぷ髁髦惺占?46個(gè)真實(shí)有價(jià)值的問題。

這些問題包括bug修復(fù)、新功能開發(fā)和重構(gòu)任務(wù)等,大概長下面這樣??

圖片

METR將每個(gè)任務(wù)隨機(jī)分配「允許使用AI」或「不允許使用AI」的對照實(shí)驗(yàn)組中。

在「允許」組中,開發(fā)者可以使用任何AI工具(主要是Cursor Pro搭配Claude 3.5/3.7 Sonnet等前沿模型)。

在「不允許」組中,他們不得借助生成式AI。

實(shí)驗(yàn)選擇的每個(gè)任務(wù)平均耗時(shí)2小時(shí)。完成任務(wù)的同時(shí),開發(fā)者需要錄屏,并自報(bào)所用總時(shí)間。

圖片

隨后,METR計(jì)算一個(gè)相對變化率,來衡量用不用AI的時(shí)間影響。

圖片

不過,開發(fā)者們也不白干活,METR按每小時(shí)150美元給他們付「工資」。

這筆高時(shí)薪開得很值,METR分析實(shí)驗(yàn)結(jié)果后發(fā)現(xiàn)了驚人的結(jié)論:

當(dāng)開發(fā)者可以使用AI工具時(shí),他們完成任務(wù)的平均時(shí)間反而增長了19%! 

而且,從下圖可以看出,使用AI寫代碼,全流程都被拖慢了!

圖片

這么明顯的變慢打破了所有人的預(yù)期。

更令人震驚的是,開發(fā)者完全感覺不到!

在實(shí)驗(yàn)前,他們預(yù)計(jì)AI能提升效率24%;但從下圖可以清晰看出,使用AI后,開發(fā)者用時(shí)顯著增加。

圖片

然而,即便在親身體驗(yàn)「變慢」后,他們?nèi)哉J(rèn)為AI「感覺上」讓他們快了20%!

不過,METR非常嚴(yán)謹(jǐn),聲明實(shí)驗(yàn)僅研究特定開發(fā)者與項(xiàng)目,不代表整個(gè)軟件開發(fā)行業(yè),更不能推廣到非軟件類任務(wù)(如法律、寫作、設(shè)計(jì)等)。

基準(zhǔn)測試、用戶體驗(yàn),都錯(cuò)哪了?

為確保嚴(yán)謹(jǐn),METR反復(fù)審查了自己的實(shí)驗(yàn)設(shè)計(jì)。

他們嚴(yán)格遵守實(shí)驗(yàn)分配規(guī)則,沒有在AI組更頻繁放棄難題,使用的AI也確實(shí)都是最強(qiáng)代碼模型。

并且,有AI和無AI組提交的PR(Push Request)質(zhì)量也沒什么大差別。

既然實(shí)驗(yàn)設(shè)計(jì)沒問題,那在AI寫代碼這件事上,為何benchmark和用戶體驗(yàn)都錯(cuò)了?

METR對實(shí)驗(yàn)結(jié)果進(jìn)行了進(jìn)一步的分析。

首先是更細(xì)粒度的思考過程分析:

細(xì)細(xì)看了這些大佬開發(fā)者的屏幕錄像后,METR發(fā)現(xiàn),允許使用AI時(shí),開發(fā)者在主動編碼以及搜索/閱讀信息上的時(shí)間減少了。

相對應(yīng)的,開發(fā)者將更多時(shí)間花在了與AI 交互(如編寫提示)、審查AI輸出的結(jié)果,以及「干等」上。

圖片

METR進(jìn)一步設(shè)想了20個(gè)可能導(dǎo)致變慢的因素,發(fā)現(xiàn)其中有5個(gè)可能對結(jié)果有顯著貢獻(xiàn):

圖片

一方面,開發(fā)者對項(xiàng)目已經(jīng)非常熟悉,遠(yuǎn)超和團(tuán)隊(duì)沒有默契的AI;另一方面,他們對 AI 效能有點(diǎn)過度樂觀。

另外,項(xiàng)目本身也很復(fù)雜,導(dǎo)致AI寫得快但寫得爛,開發(fā)者還要花很多時(shí)間調(diào)試。

最后,METR發(fā)現(xiàn),這項(xiàng)研究與此前觀點(diǎn)的矛盾似乎來源于任務(wù)的定義和區(qū)分。

對AI是否「能干活」這一問題,數(shù)據(jù)來源不同,得出的結(jié)論可能完全不同。

圖片

RCT實(shí)驗(yàn)聚焦的是「現(xiàn)實(shí)開發(fā)流程中是否真的更快」,基準(zhǔn)測試關(guān)心「模型在任務(wù)標(biāo)準(zhǔn)下能打幾分」,而用戶主要反饋「AI用起來爽不爽」的主觀感受。

換句話說,結(jié)論不一樣,是因?yàn)楸揪驮诨卮鸩煌瑔栴}。

關(guān)心的是「日常提效」,還是「攻堅(jiān)能力」,換換使用場景,答案可能完全不同。

每一種方法評估的都只是任務(wù)空間的子集,組合起來,或許才能客觀認(rèn)識AI編程的真實(shí)戰(zhàn)力。

上崗兩眼懵?AI編程不能只會刷分

METR的RCT實(shí)驗(yàn)提醒我們,別被AI基準(zhǔn)測試的高分嚇到了。

那些所謂的「智能體測評」「編程大賽」,看起來挺能打,實(shí)則可能離真實(shí)開發(fā)差得遠(yuǎn)。

在不需要背景、不需要理解上下文、不涉及實(shí)際部署的測試任務(wù)中訓(xùn)出來的AI,未必能趕上人類開發(fā)者的表現(xiàn);

我們不能低估AI的能力,更不能過度樂觀,覺得AI能輕松接管開發(fā)。

未來,用戶對AI編程工具的期待不只是「刷分」。

我們想看的是,AI是否真的能把軟件開發(fā)推進(jìn)得更快、更好?

一旦AI真能做到這一點(diǎn),那就意味著AI能夠「無限賦能」自身的進(jìn)化。

聽起來很酷,但也任重道遠(yuǎn)。

如何評估AI參與真實(shí)開發(fā)部署的能力?如何設(shè)立監(jiān)督護(hù)城河,保證項(xiàng)目安全?

METR打算繼續(xù)設(shè)計(jì)實(shí)驗(yàn),觀察AI開發(fā)的真實(shí)實(shí)力。

他們表示,想要集結(jié)更多開發(fā)者、AI編程用戶的力量,一起繼續(xù)搞實(shí)驗(yàn),看AI到底行不行。

不過,不管AI編程拖后腿的證據(jù)有多「實(shí)錘」,

研究中的大多數(shù)參與者,甚至研究作者本人,都并不介意被GPT之流拖一拖后腿。

面對一張白紙從零開始,或是對著一篇草稿進(jìn)行編輯,即使前者更快,大家想必也都會選擇后者。

畢竟,「奴役」AI寫代碼,雖然沒法更「快了」,但一定更「快樂」。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2013-08-29 09:42:26

代碼如何寫代碼教寫代碼

2017-01-19 17:57:47

大數(shù)據(jù)

2013-03-18 09:16:04

IDC大數(shù)據(jù)網(wǎng)絡(luò)技術(shù)

2024-03-21 17:29:45

2020-08-30 14:31:40

Python編程語言開發(fā)

2013-08-14 18:25:28

2025-08-11 07:30:00

大語言模型AI安全漏洞

2014-10-29 14:52:13

程序員

2025-05-30 02:10:00

Deepseek文檔模型

2022-11-09 15:41:47

人工智能小程序視頻

2021-05-10 19:07:18

冗余代碼Python

2024-07-11 10:50:39

2021-04-25 15:17:29

代碼軟件程序員

2015-06-17 11:18:01

WiFi

2013-09-03 09:09:30

大數(shù)據(jù)

2021-02-26 09:04:22

數(shù)組ArrayListHashMap

2017-09-28 08:35:35

前端HTML標(biāo)簽大全

2019-01-21 08:20:17

通信4G5G

2011-04-07 09:32:49

遞歸

2015-03-30 10:48:17

大數(shù)據(jù)大數(shù)據(jù)處理Hadoop
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲美女综合网| 四虎国产精品免费| 国产一二三在线观看| 日韩高清不卡一区二区三区| xxx欧美精品| 91精产国品一二三| 爱情电影社保片一区| 国产精品久久看| 国产主播一区二区三区四区| 中文人妻熟女乱又乱精品| 欧美国产高潮xxxx1819| 亚洲欧美精品一区| 日本女人黄色片| 视频二区不卡| 亚洲一区二区三区中文字幕在线| 欧美日韩国产一二| 亚洲AV无码一区二区三区性| 日产国产高清一区二区三区| 欧美夫妻性生活xx| 亚洲综合久久av一区二区三区| 久久99精品国产自在现线| 欧美日韩视频在线第一区| 国产原创中文在线观看| 天堂中文а√在线| 国产日韩精品久久久| 国产精品综合久久久久久| 在线播放成人av| 久久一区欧美| 国内精品视频一区| 日本一级二级视频| 色小子综合网| 亚洲片国产一区一级在线观看| 野战少妇38p| 欧美专区视频| 欧美电影一区二区| 在线免费视频一区| 日韩美女在线看免费观看| 亚洲国产精品久久不卡毛片| 国产精品12p| 免费网站黄在线观看| 国产亚洲自拍一区| 免费久久99精品国产自| 免费观看国产视频| 成人听书哪个软件好| 91视频88av| 国产精品爽爽久久久久久| 蜜臀av性久久久久蜜臀aⅴ流畅 | http;//www.99re视频| 一级成人免费视频| 蜜臂av日日欢夜夜爽一区| 国产精品88a∨| 日日夜夜狠狠操| 日韩和欧美的一区| 国产精品美女免费视频| 中文字幕精品无| 日韩不卡一区二区三区| 国产精品成人久久久久| 欧美一级黄视频| 美女视频黄久久| 国产在线观看精品| h片在线免费看| 国产成人午夜片在线观看高清观看| 91免费看片在线| www.久久精品.com| 不卡的看片网站| 亚洲qvod图片区电影| 国产三级按摩推拿按摩| 国产成人福利片| 精品高清视频| 二区三区在线播放| 中文字幕一区免费在线观看| 米仓穗香在线观看| bbw在线视频| 欧美日韩国产精品一区二区不卡中文| 中文字幕日本最新乱码视频| 色香欲www7777综合网| 欧美放荡的少妇| 亚洲日本久久久| 国产精品一在线观看| 日韩有码在线观看| 九九精品在线观看视频| 国产精品试看| 国产在线不卡精品| 国产成人拍精品视频午夜网站| 亚洲精品在线视频播放| 欧美视频精品全部免费观看| 日韩欧美不卡在线观看视频| 中文字幕免费在线播放| 国产区精品区| 久久久精品亚洲| 日本学生初尝黑人巨免费视频| 免费a在线观看| 亚洲一区二区免费在线观看| 日韩免费看网站| 中国黄色a级片| 欧美超碰在线| 欧美激情一二区| 真实新婚偷拍xxxxx| 国产乱码精品一品二品| 国产一区自拍视频| 日本免费视频在线观看| 五月激情综合网| 中文字幕第一页在线视频| 欧美三级自拍| 久久久999精品免费| 国产性xxxx高清| 久久99日本精品| 国产精品视频免费观看| √天堂资源地址在线官网| 亚洲最新在线观看| 亚洲污视频在线观看| 国产福利一区二区精品秒拍| 永久免费毛片在线播放不卡| 日本一区二区不卡在线| 久久精品国产秦先生| 精品一区久久久久久| 日韩子在线观看| 精品动漫一区二区| 91网址在线观看精品| 精品国精品国产自在久国产应用| 久久99国产精品久久久久久久久| 日韩欧美国产另类| k8久久久一区二区三区 | 欧洲精品久久久| 不卡视频在线播放| 中文字幕亚洲视频| 午夜dv内射一区二区| 黄色成人美女网站| 欧美丰满片xxx777| 国产xxxx孕妇| 亚洲三级免费电影| 国产日韩欧美久久| 成人激情开心网| 奇米影视亚洲狠狠色| 日本免费网站在线观看| 亚洲曰韩产成在线| 欧美老女人bb| 亚洲天天综合| 国产日韩综合一区二区性色av| 国产在线视频福利| 色噜噜狠狠色综合欧洲selulu| 中文字幕在线播放视频| 精品白丝av| 国产精品久久国产精品| 色网在线观看| 精品久久久久久久人人人人传媒| 国产精品久久久精品四季影院| 久久国产精品无码网站| 一区二区三区欧美在线| 91成人抖音| 色噜噜狠狠狠综合曰曰曰88av| 无码人妻久久一区二区三区| 国产午夜亚洲精品理论片色戒| 欧美 日韩 国产一区| 日韩有码一区| 日韩免费观看高清| www.视频在线.com| 欧美日韩国产色站一区二区三区| 欧美a在线播放| 狠狠色丁香久久婷婷综| 99热这里只有精品7| 亚洲精品a区| 久久久久久伊人| 婷婷五月综合激情| 欧美性高潮在线| 国产黄色大片免费看| 美女诱惑一区二区| 在线一区亚洲| 中文字幕亚洲在线观看| 久久欧美在线电影| 日本国产在线| 欧美日韩国产精选| 2021亚洲天堂| 91在线一区二区三区| 国产精品天天av精麻传媒| 国产精品国内免费一区二区三区| 91日韩在线视频| 涩涩在线视频| 日韩视频在线观看免费| 亚洲精品国产一区二| 欧美日韩国产专区| 亚洲天堂av中文字幕| 国产精品91xxx| 女人和拘做爰正片视频| 日韩电影在线视频| 成人在线观看网址| 色成人免费网站| 欧美精品一二区| 青青久在线视频| 欧美夫妻性生活| 午夜毛片在线观看| 最新欧美精品一区二区三区| 人妻体内射精一区二区三区| 毛片不卡一区二区| 国产玉足脚交久久欧美| 欧美日韩一二三四| 国产不卡一区二区三区在线观看| 欧美日韩免费观看视频| 精品中文字幕在线观看| 成人在线观看黄色| 亚洲成人av中文字幕| 在线免费观看一级片| 亚洲大片免费看| 中国美女黄色一级片| 波多野结衣视频一区| 九九热免费在线观看| 国产农村妇女精品一二区| 992tv成人免费观看| 亚洲高清极品| 国产亚洲精品美女久久久m| 国产精品原创视频| 国内精品一区二区三区| 黄色网页在线免费看| 亚洲乱码一区av黑人高潮| 国产视频一区二区三区四区五区| 色综合欧美在线| 久久在线视频精品| 综合色中文字幕| 日本一级免费视频| bt欧美亚洲午夜电影天堂| 天天看片天天操| 老司机精品视频网站| 男人添女人荫蒂免费视频| 婷婷伊人综合| 日韩视频在线观看国产| 清纯唯美亚洲经典中文字幕| 国产伦精品一区二区三区视频免费| 日日夜夜一区| 国产精品久久网| 波多野结衣久久精品| 午夜精品免费视频| 爱看av在线| 欧美日本高清视频| 天使と恶魔の榨精在线播放| 日韩有码在线观看| 又爽又大又黄a级毛片在线视频| 亚洲男人天堂网站| 色综合888| 亚洲激情国产精品| 天天干天天爽天天操| 欧美成人一区二区三区片免费 | 欧洲一区二区日韩在线视频观看免费 | 亚洲欧洲国产视频| 国产精品一区二区久久不卡| 五月天激情播播| 国内精品第一页| 亚洲欧美日韩一二三区| 久久99精品久久久久久久久久久久 | 最新黄色av网址| 国产精品毛片久久久久久| 黄色片网站免费| 中文无字幕一区二区三区| 亚洲精品国产精品国自产网站| 久久影院视频免费| 亚洲精品视频久久久| 久久久www成人免费毛片麻豆| 亚洲天堂网一区二区| 久久久久久久久一| 成人黄色免费网址| 中文字幕一区二区三区不卡| 日本中文在线视频| 亚洲一区二区三区小说| 在线免费观看毛片| 调教+趴+乳夹+国产+精品| 4438国产精品一区二区| 日本久久精品电影| 在线亚洲欧美日韩| 欧美成人精精品一区二区频| 欧美天堂在线视频| 亚洲欧美福利视频| 69久久精品| 久久综合久久88| 波多野结衣在线播放| 国产成人97精品免费看片| 久久91超碰青草在哪里看| 亚洲一区久久久| 任你弄精品视频免费观看| 日韩中文字幕一区| 欧美成人tv| 精品99在线视频| 久久成人免费电影| 亚洲天堂av网站| 亚洲国产激情av| 欧美日韩偷拍视频| 精品成人久久av| 国产一区二区三区黄片| 欧美一级黄色大片| 欧洲亚洲在线| 九九热视频这里只有精品| 精品人人视频| 成人黄色片网站| 国产香蕉精品| 午夜精品区一区二区三| 亚洲成人99| 麻豆av免费在线| 国产黄色精品网站| av男人的天堂av| 一区二区三区色| www.久久久久久久| 欧美zozozo| 大乳在线免费观看| 91av网站在线播放| 精品一区二区三区中文字幕| 久久婷婷国产综合尤物精品| 68国产成人综合久久精品| 少妇高潮喷水久久久久久久久久| 国产在线精品不卡| 色综合99久久久无码国产精品| 洋洋av久久久久久久一区| 中文字幕日韩三级| 日韩经典中文字幕| 九色91在线| 91精品啪aⅴ在线观看国产| 禁果av一区二区三区| 成人av在线不卡| 老汉av免费一区二区三区| 久久国产精品无码一级毛片| 亚洲日本va在线观看| 中文字幕网址在线| 亚洲免费一在线| 国产在线88av| 成人91视频| 综合激情一区| 中文字幕色网站| 国产精品美女久久久久久| 中文字幕精品无| 亚洲人成在线电影| 亚洲国产欧美日本视频| 国产精品麻豆免费版| 中文字幕免费精品| caoporm在线视频| 自拍偷拍国产亚洲| ,一级淫片a看免费| 色偷偷av一区二区三区乱| 成人高清一区| 亚洲电影一二三区| 日韩av一区二区在线影视| 亚洲第一综合网| 欧美在线一区二区三区| 国产在线电影| 国产精品福利久久久| 国语产色综合| 日韩一级免费在线观看| 国产日韩欧美在线一区| 免费av中文字幕| 伊人一区二区三区久久精品| 日本肉肉一区| 色就是色欧美| 久久99这里只有精品| 69夜色精品国产69乱| 91精品久久久久久久久99蜜臂| 黄色片免费在线观看| 91深夜福利视频| 黄色精品免费| 制服丝袜第二页| 色综合av在线| av在线免费观看网站| 国产精品一区久久| 一区二区三区四区日韩| 69xxx免费视频| 欧美日韩国产黄| 久久久久久久影视| 国产精品视频自在线| 91精品天堂福利在线观看| 欧美一级片在线免费观看| 亚洲一区二区四区蜜桃| 深夜福利视频在线免费观看| 欧美专区日韩视频| 精品免费在线| 亚洲日本黄色片| 亚洲一卡二卡三卡四卡无卡久久| 同心难改在线观看| 国产精品久久久久久久美男| 天天综合精品| 欲求不满的岳中文字幕| 91福利国产精品| a在线免费观看| 精品欧美日韩| 麻豆91在线播放| 日韩av片在线播放| 中文精品99久久国产香蕉| 久久伦理中文字幕| 欧美成人xxxxx| 亚洲欧美在线高清| 青青青草原在线| 亚洲最大的成人网| 久久九九精品| 中文字幕资源站| 亚洲激情成人网| 国产精品视频首页| 日本熟妇人妻xxxxx| 一区二区三区在线视频播放| 日本不卡免费播放| 51国偷自产一区二区三区的来源| 国产精品免费看| 久久久国产精品黄毛片| 亚洲亚裔videos黑人hd| 国产成人在线中文字幕| mm131国产精品| 欧美性xxxxxxx|