精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

世界首個AI程序員Devin視頻竟造假?博主逐幀解析,Devin代碼任務(wù)完成很糟糕

人工智能 新聞
全球首個AI程序員Devin被爆視頻造假?YouTube博主近日揭露了背后明星初創(chuàng)公司Cognition的謊言,通過逐幀分析發(fā)現(xiàn),Devin并不能獨立完成Upwork工作。

全網(wǎng)爆火的世界首個AI程序員Devin,如今被爆出視頻竟是作假?

最近,一位有35年軟件工程師經(jīng)驗的YouTube博主去逐幀復(fù)現(xiàn)了,Devin完成Upwork任務(wù)的宣傳視頻。

卻意外發(fā)現(xiàn),AI并不能像人類工程師一樣完成任務(wù),而且非常糟糕。

圖片

他將25分鐘「揭穿Devin的謊言」視頻公開后,一時間引爆全網(wǎng)并在HN、Reddit等社交平臺上掀起軒然大波。

圖片

更有意思的是,博主自己復(fù)制了Devin嘗試做的任務(wù),花費了大約36分鐘。

然而,Devin用了至少6個小時,甚至可能超過一天。

圖片

有網(wǎng)友表示,「正如博主詳細解釋的那樣,盡管其試圖在演示中暗示,Devin并不能獨立完成Upwork的工作。它正在創(chuàng)建混亂、過于復(fù)雜的代碼」。

圖片

也有人認為,Devin從誕生之初,就更多的是營銷和炒作,而不是現(xiàn)實。

圖片

說來,Devin視頻真的是作假了嗎?

逐幀分析,揭穿Devin的謊言

Devin發(fā)布之初,背后初創(chuàng)公司Cognition AI更新的官方博文中,通過七個視頻介紹了這一AI的「魔力」。

其中,一個視頻是,讓Devin自主完成了全球最大的綜合類自由職業(yè)平臺Upwork的一項任務(wù)。

當時,網(wǎng)友看后驚訝地表示,沒想到AI智能體都可以做副業(yè)了。

Cognition的開發(fā)者You挑選了一項「用計算機視覺模型做推理」的工作,具體要求是:

- 我希望利用該資源庫中的模型進行推斷。(https://github.com/mahdi65/roadDamageDetection2020)

- 您的交付成果將是關(guān)于如何在AWS的EC2實例中進行操作的詳細說明。

- 請?zhí)峁┠瓿蛇@項工作的評估報告。我不會回復(fù)沒有評估的報告。

圖片

如下是Devin在官方視頻中,完成任務(wù)的表現(xiàn)。

接下來,一起看下YouTube博主如何逐幀分析,Devin在真正實操中的能力。

博主稱,我們首先看到Devin并不是能做Upwork上的任何工作,而是在這項任務(wù)中,研究者精心挑選了「road damage」任務(wù)。

當然,這并非說Devin就是欺騙性的,而是代表其在別的任務(wù)中的表現(xiàn),一定要比這個差。

圖片

然后,在實際對話中,開發(fā)者You向Devin提出的要求如下,「我想用這個儲存庫中的模型進行推理,請弄清楚」。

值得注意的是,客戶的要求是「你需要在亞馬遜EC2實例中提交這一操作的詳細說明」,與開發(fā)者提出要求顯然不同。

圖片

然而,根據(jù)Devin的視頻末尾,實際上它并沒有按照客戶要求完成工作。

在博主看來,完成這項任務(wù)之前,你需要明確怎樣開始這項工作。

這就需要向客戶詢問:

- 實例的大小,類型

- 是更傾向于一個運行更快但成本更高的實例,還是一個更經(jīng)濟但運行較慢的實例?

- 這個系統(tǒng)需要持續(xù)在線嗎?

......

如何處理自己需要進行推理分析的資料/圖片?你將怎樣把這些上傳到服務(wù)器?

比如,可以建立一個網(wǎng)頁界面來處理,也可以通過SSH上傳,或者放在S3 bucket里。那輸出結(jié)果的訪問方式又是怎樣的呢?

這些都是你必須了解的問題。

總而言之,博主稱,這也是我之前視頻里提到的,軟件開發(fā)者的工作中最難的、最關(guān)鍵的、最耗時的一部分:

主要是與客戶、領(lǐng)導(dǎo)及其他利益相關(guān)者的溝通。

這些都是 AI 目前無法完成的任務(wù),而這些恰恰是我們所做的非常重要的事情。

Devin實際上做了什么?

如下是視頻中的一個截圖,提到了一個Repo。

這是一個名為 requirements.txt 的文件,它規(guī)定了代碼的依賴庫版本。

不過,這個代碼庫最初依賴的一些庫是四年前的版本,而現(xiàn)在其中一些庫已經(jīng)不再提供下載,所以不得不進行修改。

再此,視頻中提到了Devin更新了代碼。博主表示,「Devin能夠做到這一點確實令人贊嘆」。

與客戶的要求相比,他們基本上希望建立自己的推理能力。

Devin被告知只使用樣例數(shù)據(jù)就可以,因此這正是博主復(fù)現(xiàn)Devin操作時所做的。

Devin很早就遇到了一個錯誤,這是一個命令行錯誤:

在頂部,遇到了與打開圖像、文件未找到、無此文件或目錄相關(guān)的錯誤。

這個錯誤出現(xiàn)在一個名為visualize_detections.py的代碼文件中。博主稱自己并沒有遇到這一問題,是因為在代碼庫中不存在名為visualize_detections.py的文件。

回到命令行,如果放大窗口的其他部分,便會看到,Devin將一些內(nèi)容寫入一個名為inspect_results.py的文件中,接著運行Python執(zhí)行這個文件,結(jié)果出現(xiàn)了語法錯誤。

在Python文件中使用/n是不行,而且echo命令也不該這么使用。這整個過程都是錯誤的毫無意義。

Devin在創(chuàng)建這些含錯誤的文件后,又進行了修正。視頻中提到,Devin實際上是在進行打印行調(diào)試。這是一個很常見的做法,很多人都會用到。

評論里說,「Devin正在添加代碼,追蹤數(shù)據(jù)流直至徹底理解」。

博主對此懷疑道,我不相信Devin真的能理解任何事物。

放大觀察這一部分,可以看到一個奇特的循環(huán)。它正在讀取一個文件,并把數(shù)據(jù)讀入一個緩沖區(qū)。這是update_image_ids.py文件。

再次說明,這個文件在客戶要求使用的代碼倉庫中不存在。

實際上,博主在GitHub上搜索了所有可能的位置,只有2處存在帶有這個名稱的文件。

屏幕上顯示三個的原因是,其中一個是另一個的分支版本,它們與Devin正在使用的文件完全不同。

但問題在于Devin此處正在調(diào)試一個自己創(chuàng)建的文件,而這個文件完全不在項目代碼倉庫中,非常不妥。

其實,Devin并不是在修正自己在網(wǎng)上發(fā)現(xiàn)的代碼,也不是在處理客戶指定的問題代碼,而是在修正自己生成的錯誤代碼。

更糟糕的是,這樣做并無必要。這是那個代碼庫中的readme文件。

該庫中有一個名為infer.py的文件,正如視頻中Devin所做的那樣。

readme文件說明了其功能及使用方法。在右側(cè),甚至還有一個小按鈕,可以復(fù)制整條命令,粘貼至命令行窗口,然后按下回車。

博主認為開發(fā)這個「檢測道路損壞」的代碼倉庫的人已經(jīng)盡可能地簡化了使用說明,但Devin似乎還是沒能理解。

因此,Devin不得不自己創(chuàng)建了一個混亂的項目。

正如Devin正在發(fā)現(xiàn)的,復(fù)雜,難以處理,很容易出現(xiàn)小錯誤,這樣的代碼很難調(diào)試。

半小時復(fù)現(xiàn),AI卻用了6小時

接下來,博主計劃自己去復(fù)現(xiàn)Devin嘗試做的任務(wù)。

他表示,自己用了大約36分的時間,完成所做的事。

下一張幻燈片中,實際上有一個需要修復(fù)的錯誤,在名為dataset.py的文件第33行。

問題是torch模塊缺少一個名為underscore six的屬性。

博主在谷歌上搜索了這個問題,找到了GitHub上的一個相關(guān)評論。

他按照該評論中的建議修改了代碼行,這樣確實解決了問題。

「解決這個問題總共花了我大約一分鐘七秒的時間,只需這么短的時間我就修正了錯誤。這只是一個快速的谷歌搜索而已」。

以下是博主所做的修改的具體內(nèi)容,這是最初狀態(tài)和最后狀態(tài)之間的差異。

這是requirements.txt文件的一處修改,最開始使用的是torch 1.4.0版本,博主使用了最新版本的torch 2.2.2。

然后在右邊,這是Devin視頻中的最后一屏,左邊是我的視頻,也就是最后的輸出。

它們兩個大同小異。博主的框是黃色的,Devin是紅色的。

根據(jù)Devin官方視頻中時間,從最初2024年3月9日3:25pm開始,一直到9:41pm完成,中間經(jīng)歷了6個小時。

圖片

最后再看下,Devin完成工作的效果及其評價。

為了復(fù)制Devin的結(jié)果,博主只需要在云實例上設(shè)置合適硬件的環(huán)境,并實際運行兩個帶有正確路徑的命令。

這些東西看起來就像Devin做了很多工作,完成了很多任務(wù)。

然而,只要你設(shè)置好環(huán)境,實際上你只需要運行2個命令。些代碼修正全都無關(guān)緊要,因為它們都是 Devin 自生成的代碼。

在視頻的最后,研究者You表示Devin做得好。而實際上,Devin完成的任務(wù)對于AI來說的確很酷。

AI程序員,全網(wǎng)沸騰

3月初,還記得Devin發(fā)布時,全網(wǎng)都在瘋轉(zhuǎn)這個AI。

在SWE-bench基準測試中,它的表現(xiàn)遠遠超過Claude 2、Llama、GPT-4等選手,取得了13.86%的驚人成績!

它不僅能自主學(xué)習(xí)不熟悉的技術(shù),端到端地構(gòu)建和部署應(yīng)用程序,自己改bug,甚至還能訓(xùn)練和微調(diào)自己的AI模型!

網(wǎng)友紛紛恐慌,Devin會偷走我們的工作嗎?難道程序員真的不存在了?!

圖片

甚至,背后十人初創(chuàng)團隊的勵志故事也被人挖了出來。

核心創(chuàng)始人首席執(zhí)行官Scott Wu,以及弟弟Neal Wu等人共攬收十枚IOI金牌。

圖片

也就不到一個月的時間,各種AI程序員相繼誕生。

比如,普林斯頓團隊提出的SWE-agent,可以在真實的GitHub倉庫里修bug,還有OpenDevin,Devika開源項目。

圖片

不過,關(guān)于AI程序員能否解決真實問題的能力,卻是還應(yīng)該持有保留態(tài)度。

因為,即便是借助了GPT-4 Turbo的能力,AI也并非是萬能的。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-03-18 09:26:15

微軟AI

2024-03-19 09:29:32

AI程序員

2024-04-07 00:00:02

AI程序員開發(fā)

2024-12-04 13:25:46

2024-03-18 06:55:51

DevinAI程序員人工智能

2024-04-03 12:18:45

AI訓(xùn)練

2025-01-24 12:49:55

AI開發(fā)工具視頻

2017-11-14 21:30:15

2018-12-29 14:45:34

RESTfulGoogleUser

2012-07-10 11:31:37

OpenFlowSDN

2015-08-31 10:14:30

程序員處理代碼糟糕代碼

2015-09-01 11:20:58

程序員糟糕代碼

2015-08-19 08:51:38

程序員面試糟糕

2024-06-03 12:03:56

2012-08-29 15:49:50

2024-03-18 09:15:31

2025-07-21 09:03:00

模型AI訓(xùn)練

2013-06-14 11:16:14

2021-11-01 22:39:14

程序員專業(yè)技術(shù)

2024-03-21 14:16:28

AGI人工智能馬斯克
點贊
收藏

51CTO技術(shù)棧公眾號

麻豆久久久久| 你懂的在线看| 亚洲午夜一区| 亚洲国产日韩欧美在线99| 青春草国产视频| 欧美 中文字幕| 先锋a资源在线看亚洲| 一本色道久久综合狠狠躁篇的优点| 蜜臀久久99精品久久久酒店新书| 四虎影院在线域名免费观看| 日韩国产精品久久久久久亚洲| 夜夜嗨av一区二区三区免费区 | sdde在线播放一区二区| 欧美日本视频在线| 欧洲精品在线播放| 人妻妺妺窝人体色www聚色窝| 午夜在线一区| 一区二区三区亚洲| 国产av一区二区三区传媒| 成人免费看视频网站| 亚洲视频你懂的| 精品伦精品一区二区三区视频 | 国产精品乱看| 日韩中文字幕在线视频播放| 美女露出粉嫩尿囗让男人桶| 亚洲一区二区图片| 成年女人的天堂在线| 美国十次了思思久久精品导航| 色综合久综合久久综合久鬼88| 国产精品揄拍100视频| 久久免费资源| 欧美日韩精品二区| youjizz.com亚洲| 日韩精品视频无播放器在线看 | 91成人网在线| 青青草视频在线视频| 深夜福利视频一区| 国产精品一区二区三区乱码| 国产精品久久久久久久久久久久久久 | 91精品国产色综合久久不卡蜜臀| 成人在线免费观看av| 黄色片网站在线| 91丝袜高跟美女视频| 4444kk亚洲人成电影在线| 日本一区二区免费电影| 伊人久久成人| 北条麻妃在线一区二区| av黄色免费网站| 成人中文字幕视频| 日韩欧美aaa| 精品一二三四五区| 中文国产字幕在线观看| 国产精品国产三级国产a| 欧美另类网站| 天天插天天干天天操| 影音先锋国产精品| 久久视频免费在线播放| 强制高潮抽搐sm调教高h| 第四色成人网| www.国产一区| 国产一区二区视频在线观看免费| 亚洲xxx拳头交| 久久亚洲综合国产精品99麻豆精品福利 | 久久免费国产视频| 国产一级二级三级| 亚洲免费高清| 日韩av黄色在线观看| 高潮毛片又色又爽免费| 日本午夜精品视频在线观看| 国产精品久久久久久亚洲调教| 销魂美女一区二区| 久久av中文字幕片| 99re在线| 无码国产精品一区二区免费16| 91首页免费视频| 午夜一区二区三区| 中文字幕免费高清电视剧网站在线观看 | 一区一区视频| 中文字幕在线观看播放| 亚洲第一成年网| www日韩在线观看| 国内自拍亚洲| 精品久久久久久综合日本欧美| 99精品一区二区三区无码吞精| 欧美91在线| 在线看日韩欧美| 麻豆精品一区二区三区视频| 在线亚洲自拍| 国产精品自产拍在线观| 好吊色一区二区三区| 91蜜桃视频在线| 久久免费视频2| 国产伦久视频在线观看| 欧美日韩中字一区| 日本一区二区免费视频| 精品久久综合| 欧美黑人国产人伦爽爽爽| 亚洲GV成人无码久久精品| 久99久精品视频免费观看| 国产伦精品一区二区三区| 成人一区二区不卡免费| 夜夜操天天操亚洲| 青青青在线视频免费观看| 视频二区欧美毛片免费观看| 亚洲欧洲免费视频| 久久久久成人片免费观看蜜芽| 亚洲一区黄色| 一区二区三区丝袜| 亚洲精品国产一区| av中文在线资源| 欧美精品丝袜久久久中文字幕| 伊人网综合视频| 久久免费大视频| 欧美在线www| 午夜精品久久久久久久99老熟妇| 久久久夜色精品亚洲| 999一区二区三区| 亚洲精品无播放器在线播放| 亚洲美女在线观看| 免费人成在线观看| 精品亚洲国产成人av制服丝袜| 女女同性女同一区二区三区91| 成人福利片网站| 欧美麻豆精品久久久久久| 亚洲一区二区三区蜜桃| 国产精品久久| 亚洲综合社区网| √天堂资源地址在线官网| 亚洲精品视频自拍| 18岁视频在线观看| 久久99国产精品久久99大师| 欧美噜噜久久久xxx| 一区二区三区免费观看视频| 中文字幕高清一区| 久久久久久久久久福利| 天美av一区二区三区久久| 欧美片一区二区三区| 国产精品无码久久久久成人app| 中文子幕无线码一区tr| 国产视频一区二区视频| 亚洲人成亚洲精品| 国产91精品久| 日本免费不卡| 欧美性20hd另类| 欧美性xxxx图片| 亚洲人人精品| 久久99精品久久久久久久青青日本| 女同一区二区免费aⅴ| 日韩欧美自拍偷拍| 99视频只有精品| 国产不卡一区视频| 日韩a级黄色片| 成人在线视频你懂的| 久久91精品国产| 国产 日韩 欧美 精品| 一区二区免费在线播放| 国产精品无码自拍| 亚洲国内精品| 久久综合入口| av在线日韩| 中文字幕日韩欧美| 国产精品视频a| 亚洲一区二区三区在线看| 中文文字幕文字幕高清| 久久久久网站| 一区二区三区四区| 亚洲精品在线播放| 97在线精品国自产拍中文| 婷婷色在线观看| 色综合久久88色综合天天6| caopeng视频| 麻豆精品久久精品色综合| 一道本在线观看视频| 麻豆久久一区| 97视频在线观看视频免费视频| 国内在线免费高清视频| 欧美精品丝袜中出| 国产大片aaa| 国产亚洲综合性久久久影院| 国产精品自在自线| 亚洲午夜视频| 亚洲va久久久噜噜噜久久狠狠| 日韩制服诱惑| 欧美精品福利视频| 国产一级片在线播放| 91麻豆精品国产91久久久久久| 久久久精品99| 久久精品一区二区| www.欧美com| 日本不卡视频在线观看| 日本一区二区三区四区五区六区| 欧美自拍视频| 亚洲va码欧洲m码| 亚洲最大成人| 欧美成人精品激情在线观看| 午夜性色福利影院| 欧美日韩国产影片| 91午夜视频在线观看| 中文字幕日本不卡| 亚洲制服丝袜在线播放| 国产一区日韩二区欧美三区| 欧美日韩亚洲一| 欧美韩日精品| 亚洲精品乱码视频| 日韩成人午夜| 亚洲一区二区在线播放| 欧美日韩在线精品一区二区三区激情综合| 欧美成人h版在线观看| 国产精品视频一区二区久久| 日韩丝袜情趣美女图片| 中文字幕 视频一区| 亚洲va在线va天堂| 99久久99久久精品国产| 国产亚洲欧美在线| 一起草在线视频| 国产精品综合视频| 91av视频免费观看| 久久亚洲一区| 欧美精品一区二区三区三州| 午夜久久影院| 伊人久久99| 欧洲激情综合| 免费一区二区三区在在线视频| 成人av综合网| 亚洲tv在线观看| 伊人久久大香| 国产一区玩具在线观看| 日本精品在线中文字幕| 欧美亚州一区二区三区| segui88久久综合| 欧美日韩爱爱视频| av片在线观看永久免费| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 激情五月婷婷网| 欧美日韩国内自拍| 国产成人亚洲欧洲在线| 亚洲成年人影院| 国产一级一级片| 亚洲高清免费一级二级三级| 欧美成人精品激情在线视频| 亚洲视频香蕉人妖| 欧美日韩午夜视频| 亚洲丝袜美腿综合| 亚洲成人生活片| 一区二区久久久久久| 免费在线观看av网址| 夜夜爽夜夜爽精品视频| 久久久久久久福利| 一个人看的www视频在线免费观看| 伊人久久免费视频| wwwxxx在线观看| www国产亚洲精品久久网站| 日本中文字幕视频在线| 色狠狠久久aa北条麻妃| 日本在线视频站| 久久久精品国产| 中文在线手机av| 97视频在线观看免费高清完整版在线观看 | 夜夜添无码一区二区三区| 亚洲另类自拍| 成人午夜视频免费在线观看| 人人狠狠综合久久亚洲| 一级黄色录像在线观看| 精品一区二区三区在线视频| 在线播放av中文字幕| 国产高清无密码一区二区三区| 日本天堂在线播放| 91女人视频在线观看| jizz中文字幕| 亚洲三级小视频| 久久精品视频日本| 色伊人久久综合中文字幕| 中文亚洲av片在线观看| 欧美一级电影网站| 深夜福利视频在线免费观看| 一本久久综合亚洲鲁鲁| 乱人伦中文视频在线| 久久久免费高清电视剧观看| xxxxx性欧美特大| 亚洲资源在线看| 国产精品久久久久av蜜臀| 热re99久久精品国99热蜜月| 亚洲成av人电影| 国产成人在线免费看| 乱一区二区av| 91视频在线免费| 国产精品美日韩| 国产精品6666| 欧美日韩免费在线视频| 成人久久久精品国产乱码一区二区 | 日韩美女在线看| 国产免费区一区二区三视频免费 | av二区在线| 欧美国产在线电影| 影音成人av| 国产精选在线观看91| 日韩欧美大片| 日本福利视频在线| 激情五月激情综合网| 人妻丰满熟妇aⅴ无码| 亚洲欧美激情小说另类| 中文字幕免费在线观看视频| 欧美一区二区三区小说| 国产福利小视频在线观看| 欧美富婆性猛交| 亚洲精品555| 久久久久久九九九九| 中文字幕免费一区二区三区| 精品免费国产一区二区| 不卡的看片网站| 日本中文在线视频| 色香蕉久久蜜桃| 人妻一区二区三区四区| 久久精品中文字幕| 在线国产成人影院| 国产另类自拍| 国产一区久久| 色姑娘综合天天| 国产精品国模大尺度视频| 久久免费激情视频| 欧美精品一区二区蜜臀亚洲| 黄视频在线观看网站| 国产精品入口福利| 伊人久久大香线蕉综合网站 | 亚洲黄色av网站| 欧美性video| 99久热re在线精品996热视频 | 久色视频在线播放| 国产馆精品极品| 青娱乐国产在线| 欧美一区二区三区在线电影| 在线观看美女网站大全免费| 欧美综合激情网| 亚洲精品3区| 91视频最新入口| www久久精品| 免费在线观看黄网站| 亚洲福利影片在线| 福利影院在线看| 国产精品对白刺激久久久| 欧美国产另类| aaa黄色大片| 亚洲成a人片在线不卡一二三区| 亚洲av无码国产精品久久不卡| 欧美成人合集magnet| 欧美区一区二区| www.欧美黄色| av网站一区二区三区| 日本中文字幕在线免费观看| 亚洲精品国产精品国自产观看浪潮| sm性调教片在线观看| 久久亚洲一区二区| 久久伊人亚洲| 极品尤物一区二区| 欧美另类高清zo欧美| 国产在线激情| 国产精品裸体一区二区三区| 国产日韩欧美| 久久精品—区二区三区舞蹈| 在线观看一区日韩| 国产不卡在线| 国产一区二区不卡视频在线观看| 新67194成人永久网站| 在线视频 日韩| 色94色欧美sute亚洲13| 亚洲成人三级| 亚洲最大av在线| 日韩一级大片| 在线观看国产精品一区| 欧美日韩精品一区二区三区蜜桃| 18网站在线观看| 精品欧美一区二区久久久伦 | 中文字幕欧美视频| 亚洲一区成人在线| 日韩国产福利| 91精品久久久久久久久久| 午夜精品久久久久99热蜜桃导演 | 亚洲日本在线播放| 国产精品久久久久久久久久免费| 97精品国产一区二区三区| 手机在线播放av| 色综合久久久久综合体| 91高清在线| 国产一区二区黄色| 美女网站一区二区| 国产一级淫片免费| 国产亚洲欧美日韩美女| 日韩在线观看一区二区三区| 日本wwww视频| 亚洲精品老司机| 国内三级在线观看| av色综合网| 蜜臀av一区二区在线免费观看 | 欧美精品在线一区二区| www成人免费观看| eeuss中文| 国产日本一区二区| 好吊色一区二区| 91精品国产综合久久香蕉的用户体验 | 曰批又黄又爽免费视频|