精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

登頂開源AI軟件工程師榜首,UIUC無Agent方案輕松解決SWE-bench真實編程問題

人工智能 新聞 開源
Agentless 是一種自動解決軟件開發問題的方法,它使用簡單的兩階段方法進行定位和修復,以修復代碼庫中的 bug。

這篇論文的作者均來自伊利諾伊大學香檳分校(UIUC)張令明老師團隊,包括:Steven Xia,四年級博士生,研究方向是基于 AI 大模型的自動代碼修復;鄧茵琳,四年級博士生,研究方向是基于 AI 大模型的代碼生成;Soren Dunn,科研實習生,目前為 UIUC 大三學生。張令明老師現任 UIUC 計算機系副教授,主要從事軟件工程、機器學習、代碼大模型的相關研究。

更多詳細信息請見張老師的個人主頁:https://lingming.cs.illinois.edu/

自從 Devin(首個全自動 AI 軟件工程師)提出以來,針對軟件工程的 AI Agent 的設計成為研究的焦點,越來越多基于 Agent 的 AI 自動軟件工程師被提出,并在 SWE-bench 數據集上取得了不俗的表現、自動修復了許多真實的 GitHub issue。

然而,復雜的 Agent 系統會帶來額外的開銷和不確定性,我們真的需要使用如此復雜的 Agent 來解決 GitHub issue 嗎?不依賴 Agent 的解決方案能接近它們的性能嗎?

從這兩個問題出發,伊利諾伊大學香檳分校(UIUC)張令明老師團隊提出了 OpenAutoCoder-Agentless,一個簡單高效并且完全開源的無 Agent 方案,僅需 $0.34 就能解決一個真實的 GitHub issue。Agentless 在短短幾天內在 GitHub 上已經吸引了超過 300 GitHub Star,并登上了 DAIR.AI 每周最熱 ML 論文榜單前三。

圖片


  • 論文:AGENTLESS : Demystifying LLM-based Software Engineering Agents
  • 論文地址:https://huggingface.co/papers/2407.01489
  • 開源代碼:https://github.com/OpenAutoCoder/Agentless

AWS 研究科學家 Leo Boytsov 表示:“Agentless 框架表現優異,超過所有開源 Agent 解決方案,幾乎達到 SWE Bench Lite 最高水平(27%)。而且,它以顯著更低的成本擊敗了所有開源方案。該框架采用分層查詢方法(通過向 LLM 提問來查找文件、類、函數等)以確定補丁位置。雖然利用 LLM,但不允許 LLM 做出規劃決策。”

圖片

Agentless 是一種自動解決軟件開發問題的方法,它使用簡單的兩階段方法進行定位和修復,以修復代碼庫中的 bug。在定位階段,Agentless 以分層方式來逐步縮小到可疑的文件、類 / 函數和具體的編輯位置。對于修復,它使用簡單的 diff 格式(參考自開源工具 Aider)來生成多個候選補丁,并對其進行過濾和排序。

圖片

研究者將 Agentless 與現有的 AI Software Agent 進行了比較,其中包括最先進的開源和商業 / 閉源項目。令人驚訝的是,Agentless 可以以更低的成本超越所有現有的開源 Software Agent!Agentless 解決了 27.33% 的問題,是開源方案中最高的,并且解決每個問題平均僅需 $0.29,在所有問題上(包括能解決和未解決的)平均只需要約 $0.34。

圖片

不僅如此,Agentless 還有改進的潛力。在考慮所有生成的補丁時,Agentless 可以解決 41% 的問題,這個上限表明補丁排序和選擇階段有顯著的改進空間。此外,Agentless 能夠解決一些即使是最好的商業工具(Alibaba Lingma Agent)也無法解決的獨特問題,這表明它可以作為現有工具的補充。

圖片

對 SWE-bench Lite 數據集的分析

研究者還對 SWE-bench Lite 數據集進行了人工檢查和詳細分析。

研究發現,SWE-bench Lite 數據集中,有 4.3% 的問題在問題描述中直接給出了完整的答案,也就是正確的修復補丁。而另外 10% 的問題描述了正確解決方案的確切步驟。這表明,SWE-bench Lite 中的某些問題可能更容易解決。

此外,研究團隊觀察到有 4.3% 的問題在問題描述中包含了用戶提議的解決方案或者步驟,但這些方案與開發人員的真實補丁并不一致。這進一步揭示了該基準測試的潛在問題,因為這些誤導性解決方案可能導致 AI 工具僅通過遵循問題描述來生成不正確的解決方案。

在問題描述質量方面,研究者觀察到,雖然 SWE-bench Lite 中大部分的任務都包含了足夠的信息,并且許多任務還提供了失敗示例來復現錯誤,但是仍有 9.3% 的問題沒有包含足夠的信息。例如需要實現一個新的函數或者添加一個錯誤信息,但是特定的函數名或者特定的錯誤信息字符串并沒有在問題描述中給出。這意味著即使正確實現了底層功能,如果函數名或錯誤信息字符串不完全匹配,測試也會失敗。

圖片

普林斯頓大學的研究人員,同時也是 SWE-Bench 的作者之一,Ofir Press 確認了他們的發現:“Agentless 對 SWE-bench Lite 進行了不錯的手動分析。他們認為 Lite 上的理論最高得分可能是 90.7%。我覺得實際的上限可能會更低(大約 80%)。一些問題的信息不足,另一些問題的測試過于嚴格。”

圖片

SWE-bench Lite-S:經過過濾的嚴格問題子集

針對這些問題,研究者提出了一個嚴格的問題子集 SWE-bench Lite-S(包含 252 個問題)。具體來說,從 SWE-bench Lite(包含 300 個問題)中排除了那些在問題描述中包含確切補丁、誤導性解決方案或未提供足夠信息的問題。這樣可以去除不合理的問題,并使基準測試的難度水平標準化。與原始的 SWE-bench Lite 相比,過濾后的基準測試更準確地反映了自動軟件開發工具的真實能力。

結語

盡管基于 Agent 的軟件開發非常有前景,作者們認為技術和研究社區是時候停下來思考其關鍵設計與評估方法,而不是急于發布更多的 Agent。研究者希望 Agentless 可以幫助重置未來軟件工程 Agent 的基線和方向。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-09-20 11:30:14

2025-10-13 09:33:19

2025-06-27 08:05:24

2025-07-07 13:50:56

AI編程算法

2025-05-15 09:13:00

2009-12-29 09:11:11

軟件工程師職業排行

2012-06-19 15:11:04

軟件工程師

2022-01-16 07:12:30

軟件工程師吵架開發

2009-02-11 13:15:54

軟件工程師女工程師google

2025-05-23 09:45:01

2023-06-05 10:07:13

軟件工程平臺工程師

2025-07-03 14:58:16

模型開源AI

2017-11-09 14:12:44

大數據軟件工程師算法工程師

2025-09-16 09:09:03

2022-07-29 09:12:44

軟件硬件開發

2022-04-18 10:13:32

軟件開發寫作

2022-09-16 08:00:00

軟件工程師求職薪酬

2014-08-20 10:24:11

軟件工程師

2010-08-10 13:29:58

軟件工程師
點贊
收藏

51CTO技術棧公眾號

国产精品久久国产精品| 日韩一区二区精品视频| 精品人妻一区二区三区四区在线| 香蕉av一区二区三区| 日韩精品亚洲一区二区三区免费| 丝袜一区二区三区| 精品人妻在线视频| 欧美影视资讯| 亚洲成在线观看| 神马影院一区二区三区| 亚洲乱熟女一区二区| 日韩精品一级二级| 欧美精品亚州精品| 韩国三级hd中文字幕| 97品白浆高清久久久久久| 日韩欧美亚洲一二三区| 在线观看成人免费| 国产日本在线视频| 成人综合婷婷国产精品久久免费| 国产成人精品免高潮费视频| 久久久久久福利| 欧美色女视频| 亚洲国产日韩欧美在线图片| 一级黄色片在线免费观看| 成人性生交大片免费网站 | 亚洲成成品网站| 校园春色 亚洲色图| wwww亚洲| 一区二区在线看| 天堂va久久久噜噜噜久久va| 天堂在线中文字幕| 国产精品一区二区x88av| 国产精品福利在线观看| 五月天综合激情网| 激情一区二区| 久操成人在线视频| 日韩三级在线观看视频| 日韩欧美高清| 一区二区亚洲欧洲国产日韩| 亚洲调教欧美在线| 最新精品在线| 日韩美女视频在线| 在线免费黄色小视频| 亚洲国产91视频| 欧美日韩在线免费视频| 无需播放器的av| 日韩成人亚洲| 91国在线观看| 黄色片视频在线免费观看| 高清在线视频不卡| 亚洲一级片在线观看| 超碰10000| av在线官网| 亚洲免费三区一区二区| 免费看av软件| 在线网址91| 亚洲欧美另类久久久精品2019| 一区不卡字幕| 麻豆91在线| 亚洲婷婷综合久久一本伊一区| 亚洲午夜精品国产| 久久bbxx| 亚洲激情第一区| 丰满的少妇愉情hd高清果冻传媒| 91精品国产91久久久久久青草| **欧美大码日韩| 国产91在线|亚洲| 91黄色8090| 国产性猛交╳xxx乱大交| 99国产精品私拍| 欧美中文字幕精品| www.久久网| 国产在线不卡一区| 国产区日韩欧美| 天堂成人在线| 中文字幕乱码亚洲精品一区| 中日韩在线视频| av免费在线网站| 偷拍亚洲欧洲综合| 国产免费一区二区三区视频| 丝袜美腿一区| 欧美二区三区的天堂| 少妇极品熟妇人妻无码| 日韩精品免费一区二区夜夜嗨| 亚洲男人天堂九九视频| av片在线免费看| 欧美日韩第一区| 91精品国产91| 91精品国产乱码久久久| 成人精品国产福利| 视频一区三区| 伊人电影在线观看| 91搞黄在线观看| 久久出品必属精品| 亚洲另类av| 久久久国产精彩视频美女艺术照福利| 精品无码人妻一区二区三| 久久五月激情| 成人av网站观看| 黄网站在线观看| 玉米视频成人免费看| 亚洲国产精品毛片av不卡在线| 福利一区三区| 亚洲日韩中文字幕| 日本熟妇一区二区| 麻豆91小视频| 久久香蕉综合色| 免费在线看黄色| 日韩欧美精品中文字幕| 99国产精品免费视频| 国产午夜一区| 国内成人精品一区| 国产又黄又大又粗的视频| 久久亚洲一区二区三区四区| 蜜臀av.com| 欧美日韩尤物久久| 日韩第一页在线| 99精品久久久久| 美腿丝袜亚洲三区| 欧美三日本三级少妇三99| 九色91在线| 5566中文字幕一区二区电影| 国产aⅴ激情无码久久久无码| 伊人成人在线视频| 999日本视频| 在线观看h片| 婷婷综合五月天| 在线成人精品视频| 伊人久久大香线蕉综合四虎小说| 国产国语刺激对白av不卡| 午夜国产在线观看| 日本不卡免费高清视频在线| 国产日韩欧美麻豆| 男人天堂999| 女同一区二区三区| 久久男人av资源网站| 国产日韩一级片| 国产精品的网站| 手机在线成人免费视频| 精品国产一区探花在线观看| 欧美在线一级视频| 视频在线不卡| 亚洲va韩国va欧美va| 免费啪视频在线观看| 欧美精品观看| 国产精品日韩二区| 黄网站在线观| 亚洲成人免费网站| 色网站在线播放| 99久久久久久99| 黄色动漫在线免费看| 任你躁在线精品免费| 欧美一级片在线播放| 天天干视频在线观看| 岛国精品视频在线播放| 少妇光屁股影院| 久久先锋资源| 亚洲欧洲一区二区在线观看| 日韩在线电影| 欧美精品在线极品| 亚洲国产成人一区二区| 亚洲成人av资源| 极品粉嫩小仙女高潮喷水久久| 国产亚洲精品自拍| 日本不卡二区| 免费一级欧美在线观看视频| 精品国偷自产在线视频| 精品黑人一区二区三区在线观看 | 中文字幕第28页| 97se亚洲国产综合自在线| 播放灌醉水嫩大学生国内精品| 国产毛片一区二区三区| 国产精品免费在线免费| 国产福利在线播放麻豆| 精品人在线二区三区| 精品国产xxx| 最近日韩中文字幕| 日本精品一二三区| 久久午夜激情| 老司机午夜免费福利视频| 欧美精品中文| 国产精品视频免费在线观看| 国产色在线观看| 亚洲国产精品小视频| 免费在线不卡av| 亚洲激情男女视频| 成年人在线观看av| 国产一区二区在线观看免费 | 99热99re6国产在线播放| 亚洲美女久久久| 97人妻精品一区二区三区视频| 亚洲一区二区三区四区中文字幕| 欧美图片第一页| 国产综合久久久久久鬼色| 成人免费观看cn| 日韩三级在线| 精品一区二区三区国产| 亚洲人成777| 欧美一区二粉嫩精品国产一线天| 日本www在线| 日韩成人在线观看| av一级黄色片| 欧美性猛片xxxx免费看久爱| 国产性一乱一性一伧一色| 国产精品毛片大码女人| 久久久久麻豆v国产精华液好用吗| 久久99久久99| 欧美成人xxxxx| 伊人久久大香线蕉综合热线| 亚洲一区3d动漫同人无遮挡| 亚洲国产精品嫩草影院久久av| 91一区二区三区| 99久久er| 热久久这里只有| 成全电影大全在线观看| 色青青草原桃花久久综合| 日本又骚又刺激的视频在线观看| 91精品久久久久久久99蜜桃| 国产精品久久久久久久久久精爆| 亚洲一区二区三区中文字幕 | 婷婷成人综合网| 精品国产视频在线观看| 国产色综合久久| 亚洲av无码一区二区三区观看| 国产综合色精品一区二区三区| 欧美精品无码一区二区三区| 亚洲精品字幕| 精品国偷自产一区二区三区| 夜间精品视频| 91xxx视频| 97精品国产| 日韩高清av电影| 九九免费精品视频在线观看| 精品欧美一区二区精品久久| 国产毛片久久久| 国产精品.com| jizz性欧美23| yellow视频在线观看一区二区| avtt久久| 国产综合福利在线| 白嫩亚洲一区二区三区| 国产精品一区二区三区毛片淫片| 成人不卡视频| 国产精品狼人色视频一区| 国产综合av| 国产精品老牛影院在线观看| 亚洲综合av一区二区三区| 国产91在线播放九色快色| 久久久久久久| 国产suv精品一区二区三区88区| 丁香六月综合| 国产精品第一第二| 福利一区二区免费视频| 成人国产在线激情| 国产精品久久久久久av公交车| 成人黄色av网站| 蜜桃在线一区| 国产成人精品一区二区三区福利| 国产厕拍一区| 欧美国产一二三区| 欧美伦理影院| 中文字幕色一区二区| 亚洲精品小说| www.国产在线视频| 99日韩精品| 日韩视频免费在线播放| 久久精品国产亚洲高清剧情介绍| 亚洲高清在线不卡| 国产suv一区二区三区88区| 大乳护士喂奶hd| 国产亚洲一区二区三区在线观看| 成人在线观看免费高清| 亚洲欧洲综合另类| 9色视频在线观看| 欧美偷拍视频| 日韩成人激情在线| 亚洲精品视频专区| 欧美极品aⅴ影院| 丁香六月激情综合| 亚洲欧美日韩国产综合在线| 欧美高清视频一区二区三区| 亚洲高清一区二区三区| 区一区二在线观看| 51久久夜色精品国产麻豆| 亚洲免费不卡视频| 亚洲午夜精品视频| av免费在线免费| 国产69久久精品成人| 成人影院在线免费观看| 成人片在线免费看| 欧美日韩精品一区二区视频| 国产制服91一区二区三区制服| 午夜在线视频一区二区区别 | 国产日韩专区| 蜜桃免费在线视频| 处破女av一区二区| 亚洲熟女少妇一区二区| 性久久久久久久久久久久| 中国黄色一级视频| 亚洲国产日韩欧美在线图片| 日本美女在线中文版| 91国在线精品国内播放| www.久久99| 清纯唯美一区二区三区| 午夜日韩激情| 伊人影院综合在线| 91尤物视频在线观看| 成人免费毛片xxx| 在线一区二区观看| 天天操天天操天天| 欧美成人免费视频| 亚洲精品69| 日韩精品国内| 久久精品男女| 欧美日韩一区二区三区四区五区六区| 国产精品毛片久久久久久| 在线观看精品国产| 精品国偷自产国产一区| 国产在线观看免费麻豆| 国产精品户外野外| 国内成人自拍| 日本三级免费网站| 91在线视频免费91| 国产一级二级三级| 日韩情涩欧美日韩视频| 老司机免费在线视频| 国产精品极品在线| 国产不卡一二三区| 中国丰满人妻videoshd| 92国产精品观看| 粉嫩aⅴ一区二区三区| 精品久久久久久久久久久久包黑料| 黄色精品免费看| 91欧美精品午夜性色福利在线 | 黄色一级视频在线播放| 国产馆精品极品| 乱h高h女3p含苞待放| 欧美人妖巨大在线| 在线观看麻豆| 国产精品情侣自拍| 清纯唯美日韩| 邪恶网站在线观看| 国产精品灌醉下药二区| 中文字幕精品无码亚| 日韩小视频在线| 成人豆花视频| 992tv成人免费观看| 国产成人精品www牛牛影视| 欧美色图亚洲视频| 欧美tk—视频vk| 国精产品一区一区三区mba下载| 成人av免费在线看| 中文亚洲字幕| 欧美激情aaa| 欧美三级一区二区| 精品麻豆一区二区三区| 91成人伦理在线电影| 尹人成人综合网| 国产女人18毛片水真多18| 婷婷夜色潮精品综合在线| 天堂av在线7| 国产精品吴梦梦| 欧美日一区二区在线观看 | 国产人妖一区二区三区| 欧美日韩高清区| 开心激情综合| 最近免费中文字幕中文高清百度| 中文在线资源观看网站视频免费不卡| 一区二区久久精品66国产精品| 久久深夜福利免费观看| 福利片在线一区二区| 日韩毛片在线免费看| 国产精品妹子av| 亚洲成人77777| 欧美最猛性xxxxx免费| 色88久久久久高潮综合影院| 永久看看免费大片| 欧美小视频在线| 欧美黄色激情| 国产综合 伊人色| 老司机午夜精品| 久久精品欧美一区二区| 国产亚洲欧洲高清一区| 国内精品视频| 欧美日韩在线视频一区二区三区| 中文在线免费一区三区高中清不卡 | 国产综合欧美| 97在线观看免费视频| 日韩你懂的在线播放| 日日av拍夜夜添久久免费| 日本不卡一区二区三区四区| caoporn国产精品| 在线免费观看一级片| 欧美一级淫片videoshd| 性欧美69xoxoxoxo| 亚洲国产无码精品| 日韩精品一区二区三区老鸭窝| 日韩天堂在线| 日韩五码在线观看| 亚洲色图一区二区|