精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

突破Claude-4編程上限!自進化Agent框架拿下新SOTA,底模越好性能越高,已開源

人工智能
隨著Claude 4模型的發布,SE-Agent的性能被推向新的高度:在SWE-Bench Verify上,它取得了高達80%的Top-1 Resolution Rate,再次刷新了領域紀錄。

突破多步推理瓶頸,讓Claude-3.7-Sonnet解題成功率暴增20.6%。

在SWE-Bench Verified上刷新開源框架SOTA!

中科院、清華大學、階躍星辰等提出SE-Agent,一個創新的自進化(Self-Evolution)框架。

它不再滿足于簡單地“多想幾次”,而是讓智能體學會系統性地修訂、重組與精煉其整個思考過程,通過多軌跡間的相互啟發與對抗,探索更廣闊、更多樣化的解決方案空間。

隨著Claude 4模型的發布,SE-Agent的性能被推向新的高度:在SWE-Bench Verify上,它取得了高達80%的Top-1 Resolution Rate,再次刷新了領域紀錄

這充分證明該框架可以隨著基礎模型升級而不斷進步。

圖片圖片

核心思想:從“獨立嘗試”到“集體進化”

大語言模型(LLM)驅動的智能體在處理復雜推理和工具使用方面展現了驚人的潛力,尤其是在軟件工程等需要多步驟交互的任務上。然而,現有方法(如蒙特卡洛樹搜索 MCTS)常常陷入困境:它們將每次的解決嘗試(即“軌跡”)視為獨立事件,忽視了不同解決方案路徑之間的內在聯系,導致思維固化,難以跳出局部最優解。

通俗來說,傳統智能體就像一群各自為戰的士兵,雖然人數眾多,但缺乏協同。SE-Agent則引入了“進化”的視角,將每一次解決問題的完整路徑(軌跡)視為一個“物種”,通過三大核心操作,讓這些“物種”在一個“生態系統”中迭代進化,優勝劣汰。

圖片圖片

SE-Agent的三大進化算子

1、修訂(Revision)-深度自省與定向改進

生成初始多樣性:首先,通過多樣的規劃策略和可控的“突變”,生成一個包含不同解題思路的初始軌跡池,確保進化的起點足夠豐富。

反思與修正:隨后,智能體對每一條初始軌跡進行“復盤”,分析其優缺點、邏輯斷點和潛在的改進空間,然后進行有針對性的修正,消除邏輯不一致和冗余推理,完成個體的自我完善。

2、重組(Recombination)-跨軌跡的“雜交”與學習

這是SE-Agent最具創新性的部分。它不再將軌跡視為孤島,而是促進它們之間的“知識共享”。

交叉融合(Crossover):識別并提取不同軌跡中的高效片段(例如,一個軌跡擅長定位問題,另一個擅長編寫修復代碼),然后將這些“優勢基因”組合起來,創造出全新的、更強大的混合軌跡。

知識遷移(Transfer Learning):將成功軌跡中的關鍵策略和洞見,系統性地“嫁接”到其他表現較差的軌跡上,實現“差生”向“優等生”的學習。

3、精煉(Refinement)-多維評估與優化選擇

在每一輪進化后,SE-Agent會通過一個多維度評估函數(綜合考量任務完成度、推理質量和效率)對所有新舊軌跡進行打分。

精英選擇:保留得分最高的“精英”軌跡,同時通過策略性選擇確保軌跡的多樣性,避免所有方案趨同。這個過程不斷迭代,直到找到能夠穩健解決問題的最優解。

在最具挑戰性的代碼基準上實現 SOTA

研究團隊以SWE agent作為我們的Baseline,在公認極具挑戰性的SWE-bench Verified基準(包含500個真實GitHub問題)上對SE-Agent進行了全面評測。結果顯示,SE-Agent在所有測試的LLM上都實現了顯著的性能提升。

開源模型表現(Pass@1):

  • DeepSeek-V3:從31.6%提升至54.8%(+73%相對提升)
  • Qwen-2.5-72B:從18.8%提升至38.8%(+106%相對提升)
  • Llama-3.1-70B:從15.4%提升至32.6%(+112%相對提升)

閉源模型表現(Pass@1):

  • GPT-4o:從22.4%提升至40.4%(+80%相對提升)
  • Claude-3.7-Sonnet:從40.6%提升至61.2%(+51%相對提升)

圖片圖片

值得注意的是,SE-Agent在Claude-3.7-Sonnet上達到了61.2%的首次嘗試成功率,這創造了開源智能體框架在SWE-bench Verified上的最佳性能記錄。消融實驗進一步證明,修訂和重組兩大模塊對于框架的成功至關重要。

核心優勢與技術突破

SE-Agent的成功源于對現有智能體范式的幾大核心突破:

1、真正的解決方案多樣性:不同于傳統方法僅在表面表達上有所不同,SE-Agent通過軌跡級干預,生成本質上不同的解決路徑,大幅擴展了候選解決方案空間。

2、跨軌跡協同智能:SE-Agent充分利用軌跡間的豐富相互依賴關系和潛在協同效應,實現了集體智慧的最大化,突破了單一智能體的認知局限。

3、高效進化收斂:相比傳統遺傳算法,SE-Agent通過結構化的進化機制,能在顯著更少的進化周期內實現高質量結果。

4、模型無關的即插即用:SE-Agent作為一個獨立的優化模塊,可與現有智能體框架無縫集成,在多種 LLM 上都展現出一致的、強大的性能提升。

案例研究:SE-Agent如何跳出思維定勢?

在一個scikit-learn的真實Bug修復案例中,傳統智能體的問題顯露無遺。

圖片圖片

傳統智能體(上圖):所有嘗試都緊盯報錯信息出現的_validation.py文件,提出的修復方案幾乎是“換湯不換藥”的重復,始終無法觸及問題的根源,導致測試失敗。

SE-Agent(下圖):通過軌跡的重組與進化,SE-Agent強迫自己探索了完全不同的方向。它跳出了最初報錯的文件,成功定位到根源在于multioutput.py文件缺少了一個關鍵字段的寫入。最終,通過一行代碼的根本性修復,完美通過了所有測試。

這個案例生動地說明了SE-Agent如何通過在軌跡層面進行演化,有效避免了“隧道視野”,從而發現那些隱藏更深、也更為關鍵的解決方案。

結論與技術影響

SE-Agent的提出,為提升LLM智能體的復雜推理能力提供了一個全新的、高效的范式。其重要影響在于:

1、開創了軌跡級優化范式:從傳統的參數調整轉向系統性的推理路徑操作,為智能體能力提升提供了新的理論基礎。

2、驗證了集體智慧機制:證明了通過跨軌跡學習實現智能體群體智慧的有機融合,是突破單一智能體認知瓶頸的有效途徑。

3、構建了自進化智能系統:為實現能夠持續自我改進的智能體系統鋪平了道路。

展望未來,研究團隊計劃將SE-Agent的自進化思想擴展到更廣泛的路徑搜索問題中,例如強化學習策略發現、具身智能規劃等,為通往更強大、更魯棒的通用人工智能持續貢獻力量。

論文標題: SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents

論文鏈接: https://arxiv.org/pdf/2508.02085

開源代碼: https://github.com/JARVIS-Xs/SE-Agent

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-03-25 13:06:00

數據訓練

2025-02-10 08:30:00

2025-07-29 09:03:00

2025-06-17 09:07:24

2022-04-08 14:40:59

框架訓練模型

2025-07-22 11:38:38

2025-10-31 08:50:00

AI模型開源

2024-01-06 17:12:44

視頻AI

2025-09-29 14:04:07

開源AI模型

2025-07-08 09:00:00

2022-12-25 13:59:09

模型架構

2025-01-03 15:39:02

2025-04-27 08:30:00

2023-05-15 15:38:59

AI模型

2024-04-02 09:17:50

AI數據開源

2023-03-20 13:43:00

AI論文

2025-01-26 11:00:00

2025-10-13 08:50:00

2024-01-18 10:57:35

AIM模型NLP

2010-08-31 11:06:37

點贊
收藏

51CTO技術棧公眾號

久久性感美女视频| 国产精品迅雷| 成人免费视频免费观看| 2019中文字幕在线免费观看| 亚洲永久精品ww.7491进入| 偷拍中文亚洲欧美动漫| 中文字幕在线一区二区三区| 国产精品一区二区三区免费观看 | 亚洲天堂成人| 亚洲视频自拍偷拍| 波多野结衣电影免费观看| 亚洲伊人av| 亚洲精品国产高清久久伦理二区| 精品午夜一区二区| 国产精品无码免费播放 | 美女国内精品自产拍在线播放| 欧美一级片在线免费观看| 亚洲精品福利电影| 亚洲在线中文字幕| 一区二区不卡视频| 嫩草精品影院| 丁香婷婷综合网| 国产欧美日韩视频| 特级做a爱片免费69| 欧美激情1区2区| 国产亚洲视频在线观看| 搞黄网站在线看| 久久av在线| 不卡av日日日| 亚洲一二三四视频| 日韩免费电影在线观看| 日韩欧美国产综合| 国产日韩欧美久久| 台湾佬中文娱乐久久久| 午夜精品aaa| 亚洲小视频在线播放| 国产理论电影在线观看| 91亚洲国产成人精品一区二区三| 91亚洲精品一区二区| 人人妻人人爽人人澡人人精品| 黄色成人在线网址| 欧美成aaa人片免费看| 国产jizz18女人高潮| 精品免费在线| 亚洲日韩中文字幕在线播放| 黄色av网址在线观看| 99精品中文字幕在线不卡 | 国产av无码专区亚洲av| 麻豆91小视频| 国产精品一区二区三区久久久 | 老鸭窝毛片一区二区三区| 97在线免费观看视频| 日本三级理论片| 精品电影一区| 久久免费少妇高潮久久精品99| 青娱乐免费在线视频| 亚洲成人三区| 欧美另类暴力丝袜| 久久久久久免费观看| 黑人一区二区三区四区五区| 欧美高跟鞋交xxxxhd| 久久网中文字幕| 国产伊人精品| 91高清视频在线免费观看| 波多野结衣国产| 鲁大师成人一区二区三区| 日韩美女中文字幕| 波多野结衣一区二区三区四区| 日韩成人一级大片| 国产日韩欧美日韩大片| av一区二区三| 国内精品写真在线观看| 动漫一区二区在线| 天天操天天干天天| 国产日韩欧美激情| 熟妇熟女乱妇乱女网站| 日本动漫同人动漫在线观看| 欧美日韩国产色| 日韩有码免费视频| 亚洲欧美在线人成swag| 日韩美女一区二区三区四区| 性农村xxxxx小树林| 欧美一区二区三区久久| 国产亚洲在线播放| 9999热视频| 99av国产精品欲麻豆| 国产精品69久久久久| 国产精品欧美久久久久天天影视| 国产成人一级电影| 国产欧美日韩综合精品二区| 黄色视屏网站在线免费观看| 国产精品久久久久精k8| 91黄色在线看| 日本美女久久| 精品国产露脸精彩对白| 中国美女乱淫免费看视频| 日韩理论在线| 97国产在线视频| 中文字幕第99页| 成人精品视频.| 日韩理论片在线观看| 精品一性一色一乱农村| 在线影视一区二区三区| 最新国产精品自拍| 欧美亚洲激情| 78色国产精品| 国产熟女精品视频| 久久天天做天天爱综合色| 青青草原网站在线观看| 韩日成人影院| 亚洲第一精品福利| 中文字幕无码日韩专区免费| 亚洲一区观看| 97人人香蕉| 3p在线观看| 日韩欧美国产视频| 又大又长粗又爽又黄少妇视频| 欧洲美女日日| 2019中文字幕在线观看| 亚洲乱码在线观看| 一区免费观看视频| 国产区二区三区| 天海翼精品一区二区三区| 欧美人与性动交| 国产毛片毛片毛片毛片| 国产欧美一区二区精品性 | 久久99久久99小草精品免视看| 精品视频导航| 草草影院在线| 欧美电影免费提供在线观看| 国产一区在线观看免费| 久久综合五月| 欧美 日韩 国产在线| 俺来也官网欧美久久精品| 日韩三级高清在线| 欧美色图亚洲天堂| 国产一区二区三区免费| 亚洲欧洲免费无码| 国产精品麻豆成人av电影艾秋| 日韩av在线最新| 亚洲精品午夜久久久久久久| 国产成人av电影在线| 日本精品免费视频| 午夜不卡一区| 久久久精品久久| 国产一区二区在线不卡| 国产精品久久久久精k8| 亚洲欧美日本一区二区三区| 久久精品国产大片免费观看| 国产精品免费观看在线| 国产精品秘入口| 欧美色区777第一页| 国产精品免费无码| 日本一不卡视频| 亚洲国产精品一区二区第一页| 国产成人福利夜色影视| 宅男66日本亚洲欧美视频| 亚洲一级片免费看| 中文字幕一区二区三区色视频| 天天看片天天操| 中文字幕一区二区精品区| 成人欧美一区二区三区在线| a级网站在线播放| 亚洲成人xxx| 欧美a∨亚洲欧美亚洲| 久久久久久久久蜜桃| 97公开免费视频| 久久电影院7| 7777精品伊久久久大香线蕉语言| 免费在线播放电影| 亚洲精品xxx| 精品视频一二三区| 亚洲欧洲日韩在线| 极品人妻一区二区| 亚洲麻豆一区| 日本在线播放一区| 国产精品美女久久久久| 97色伦亚洲国产| 都市激情一区| 欧美一区二区视频网站| 日操夜操天天操| 国产三区在线成人av| 日韩在线一区视频| 亚洲日本视频| 在线码字幕一区| 国产精品2023| 国产精品欧美日韩一区二区| 3d玉蒲团在线观看| 亚洲欧美在线x视频| 一区二区三区日| 欧美日韩国产综合新一区 | 亚洲国产视频a| 新91视频在线观看| 国产麻豆精品一区二区| 日本一区二区黄色| 亚洲精品97| 欧美日韩天天操| 精品国产亚洲一区二区三区在线 | 日韩在线欧美在线| 噜噜噜久久,亚洲精品国产品| 91国产免费看| 国产亚洲精品码| 国产精品色呦呦| 精品无码在线视频| 国产真实乱对白精彩久久| 欧美日韩在线一| 一区二区日韩欧美| 日韩欧美99| 日本午夜精品| 91蜜桃网站免费观看| 97人人做人人爽香蕉精品| 久久久久国产精品一区| 日本中文字幕视频在线| 亚洲男人天堂九九视频| 亚洲成人av综合| 91精品国产福利| 中文字幕在线播放日韩| 欧美视频在线视频| 国产性猛交普通话对白| 亚洲天堂a在线| 超碰人人干人人| 久久夜色精品一区| 小毛片在线观看| 国产精品888| 四季av一区二区三区| 日韩电影在线观看一区| 欧美人成在线观看| 国语对白精品一区二区| 国产对白在线播放| 97国产成人高清在线观看| 日本高清不卡一区二区三| 免费看久久久| 狠狠久久综合婷婷不卡| 999国产精品一区| 国产精品免费一区二区三区四区 | 日韩亚洲视频在线| 亚洲涩涩av| 久久久久久久久一区| 极品尤物一区| 国内精品视频免费| 红杏aⅴ成人免费视频| 国产91社区| 盗摄系列偷拍视频精品tp| 成人激情直播| 国产精品久久久久久久久久白浆| av日韩中文字幕| 日本一区二区乱| 亚洲最大的网站| 日韩免费一级| 国产高清不卡av| 国产精品美女在线观看直播| 国产91免费视频| 天天久久夜夜| 日韩性感在线| 久久久国产精品| 一本色道久久88亚洲精品综合| 亚洲国产成人精品女人| 神马午夜伦理影院| 欧美日韩综合| 国模无码视频一区二区三区| 国产亚洲亚洲| 爱情岛论坛vip永久入口| 日本亚洲欧美天堂免费| www.国产视频.com| 国产精品亚洲一区二区三区在线| 91精品人妻一区二区三区蜜桃2| 成人晚上爱看视频| a视频免费观看| 中文字幕欧美国产| 污软件在线观看| 亚洲国产视频a| 在线观看你懂的网站| 在线播放一区二区三区| 丰满肥臀噗嗤啊x99av| 日韩高清不卡av| 色网站在线看| 欧美精品九九久久| 欧洲av不卡| 91亚洲一区精品| 中文字幕中文字幕精品| 99精品一级欧美片免费播放| 国内精品久久久久久久影视蜜臀| 成熟了的熟妇毛茸茸| 日韩成人av影视| 18深夜在线观看免费视频| 91片在线免费观看| www.5588.com毛片| 欧美性猛交xxxx黑人猛交| 亚洲天堂免费av| 亚洲精品福利免费在线观看| 第一页在线观看| 久久久久久久久久久免费| 成人做爰免费视频免费看| 国产精品一区二区免费| 成人黄色av| 99在线免费视频观看| 久久精品久久综合| 精品人妻一区二区三区日产乱码卜| 国产精品乱码久久久久久| 天堂资源在线播放| 欧美日韩国产免费一区二区| 天堂中文在线资源| 欧美成人第一页| 99久久婷婷国产综合精品首页| 国产精品夜夜夜一区二区三区尤| 久久精品国产亚洲夜色av网站| 欧美深夜福利视频| 国产精品一区二区不卡| 国产手机在线观看| 亚洲黄网站在线观看| 中文字幕+乱码+中文乱码www| 亚洲激情视频网站| www.久久ai| 国产日韩欧美一二三区| 久久av电影| 精品欧美一区免费观看α√| 国产精品亚洲第一区在线暖暖韩国| 国产伦理片在线观看| 无吗不卡中文字幕| 亚洲欧美高清视频| 久久成人免费视频| 四虎精品一区二区免费| 日韩精品在在线一区二区中文| 国产日韩视频| 国产一卡二卡三卡四卡| 夜夜精品浪潮av一区二区三区| 在线观看免费中文字幕| 一区二区欧美在线| 中文字幕色婷婷在线视频| 国产在线视频欧美一区二区三区| 欧美在线网址| 国产精品二区视频| 亚洲伦在线观看| 国产精品无码一区二区桃花视频| 一区二区三区黄色| 日韩av免费| 日本一区二区三区www| 性娇小13――14欧美| av无码一区二区三区| 欧美日韩国产限制| 五月婷婷久久久| 欧美亚洲国产另类| 亚洲人成网亚洲欧洲无码| 国模无码视频一区二区三区| 97国产一区二区| 中文字幕视频网| 亚洲欧美日韩中文视频| 欧美日韩国产v| 日韩福利二区| 久久99久久99| 青青草激情视频| 欧美草草影院在线视频| 都市激情久久综合| 韩日午夜在线资源一区二区| 亚洲免费综合| 欧洲美熟女乱又伦| 欧美日韩大陆在线| 丝袜美腿av在线| 精品欧美一区二区精品久久| 天堂成人国产精品一区| 色综合99久久久无码国产精品| 欧美色电影在线| 菠萝菠萝蜜在线视频免费观看| 亚洲精品日韩激情在线电影| 欧美午夜视频| 亚洲欧美视频在线播放| 91极品美女在线| 黄色一级片在线观看| 粉嫩av四季av绯色av第一区| 亚洲免费播放| 亚洲色图 激情小说| 91精品啪在线观看国产60岁| 免费在线中文字幕| 欧美日本韩国国产| 国产一区二区三区黄视频 | 在线精品高清中文字幕| 伊人久久综合网另类网站| 欧洲精品一区二区三区久久| 久久久久免费观看| 国产欧美一区二区三区视频在线观看| 欧美高清视频免费观看| 亚洲系列另类av| 亚洲国产欧美91| 欧美性20hd另类| 老司机福利在线视频| 精品欧美国产| 久久电影网站中文字幕| 日产欧产va高清| 日韩中文字幕视频在线| 国产精品成人自拍| 亚洲欧美偷拍另类| 精品国产精品三级精品av网址| 91成人高清| 国产欧美韩日| 狠狠色丁香久久婷婷综合丁香| 日本少妇性高潮| 日韩中文字幕视频在线| 亚洲精品动态| 中文字幕视频观看| 欧美人妇做爰xxxⅹ性高电影|