精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

周靖人署名,通義實驗室開源智能體自進化系統(tǒng):讓模型學會“自我反思”,14B也能越級打怪

人工智能 新聞
通過自我提問、自我導航、自我歸因三個模塊,AgentEvolver可以在開放環(huán)境中自主演化出行為能力。

智能體自進化,阿里開源了新成果。

通義實驗室提出了一種能夠自進化的智能體系統(tǒng)——AgentEvolver。

通過自我提問、自我導航、自我歸因三個模塊,AgentEvolver可以在開放環(huán)境中自主演化出行為能力。

在相同規(guī)模的14B模型上,AgentEvolver將基準模型的平均完成率從29.8%大幅提高到57.6%。

目前該系統(tǒng)已在GitHub上線,技術報告也同步發(fā)布,作者署名當中包括了阿里副總裁、阿里云智能CTO周靖人。

模型智能體效果飛升

從綜合性能來看,AgentEvolver在AppWorld和BFCL v3等長程復雜任務基準測試中展現(xiàn)了驚人的爆發(fā)力。

以14B模型為基座,其任務平均完成率(avg@8)從29.8%飆升至57.6%,實現(xiàn)了近乎翻倍的性能增長;在最佳嘗試(best@8)指標上,更是達到了76.7%的高位。

在更小參數(shù)量的7B模型上的提升也同樣顯著,平均完成率從15.8%躍升至45.2%,證明了該框架對不同規(guī)模模型的普適性增強能力。

這種進化不僅體現(xiàn)在分數(shù)的增長,更帶來了“越級挑戰(zhàn)”的效果,經(jīng)過強化后的14B模型,在特定任務上的表現(xiàn)已經(jīng)超越了未經(jīng)過同類優(yōu)化的32B乃至更大參數(shù)量的模型(如Qwen2.5-32B)。

除了最終效果的上限被拔高,AgentEvolver在學習效率上也表現(xiàn)出了極速收斂的特性。

實驗表明,在達到基線模型90%性能水平時,AgentEvolver所需的訓練步數(shù)大幅減少,在AppWorld任務中減少了55.6%,在BFCL任務中更是減少了66.7%。

這意味著它不僅學得更好,而且學得更快,極大地降低了訓練的時間成本和算力消耗。

并且這種自進化獲得的能力具備極強的跨域泛化性。

研究人員發(fā)現(xiàn),僅使用合成數(shù)據(jù)訓練出的模型,在遷移到未曾見過的全新領域時,依然保持了極高的性能。

例如,在AppWorld上訓練的模型直接用于解決BFCL任務時,性能衰減微乎其微。

這說明AgentEvolver并非是在記憶特定環(huán)境的題庫,而是真正掌握了通用的工具使用與推理邏輯能力。

AgentEvolver如何實現(xiàn)自進化?

AgentEvolver的本質(zhì)是利用LLM自身的理解力,構建了一個數(shù)據(jù)-探索-反饋的自動化流程。

從整體架構來看,系統(tǒng)由Master節(jié)點統(tǒng)一調(diào)度,驅動著由任務生成、軌跡采樣、經(jīng)驗總結和模型優(yōu)化這四個階段構成的自動化閉環(huán),實現(xiàn)了無需人工干預的持續(xù)迭代。

為了支持大規(guī)模訓練,框架采用了服務化解耦設計,將環(huán)境服務、模型服務和封裝了Agent邏輯的執(zhí)行層拆分為獨立服務。

針對長程任務中Token消耗大、記憶管理難的痛點,系統(tǒng)還引入了上下文管理器,在保證推理連貫性的同時,有效控制了顯存開銷,并支持從滑動窗口到自主記憶管理的多種策略。

系統(tǒng)內(nèi)置了基礎因果、推理增強、滑動窗口以及自主上下文管理四種典型范式,涵蓋了從追求極致效率到賦予Agent主動刪減記憶權利的不同需求。

在此架構支撐下,AgentEvolver通過三個核心機制——自我提問、自我導航與自我歸因——實現(xiàn)了能力的自主演化。

自進化的邏輯起點始于對環(huán)境的主動認知與任務構建。

面對新環(huán)境無任務可做的冷啟動困境,系統(tǒng)通過自我提問(Self-Questioning)機制,利用LLM的生成能力結合環(huán)境探索中感知的特征(如API功能或界面布局),主動合成具有挑戰(zhàn)性且符合邏輯的候選任務來構建訓練課程。

這使得系統(tǒng)能夠自動生產(chǎn)出覆蓋不同難度和多樣性的訓練集,有效打破了對外部數(shù)據(jù)的依賴,解決了強化學習中常見環(huán)境適應性差的問題。

當訓練課程確立后,如何避免在復雜環(huán)境中的盲目試錯,決定了進化的速度。

對此,系統(tǒng)引入了自我導航(Self-Navigating)機制來破解低效探索的難題。

該機制將歷史探索中的成功軌跡和失敗教訓抽象為結構化的文本經(jīng)驗。

在執(zhí)行新任務時,智能體不再是從零開始,而是能夠通過檢索相似的過往經(jīng)驗,利用上下文學習指導當前的決策路徑。

這種機制讓智能體具備了“舉一反三”的能力,能夠避開已知的錯誤路徑,顯著提高了探索成功率。

而在執(zhí)行環(huán)節(jié)之外,如何從成敗中提取精準的反饋信號,同樣是決定進化質(zhì)量的關鍵。

針對長程任務中往往只有做完最后一步才知道成敗的獎勵稀疏痛點,AgentEvolver設計了自我歸因(Self-Attributing)機制。

系統(tǒng)引入了基于LLM的過程獎勵模型,不再粗放地依賴最終結果,而是對軌跡中的每一個動作步驟進行細粒度的因果分析和打分。

這種機制將粗粒度的結果獎勵轉化為細粒度的過程監(jiān)督信號,極大地提升了策略優(yōu)化的樣本效率,確保每一次嘗試都能轉化為有效的學習信號。

GitHub:https://github.com/modelscope/AgentEvolver
技術報告:https://arxiv.org/abs/2511.10395

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-08-26 09:08:00

2025-01-27 13:30:00

2025-07-30 09:07:00

2015-11-12 13:11:17

TensorFlow人工智能系統(tǒng)谷歌

2025-10-22 09:00:00

2019-01-31 09:00:00

開源實驗室管理系統(tǒng)

2024-11-20 09:38:40

2025-09-23 03:00:00

2025-06-12 08:46:00

2025-07-22 10:45:55

2023-10-17 12:33:27

AI模型

2021-08-04 09:48:05

數(shù)字化

2024-06-13 09:20:26

2013-04-07 09:38:00

HPC硬件HPC高性能計算

2025-09-18 10:10:31

2025-07-31 02:00:00

智能體Agent人工超級智能

2023-06-01 12:48:43

阿里云AI助手AI

2025-10-17 09:00:00

AI模型代碼

2025-08-14 09:00:00

模型訓練數(shù)據(jù)

2025-03-10 12:09:37

點贊
收藏

51CTO技術棧公眾號

午夜精品久久久久久99热软件 | 亚洲人av在线影院| 啊啊啊国产视频| 黄色网页网址在线免费| fc2成人免费人成在线观看播放| 日av在线播放中文不卡| 中文字幕资源站| 亚洲精品推荐| 日韩一级黄色大片| 国产免费视频传媒| 久久久123| 国产精品毛片久久久久久| 国产精品swag| 国产又粗又猛又爽| 天堂精品中文字幕在线| 欧美激情精品久久久久久免费印度 | 樱花www成人免费视频| 国精产品一品二品国精品69xx| 肉肉av福利一精品导航| 欧美高清第一页| 午夜黄色福利视频| 一区三区在线欧| 精品不卡在线视频| 日韩视频在线观看一区二区三区| 成人爽a毛片免费啪啪| 一区二区三区日韩在线观看| 视频在线观看成人| 久草福利在线视频| 99久久精品情趣| 99视频在线免费观看| 国产在成人精品线拍偷自揄拍| 999国产精品视频免费| 肉肉视频在线观看| 国产精品久久久久久久久免费相片| 精品久久久久亚洲| 丰满人妻一区二区| 成人中文字幕电影| 91精品国产91久久久久青草| 亚洲一区二区激情| 热久久久久久久| 日本伊人精品一区二区三区介绍| 91国产精品电影| 成人在线观看a| 欧美男人天堂| 婷婷六月综合亚洲| 99热亚洲精品| 福利写真视频网站在线| 艳妇臀荡乳欲伦亚洲一区| 樱花www成人免费视频| 在线观看h片| 欧美国产激情一区二区三区蜜月| 国产原创精品| 天堂中文资源在线观看| 成人国产在线观看| 精品国产一区二区三区免费| 国产91免费看| 99精品视频在线播放观看| 国产精品免费在线播放| 国产 日韩 欧美 综合| 粉嫩av一区二区三区粉嫩| 96成人在线视频| 高h放荡受浪受bl| 成人av网站在线| 久久亚洲高清| 免费黄色在线视频网站| 久久久99精品免费观看不卡| 手机成人在线| 国产高清一区二区三区视频| 一区二区三区欧美日韩| 99在线精品免费视频| 两个人看的在线视频www| 欧美香蕉大胸在线视频观看| 亚洲五月天综合| 成人全视频在线观看在线播放高清| 在线免费视频一区二区| 91 在线视频观看| 日本免费一区二区三区视频| 精品国产乱码久久久久久夜甘婷婷| 久久性爱视频网站| 精品国产网站| 久久亚洲一区二区三区四区五区高| 538任你躁在线精品视频网站| 伊人狠狠色j香婷婷综合| 456亚洲影院| 91麻豆国产视频| 国产成人av电影在线播放| 久久久久国产精品视频| freemovies性欧美| 一区二区三区四区在线播放 | 欧美日韩高清一区二区| 日韩欧美中文视频| 91夜夜蜜桃臀一区二区三区| 亚洲精品视频免费| 午夜成人亚洲理伦片在线观看| 欧美日本三区| 国产成人精品av| 99热精品在线播放| 久久免费的精品国产v∧| 在线视频不卡国产| 欧亚在线中文字幕免费| 欧美日韩国产首页| 在线观看国产三级| 偷拍欧美精品| 欧美孕妇性xx| 性做久久久久久久久久| 国产清纯白嫩初高生在线观看91 | 99在线视频免费| 黄页网站一区| 成人福利在线视频| 日本天堂在线| 一个色综合av| 欧美伦理片在线观看| 国产精品网站在线看| 久久国产一区二区三区| 天天干天天干天天干天天| 国产麻豆精品theporn| 欧美日韩中文国产一区发布| 日韩三级免费| 欧美日韩成人综合在线一区二区 | 国产精品乱人伦中文| 18禁网站免费无遮挡无码中文| 六九午夜精品视频| 亚洲人成五月天| 97超碰人人干| 成人在线视频一区二区| 国产精品一区在线免费观看| yy6080久久伦理一区二区| 精品呦交小u女在线| 久久免费公开视频| 国产在线看一区| 亚洲精品自在在线观看| 婷婷激情一区| 亚洲欧美日韩一区在线| 女人十八岁毛片| 丁香亚洲综合激情啪啪综合| 中文字幕中文字幕在线中一区高清| 欧美gay视频| 日韩av网址在线| 国产无遮挡又黄又爽| 国产电影精品久久禁18| 精品日韩在线播放| 国产精品一区二区三区四区在线观看 | 亚洲欧美日韩国产综合在线| 91制片厂毛片| 欧美肥老太太性生活| 国产精品男女猛烈高潮激情| 精品成人一区二区三区免费视频| 精品福利在线观看| yy1111111| 中文国产一区| 你懂的网址一区二区三区| 麻豆视频在线观看免费网站黄| 亚洲аv电影天堂网| 日本熟妇毛耸耸xxxxxx| av午夜一区麻豆| 日韩免费一级视频| 亚洲素人在线| 国产美女精品免费电影| 久做在线视频免费观看| 欧美一级夜夜爽| 国产在线观看免费视频今夜| av高清不卡在线| 啊啊啊一区二区| 欧美日韩播放| 国产精品网址在线| 成人在线免费看片| 亚洲成人网在线| 在线观看日本网站| 国产精品无圣光一区二区| 亚洲欧美手机在线| 欧美日韩久久| 久久99导航| 日韩精品一区二区三区av| 久久久精品网站| 蜜桃在线一区二区| 色拍拍在线精品视频8848| 日韩av片在线免费观看| 国产经典欧美精品| 国产精品va无码一区二区| 国产一区二区三区网| 成人h猎奇视频网站| 免费污视频在线观看| 日韩精品在线免费| 国产精品久久久久久久免费看| 一区二区三区美女视频| 精品人伦一区二区三电影| 精油按摩中文字幕久久| 久久久久免费看黄a片app| 欧美三级美国一级| av资源站久久亚洲| 精品日韩视频| 欧美日韩成人在线播放| 毛片免费在线| 精品国产制服丝袜高跟| 男人天堂视频网| 亚洲小说欧美激情另类| 国产探花视频在线| 99久久国产综合精品女不卡| 久久6免费视频| 亚洲在线一区| 国产 欧美 日韩 一区| 欧美色图国产精品| 九九九九精品| 亚洲精品观看| 国产色婷婷国产综合在线理论片a| av老司机免费在线| 日韩在线播放av| 精品影院一区| 亚洲精品一线二线三线| 一卡二卡在线观看| 日本精品一区二区三区高清 | 国产精品视频免费一区| 青娱乐极品盛宴一区二区| 欧美一级大胆视频| 毛片在线导航| www亚洲欧美| 浮生影视网在线观看免费| 亚洲电影在线观看| 亚洲国产精品二区| 欧美顶级少妇做爰| 波多野结衣视频免费观看| 亚洲国产精品久久久久秋霞影院| 午夜激情福利电影| 中文字幕免费一区| 亚洲AV无码片久久精品| 99免费精品视频| 中国老熟女重囗味hdxx| 麻豆精品一区二区综合av| 精品久久久久av| 很黄很黄激情成人| www.黄色网址.com| 一区二区在线影院| 日韩精品极品视频在线观看免费| 欧美日韩另类图片| 国产综合18久久久久久| caoporn成人| 97人人模人人爽人人少妇| 国产视频一区二区在线播放| 国产欧美va欧美va香蕉在线| 国产原创一区| 国产在线播放91| 国产一区二区三区影视| 国产精品美女久久| 欧美a一级片| 91香蕉亚洲精品| 国产日韩欧美中文在线| 亚洲综合av影视| 秋霞一区二区三区| 操人视频欧美| 美女网站色精品尤物极品姐弟| 国产伦精品一区二区三区免费视频| 99re8这里有精品热视频免费| www 成人av com| 精品三级av| 欧美日韩在线观看一区| 青青草综合网| 亚洲欧美一二三| 欧美深夜福利| 国产午夜福利在线播放| 国产精品入口| 国产理论在线播放| 国产一区二区视频在线| 精品人妻一区二区免费| 久久伊99综合婷婷久久伊| 亚洲黄色免费视频| 最新成人av在线| 国产亚洲精久久久久久无码77777| 亚洲h精品动漫在线观看| 中日韩黄色大片| 欧美日韩一区二区电影| 国产色综合视频| 亚洲精品一区二区三区香蕉| 四虎在线视频| 日韩在线视频观看| 国产福利在线免费观看| 人体精品一二三区| 电影一区中文字幕| 国产视频99| 成人精品视频| 4444在线观看| 久久久人人人| 巨乳女教师的诱惑| 久久只精品国产| 四虎影院中文字幕| 亚洲国产成人tv| 久草热在线观看| 精品99一区二区三区| 国产区在线视频| 欧美人与性动交a欧美精品| 成人免费网站视频| 亚洲自拍高清视频网站| 美日韩中文字幕| www.18av.com| 日本不卡一二三区黄网| 色哟哟无码精品一区二区三区| 久久精品无码一区二区三区| 精品国产乱码久久久久久鸭王1| 天天操天天干天天综合网| 一区二区的视频| 亚洲精品乱码久久久久久金桔影视| 香蕉视频国产在线观看| 91精品国产色综合久久不卡98口| 欧美黄页免费| 久久人人爽爽人人爽人人片av| 亚洲女同另类| 黄色免费网址大全| 99久久精品情趣| 久草视频在线资源站| 欧美日韩极品在线观看一区| 日本aaa在线观看| 久久免费少妇高潮久久精品99| 欧美一级做a| 欧美在线一区二区三区四区| 亚洲老妇激情| 色哟哟精品视频| 久久精品亚洲精品国产欧美kt∨| 久久久久亚洲av片无码下载蜜桃| 欧美日韩国产免费一区二区| 男人天堂亚洲二区| 在线观看一区| 青青青在线视频播放| 精品一区二区久久久| 一级黄色片网址| 一本一道波多野结衣一区二区| 丰满大乳国产精品| 久久中文字幕在线| 欧美天堂一区二区| 国产 高清 精品 在线 a| 一本到12不卡视频在线dvd| 成人日韩在线视频| 国产精品国产三级国产普通话99| 午夜精品免费观看| 亚洲欧美激情精品一区二区| f2c人成在线观看免费视频| 成人av免费电影| 国产精品黄色| 人妻巨大乳一二三区| 亚洲视频一区在线观看| 国产又粗又猛又爽又黄的| 日韩在线资源网| 久久精品国产福利| 一区二区不卡视频| 久久99久久久欧美国产| www中文在线| 欧美一区日韩一区| 91亚洲天堂| 高清免费日韩| 99在线观看免费视频精品观看| 久久人妻一区二区| 精品久久久久人成| 青青草在线免费观看| 国产成人精品一区二区在线 | 亚洲欧美成人精品| 大胆人体一区二区| 亚洲不卡1区| 精品一区二区三区在线观看 | 91久久国产精品| 欧美韩国一区| 亚洲精品国产成人av在线| 精品成人国产在线观看男人呻吟| 天堂在线中文资源| 91av在线免费观看视频| 精品国产一区二区三区噜噜噜| 久久久精品麻豆| 亚洲免费av高清| 六月婷婷综合网| 欧美亚洲在线观看| 欧美亚洲激情| 久久精品视频在线观看免费| 一区二区三区四区在线免费观看| 人人妻人人澡人人爽精品日本| 5566日本婷婷色中文字幕97| 国产影视一区| 色男人天堂av| 欧美特级www| 男人影院在线观看| 国内一区二区在线视频观看| 肉色丝袜一区二区| 欧美成人一区二区三区高清| 日本在线中文字幕一区| 韩日视频在线观看| 久久久91精品国产一区二区精品 | 久久99精品久久久久久国产越南 | 一区在线播放| 91l九色lporny| 日韩视频在线你懂得| 三妻四妾完整版在线观看电视剧 | 欧美草草影院在线视频| 中文字幕资源网在线观看免费| 色阁综合av| 国产成人精品免费在线| 黄色av一级片| 精品中文字幕在线| 国内黄色精品| a级片在线观看视频| 在线观看免费成人| 国产丝袜精品丝袜| 亚洲高清视频一区二区| 成人av动漫在线| 一区二区三区亚洲视频|