精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

突破多智能體系統(tǒng)邊界,開源方案OWL超越OpenAI Deep Research,獲17k star

人工智能 新聞
研究團(tuán)隊(duì)提出的 Workforce 框架通過創(chuàng)新的「解耦設(shè)計(jì)」理念,解決了跨領(lǐng)域遷移難題。

港大、camel-ai 等多家機(jī)構(gòu)聯(lián)合提出了一種名為新的名為 Workforce 的創(chuàng)新多智能體框架,以及配套的 OWL(Optimized Workforce Learning)訓(xùn)練方法,在通用 AI Assistant 的標(biāo)桿基準(zhǔn)測試 GAIA 上取得了 69.70% 的準(zhǔn)確率,不僅刷新了開源系統(tǒng)的最佳紀(jì)錄,更是超越了多家商業(yè)系統(tǒng)以及 OpenAI Deep Research 的開源方案。

該研究成果所有代碼均已開源,目前已經(jīng)在 github 上收獲了 17k 的 star。

圖片

  • 論文標(biāo)題:OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation
  • 論文地址:https://arxiv.org/abs/2505.23885
  • 項(xiàng)目代碼:https://github.com/camel-ai/owl

圖片

圖片

背景與挑戰(zhàn):多智能體系統(tǒng)的「領(lǐng)域壁壘」

隨著 LLM 的飛速發(fā)展,單一智能體在處理復(fù)雜現(xiàn)實(shí)任務(wù)時(shí)逐漸暴露出局限性。為此,多智能體系統(tǒng)(MAS)應(yīng)運(yùn)而生,通過讓多個(gè)專門化的智能體協(xié)作完成復(fù)雜任務(wù),顯著提升了系統(tǒng)的整體性能。然而,當(dāng)前的多智能體系統(tǒng)普遍面臨一個(gè)核心問題:跨領(lǐng)域遷移能力嚴(yán)重不足。現(xiàn)有系統(tǒng)往往針對特定領(lǐng)域深度定制,這種設(shè)計(jì)模式帶來了兩大弊端:

  1. 推理層面的限制:部署到新領(lǐng)域往往需要重新設(shè)計(jì)整個(gè)系統(tǒng)架構(gòu)。例如,專為軟件工程設(shè)計(jì)的 MetaGPT 框架依賴于特定的標(biāo)準(zhǔn)操作程序,難以直接應(yīng)用到其他領(lǐng)域。
  2. 訓(xùn)練層面的挑戰(zhàn):現(xiàn)有方法通常需要對所有智能體進(jìn)行全量訓(xùn)練。以 MALT 為例,其固定的生成器 - 驗(yàn)證器 - 改進(jìn)器流水線要求對每個(gè)組件分別進(jìn)行訓(xùn)練,遷移成本極高。

這些局限性制約了多智能體系統(tǒng)的靈活性和可擴(kuò)展性,迫切需要一種更加通用、模塊化的解決方案。

創(chuàng)新突破:Workforce 架構(gòu)的「解耦設(shè)計(jì)」

研究團(tuán)隊(duì)提出的 Workforce 框架通過創(chuàng)新的「解耦設(shè)計(jì)」理念,解決了跨領(lǐng)域遷移難題。該框架將系統(tǒng)分解為三個(gè)核心組件:

  1. 領(lǐng)域無關(guān)的規(guī)劃器(Planner Agent),其負(fù)責(zé)分析輸入任務(wù)并將其分解為若干子任務(wù),基于高層目標(biāo)生成抽象的任務(wù)分解策略。這個(gè)組件是整個(gè)系統(tǒng)的大腦,其設(shè)計(jì)完全獨(dú)立于具體應(yīng)用領(lǐng)域。
  2. 智能協(xié)調(diào)器(Coordinator Agent),作為中央?yún)f(xié)調(diào)機(jī)制,負(fù)責(zé)將子任務(wù)分配給最適合的工作節(jié)點(diǎn),同時(shí)管理任務(wù)依賴關(guān)系并整合中間結(jié)果。協(xié)調(diào)器通過共享的 任務(wù)通道實(shí)現(xiàn)高效的通信管理。
  3. 專業(yè)工作節(jié)點(diǎn)(Worker Nodes),由一個(gè)或多個(gè)專門化智能體組成,配備特定的能力和工具包來執(zhí)行分配的子任務(wù)。工作節(jié)點(diǎn)可以根據(jù)應(yīng)用需求靈活替換或添加,無需修改核心規(guī)劃機(jī)制。

這種模塊化架構(gòu)的最大優(yōu)勢在于實(shí)現(xiàn)了「穩(wěn)定核心,可變外圍」的設(shè)計(jì)哲學(xué)。當(dāng)需要適應(yīng)新領(lǐng)域時(shí),只需更換或添加相應(yīng)的工作節(jié)點(diǎn),而規(guī)劃器和協(xié)調(diào)器可以保持不變,大大降低了系統(tǒng)遷移的復(fù)雜度和成本。

圖片

技術(shù)創(chuàng)新:OWL 訓(xùn)練方法的「精準(zhǔn)優(yōu)化」

在 Workforce 架構(gòu)基礎(chǔ)上,研究團(tuán)隊(duì)進(jìn)一步提出了 OWL(Optimized Workforce Learning)訓(xùn)練方法,專注于優(yōu)化核心規(guī)劃器的能力,而非對整個(gè)系統(tǒng)進(jìn)行全量訓(xùn)練。整體采用兩階段訓(xùn)練策略:

  1. 第一階段:監(jiān)督微調(diào)(SFT),使用專家演示數(shù)據(jù)對規(guī)劃器進(jìn)行初始化訓(xùn)練,讓其掌握基礎(chǔ)的任務(wù)分解技能。研究團(tuán)隊(duì)精心構(gòu)建了包含 1599 個(gè)高質(zhì)量軌跡的訓(xùn)練數(shù)據(jù)集,涵蓋在線信息搜索、推理、多模態(tài)處理等多個(gè)能力維度。
  2. 第二階段:強(qiáng)化學(xué)習(xí)優(yōu)化,采用直接偏好優(yōu)化(DPO)算法進(jìn)一步提升規(guī)劃器的決策質(zhì)量,使其能夠發(fā)展出超越簡單模仿的復(fù)雜決策能力。

這種精心設(shè)計(jì)的課程確保了規(guī)劃器能夠處理現(xiàn)實(shí)世界中的各種復(fù)雜任務(wù)類型。

實(shí)驗(yàn)驗(yàn)證:全面超越現(xiàn)有基準(zhǔn)

研究團(tuán)隊(duì)在 GAIA 基準(zhǔn)測試上進(jìn)行了全面的實(shí)驗(yàn)驗(yàn)證。GAIA 是評估通用 AI 助手的權(quán)威基準(zhǔn),要求系統(tǒng)具備多模態(tài)理解、網(wǎng)絡(luò)搜索、代碼執(zhí)行和復(fù)雜推理等綜合能力。

在多智能體推理方面,Workforce 展現(xiàn)出了顯著優(yōu)勢,在 GAIA 的 validation 集上 pass@1 達(dá)到了 69.70% 的準(zhǔn)確率,大幅超越此前最好的開源系統(tǒng),并超越了 OpenAI Deep Research(67.36%)等強(qiáng)大的商業(yè)系統(tǒng)。

圖片

在 OWL 訓(xùn)練方法效果驗(yàn)證方面,OWL 的訓(xùn)練設(shè)計(jì)使 Qwen2.5-32B-Instruct 模型在 GAIA 上的性能從 36.36% 提升到了 52.73%,超越了未訓(xùn)練的 72B 模型(49.09%),并在 Level 3 任務(wù)上達(dá)到了與 GPT-4o 相當(dāng)?shù)男阅埽?6.92%)。

圖片

深入的分析實(shí)驗(yàn)揭示了 Workforce 框架的多項(xiàng)優(yōu)勢:

  1. 跨能力維度維持穩(wěn)定:Workforce 框架在各個(gè)能力維度都展現(xiàn)出優(yōu)勢,無論任務(wù)需要 1 種、2 種還是 3 種以上的能力,Workforce 都能保持穩(wěn)定的性能表現(xiàn),而單智能體方法在多能力任務(wù)上出現(xiàn)顯著性能下降。
  2. 測試時(shí)自我糾錯(cuò):通過 Workforce 設(shè)計(jì)的任務(wù)失敗時(shí)觸發(fā)的自我反思與重新規(guī)劃機(jī)制,系統(tǒng)能夠在測試時(shí)動(dòng)態(tài)調(diào)整策略,隨著重新規(guī)劃次數(shù)增加,性能持續(xù)提升,展現(xiàn)出強(qiáng)大的自我糾錯(cuò)和進(jìn)化能力。
  3. 模塊化訓(xùn)練優(yōu)勢:對比實(shí)驗(yàn)顯示,僅訓(xùn)練規(guī)劃器就能達(dá)到與訓(xùn)練全部組件相近的性能,同時(shí)大幅降低計(jì)算成本,驗(yàn)證了規(guī)劃器優(yōu)先設(shè)計(jì)理念的正確性。

圖片


圖片

實(shí)際應(yīng)用:真實(shí)環(huán)境下的諸多挑戰(zhàn)

由于真實(shí)世界任務(wù)的復(fù)雜性和不穩(wěn)定性,在真實(shí)環(huán)境中解決問題會(huì)面臨諸多挑戰(zhàn)。對此,研究團(tuán)隊(duì)進(jìn)行了深入分析,將挑戰(zhàn)主要分為以下幾類:

  1. 信息源差異:同一查詢在不同信息源可能得到不同答案。
  2. 信息時(shí)效性:網(wǎng)絡(luò)信息的動(dòng)態(tài)變化可能導(dǎo)致預(yù)期答案失效。
  3. 語言歧義性:用戶查詢中的模糊表達(dá)需要系統(tǒng)進(jìn)行智能推理和消歧。
  4. 網(wǎng)絡(luò)環(huán)境限制:網(wǎng)絡(luò)不穩(wěn)定、訪問權(quán)限限制等現(xiàn)實(shí)問題都需要系統(tǒng)妥善處理。

結(jié)論:通向通用人工智能的新路徑

 OWL 的成功為構(gòu)建真正通用的人工智能系統(tǒng)開辟了一種新的路徑。其中,Workforce 的模塊化設(shè)計(jì)和跨領(lǐng)域遷移能力,帶來了以下優(yōu)勢:

  1. 架構(gòu)層面:通過解耦設(shè)計(jì)實(shí)現(xiàn)系統(tǒng)的高度模塊化,既保證了核心能力的穩(wěn)定性,又提供了外圍功能的靈活性。
  2. 訓(xùn)練層面:專注于核心組件的優(yōu)化而非全系統(tǒng)訓(xùn)練,顯著提高了訓(xùn)練效率和遷移能力。
  3. 應(yīng)用層面:為各種實(shí)際應(yīng)用場景提供了即插即用的解決方案,大大降低了部署門檻。

通過將即插即用的工作節(jié)點(diǎn)與可泛化的規(guī)劃核心相結(jié)合,該方法能夠?yàn)橥ㄓ?AI 助手提供可擴(kuò)展的基礎(chǔ),加速通用 AI 助手的研究進(jìn)程。


責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-08-18 08:30:00

AI模型開源

2023-12-21 08:02:31

React DnD拖拽庫組件

2025-06-06 14:17:11

模型訓(xùn)練AI

2025-02-06 15:07:27

2025-02-06 08:12:41

2025-03-10 10:26:16

2025-04-25 09:09:00

2025-02-27 09:45:50

2024-10-15 17:28:05

2025-07-08 09:22:31

2025-08-26 03:15:00

MASLLM映射

2022-07-11 09:59:19

GitHub開源

2025-08-27 01:45:00

多智能LLM系統(tǒng)

2025-02-03 12:07:52

2025-08-12 08:58:03

2025-07-10 10:21:19

2025-04-25 10:26:19

2025-05-06 08:40:00

2025-09-17 14:47:51

2025-11-10 08:45:00

智能體AI開源
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

午夜影院免费在线| 亚洲欧美另类日韩| 日韩欧美一区免费| 欧美一级高清片在线观看| 天堂а√在线中文在线 | 欧美午夜在线观看| 日本xxxxx18| 九色国产在线观看| 国产风韵犹存在线视精品| 2021久久精品国产99国产精品| 公肉吊粗大爽色翁浪妇视频| 欧美视频三区| 在线观看日韩高清av| 久久久久久av无码免费网站下载| 日韩精品123| 国产一区二区电影| 国产精品久久9| 国产一级片视频| 波多野结衣的一区二区三区 | 亚洲午夜精品一区 二区 三区| 日韩精品www| xxx中文字幕| 日本一区免费网站| 精品久久久久久久久久国产| 国产精品美女在线播放| 九色蝌蚪在线| 91视频精品在这里| 国产精品美女诱惑| 99国产精品一区二区三区| 日韩高清在线观看| 欧美有码在线观看| 国产在线观看成人| 欧美日韩爆操| 麻豆一区二区在线观看| 三级黄色录像视频| 欧美午夜精彩| 国产午夜精品视频| 少妇按摩一区二区三区| 中文字幕区一区二区三| 欧美一区二区二区| 中文字幕国产高清| 成人日韩视频| 欧美一区二区成人| 三级黄色片播放| 99精品女人在线观看免费视频| 欧美在线视频全部完| 黄在线观看网站| 精精国产xxxx视频在线野外| 亚洲午夜激情网页| 丁香六月激情婷婷| av福利在线导航| 午夜精品一区在线观看| 男人添女荫道口图片| a天堂资源在线| 婷婷综合另类小说色区| 欧美视频在线观看网站| 欧亚av在线| 一本到不卡免费一区二区| 波多野结衣家庭教师在线播放| 成全电影大全在线观看| 亚洲成av人片观看| 男人揉女人奶房视频60分 | 国产精品久久久久99| 国产成人无码一区二区在线播放| 国产一区二区三区久久久久久久久| 国内精品久久久| 豆国产97在线 | 亚洲| 亚洲茄子视频| 日本精品久久中文字幕佐佐木| 一级黄色av片| 紧缚捆绑精品一区二区| 亚洲一区二区免费| 蜜桃av噜噜一区二区三区麻豆| 成人av综合一区| 欧美精品二区三区四区免费看视频 | 免费日韩av片| 91精品免费久久久久久久久| 国产精品怡红院| 成人在线视频首页| 欧美1o一11sex性hdhd| 99reav在线| 一区二区三区在线观看动漫| 91免费黄视频| 欧美free嫩15| 日韩视频永久免费| 91精品人妻一区二区| 日韩中文在线电影| 欧美激情视频播放| 免费的毛片视频| 韩国欧美一区二区| 国产一区国产精品| 日本中文字幕伦在线观看| 亚洲精品老司机| 欧美精品99久久| 99久久99九九99九九九| 亚洲精品videossex少妇| 天天舔天天操天天干| 欧美日韩国产探花| 国产精品日韩一区| 欧美一区二区公司| 国产精品短视频| 九色在线视频观看| 日韩欧美久久| 伊人亚洲福利一区二区三区| 国产一级aa大片毛片| 日韩精品一级中文字幕精品视频免费观看 | 欧美爱爱视频免费看| 亚洲精品大片| 亚洲女人被黑人巨大进入al| 91在线播放观看| 日本一区中文字幕| 精品国产一区二区三区四区vr| 欧美另类极品| 日本乱人伦aⅴ精品| 亚洲午夜久久久久久久久| 不卡日本视频| 欧美在线性爱视频 | 国产亚洲精品久久久久久牛牛| 久久成人在线观看| 人人超碰91尤物精品国产| 狠狠爱一区二区三区| caopon在线免费视频| 欧美日韩在线一区二区| 国产美女喷水视频| 999亚洲国产精| 国产高清精品一区| av网站免费在线观看| 欧美影视一区在线| 欧美多人猛交狂配| 亚洲欧美日韩国产一区| 国产精品国产精品国产专区蜜臀ah | 国产精品宾馆| 久久夜精品va视频免费观看| 国产乡下妇女三片| 欧美经典一区二区三区| 国产视频一视频二| 国产在线播放精品| 久久久久久久久国产精品| 精品人妻无码一区二区| 一区视频在线播放| 亚洲 激情 在线| 日韩久久综合| 国产精品一区二区久久久| 国产51人人成人人人人爽色哟哟| 欧美日韩免费看| ass精品国模裸体欣赏pics| 日韩午夜黄色| 精品蜜桃传媒| 亚洲欧美电影| 亚洲人成网站色ww在线| aaa在线视频| 国产欧美日韩在线观看| 一区二区三区韩国| 青青草综合网| 92福利视频午夜1000合集在线观看| 日本成人在线播放| 欧美一卡在线观看| www.youjizz.com亚洲| 不卡av电影在线播放| 国产免费毛卡片| 欧美系列电影免费观看 | 粉嫩虎白女毛片人体| 视频精品在线观看| 国产精品久久久久秋霞鲁丝| 91在线播放网站| 欧美一区二区三区在线看| 欧美色图一区二区| 99久久久精品| 冲田杏梨av在线| 最新欧美人z0oozo0| 国产精品国产精品国产专区蜜臀ah | 亚洲av无码乱码国产麻豆| 天天做天天摸天天爽国产一区| 熟女少妇一区二区三区| 久色婷婷小香蕉久久| 蜜桃网站在线观看| 偷拍自拍一区| 国产精品亚洲精品| 亚洲大胆人体大胆做受1| 亚洲精品美女在线观看| 久草热在线观看| 亚洲一级二级三级| 国产三级av在线播放| 国产一区二区在线观看免费| 2018日日夜夜| 日韩精品电影| 国产一区二区三区四区hd| 成人做爰视频www网站小优视频| 日韩在线观看网站| 人妻精品一区二区三区| 欧美日韩三级视频| 日韩女同强女同hd| 国产精品国产三级国产专播品爱网 | 欧美另类videos| 中文字幕亚洲影视| 91国产丝袜在线放| 激情国产在线| 久热国产精品视频| 毛片免费在线观看| 精品国产三级a在线观看| 亚洲av人无码激艳猛片服务器| 一区二区三区精品视频在线| 精品无码在线观看| 懂色av一区二区三区蜜臀| 亚洲 欧美 日韩系列| 激情综合激情| 中国一级大黄大黄大色毛片| 久久99国产成人小视频| 国产高清一区视频| 亚州欧美在线| 国产精品视频久久| 自拍视频在线看| 欧美激情小视频| 欧美日韩视频在线播放| 国产午夜精品视频免费不卡69堂| 欧美视频xxx| 91精品国产综合久久福利| 男操女视频网站| 富二代精品短视频| 日本一级淫片免费放| 亚洲综合精品久久| 99久久婷婷国产综合| 国产精品久久久久久久午夜片| 久久中文字幕人妻| 99久久综合精品| 久久久久无码国产精品一区李宗瑞| 九一久久久久久| 日本成人中文字幕在线| 美女尤物久久精品| 男人用嘴添女人下身免费视频| 国产中文一区| 欧美 日韩 国产精品| 91精品综合久久久久久久久久久 | 久久久久久久久久久久久久久久av | 在线免费不卡视频| 国产精品视频一区在线观看| 精品国产999| 天天操天天摸天天干| 亚洲电影一区二区| 日本一级黄色大片| 精品免费在线视频| 好看的av在线| 一本一道久久a久久精品| 9i精品福利一区二区三区| 色综合色综合色综合| www.久久久久久久| 欧美调教femdomvk| 中文字幕你懂的| 欧美日韩成人在线| 国产特黄一级片| 久久久久久久极品内射| 99精品视频免费观看视频| 久久精品国产sm调教网站演员| 亚洲欧美一级二级三级| 国产乱子伦精品视频| 激情视频一区二区三区| 免费特级黄色片| 99国产成+人+综合+亚洲欧美| 欧美成人三级在线视频| 久久成人亚洲| 亚洲综合日韩欧美| 国产精品一区二区三区99| 四虎永久免费观看| 久久综合999| 一级黄色片日本| 亚洲一区二区视频| 特级毛片www| 欧美欧美欧美欧美首页| 精品国产av 无码一区二区三区| 欧美成人国产一区二区| 性猛交xxxx| 中文字幕亚洲欧美日韩高清 | 久久午夜老司机| 1024在线看片| 亚洲线精品一区二区三区| 五月天激情国产综合婷婷婷| 91福利区一区二区三区| 国产麻豆91视频| 亚洲高清久久久久久| av资源在线观看免费高清| 欧美大胆在线视频| 亚洲插插视频| 91夜夜揉人人捏人人添红杏| 欧美色图婷婷| 樱花www成人免费视频| 狠狠综合久久| 美女一区二区三区视频| 岛国精品在线播放| 国产熟女一区二区| 亚洲综合成人在线| 一区二区日韩在线观看| 精品成人a区在线观看| 国产高清免费av在线| 色综合色综合网色综合 | 51成人做爰www免费看网站| 亚洲福利网站| 狠狠精品干练久久久无码中文字幕 | 国产亚洲人成网站| 美国黄色小视频| 在线观看一区二区精品视频| 亚洲精品一区二区三区不卡| 中文字幕视频一区二区在线有码| а√天堂中文在线资源8| 成人黄色免费在线观看| 亚洲人成伊人成综合图片| 日本黄xxxxxxxxx100| 日韩电影在线免费| avtt香蕉久久| 一级中文字幕一区二区| 在线观看免费中文字幕| 亚洲精品色婷婷福利天堂| 天堂av最新在线| 91九色综合久久| 欧美一区二区麻豆红桃视频| 97av视频在线观看| 成人免费看视频| 麻豆精品一区二区三区视频| 精品视频色一区| 国产福利小视频在线观看| 高清一区二区三区四区五区| 国产在线一区不卡| 亚洲欧洲一区二区| 肉肉av福利一精品导航| 精品人妻伦一二三区久| 亚洲欧美日韩精品久久久久| 日本三级一区二区三区| 精品亚洲aⅴ在线观看| 成人免费一区二区三区牛牛| av资源站久久亚洲| 欧美日韩一区自拍| 真实乱偷全部视频| 亚洲精品综合在线| 国产高清在线观看视频| 久久精品福利视频| 亚洲视频资源| 熟女视频一区二区三区| 国产一区二区不卡在线| 最新av电影网站| 777久久久精品| 国产福利视频在线| 亚洲最大福利网站| 欧美~级网站不卡| 成人做爰69片免费| 亚洲成av人片一区二区| 午夜av免费在线观看| 午夜精品99久久免费| 性欧美xxxx免费岛国不卡电影| 成熟丰满熟妇高潮xxxxx视频| 波波电影院一区二区三区| 亚欧洲精品在线视频| 亚洲大胆美女视频| 亚洲综合电影| 日韩.欧美.亚洲| 久久一本综合频道| 阿v天堂2014| 欧美一区二区精美| 电影k8一区二区三区久久| 韩日午夜在线资源一区二区 | 99国产精品久久久久久| 亚洲欧美福利一区二区| 丁香六月色婷婷| 欧美伊久线香蕉线新在线| 国产欧美日韩影院| 污污网站在线观看视频| 一区二区在线电影| 色视频精品视频在线观看| 国产精品99久久久久久人| 久久亚洲在线| 亚洲精品久久一区二区三区777| 偷拍日韩校园综合在线| 国产精品四虎| 亚洲a级在线播放观看| 亚洲伦伦在线| 手机看片日韩av| 日韩精品一区二区三区中文不卡| av在线理伦电影| 日韩中文一区二区三区| 国产一区啦啦啦在线观看| 人人干人人干人人干| 宅男66日本亚洲欧美视频| 天堂久久av| 虎白女粉嫩尤物福利视频| 国产精品短视频| 天堂av在线免费| 国产日韩综合一区二区性色av| 国产综合网站| 一级片久久久久| 亚洲精品wwww| 国产日韩欧美中文在线| 久草青青在线观看| 亚洲精品中文在线| 国产九九在线| 国产精品三区www17con| 日韩精品国产欧美| 精品无码一区二区三区电影桃花| 国产午夜精品全部视频播放| 亚洲精品aⅴ| www.久久久久久久久久久| 精品成人在线视频| 影音先锋在线播放|