精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

全面超越AutoGPT,面壁智能聯合清華NLP實驗室開源大模型「超級英雄」XAgent

人工智能 新聞
傳統智能體通常受到人類定制規則的限制,只能在限定范圍內解決問題。它們更像是為人類所用的「工具」,而不是真正的「自主智能體」,難以自主解決復雜問題。

近日,國內領先的人工智能大模型公司面壁智能又放大招,聯合清華大學 NLP 實驗室共同研發并推出大模型「超級英雄」——XAgent

通過任務測試,XAgent 在真實復雜任務的處理能力已全面超越 AutoGPT。


XAgent 在真實復雜任務處理中全面超越 AutoGPT

  • 現已在 GitHub 正式開源,地址 https://github.com/OpenBMB/XAgent
  • 案例展示地址:https://x-agent.net/
  • 博客地址:https://blog.x-agent.net

XAgent 何許「人」也?

XAgent 是一個可以實現自主解決復雜任務的全新 AI 智能體,以 LLM 為核心,能夠理解人類指令、制定復雜計劃并自主采取行動。

傳統智能體通常受到人類定制規則的限制,只能在限定范圍內解決問題。它們更像是為人類所用的「工具」,而不是真正的「自主智能體」,難以自主解決復雜問題。

相反,XAgent 被賦予了自主規劃和決策的能力,使它能夠獨立運行,發現新的策略和解決方案,不受人類預設的束縛。

它的能力已全面超越 AutoGPT,在眾多場景任務上展示出了驚人的自主性和復雜任務的求解能力,將 AI 智能體的智能水平提升到了一個全新高度。

那么問題又來了:它是如何實現的呢?

「左右腦」協同,雙循環機制

正如人類具備「左腦」 和「右腦」,在處理復雜任務時通常從「 宏觀」和「微觀」 兩個視角進行考慮,既要針對全局進行統籌和規劃,也要從執行層面來考量。

圖片

相較于 AutoGPT,面壁智能和清華大學在 XAgent 的設計中創新地引入了一種「雙循環機制」:

  • 外循環:負責全局任務規劃,將復雜任務分解為可操作的簡單任務。
  • 內循環:負責局部任務執行,專注于細節。

通過雙循環機制的協作,XAgent 如同大模型領域的「超級英雄」,它在應對復雜任務的不同環節時,展現出超強的專業度和豐富的技能。

就像漫威宇宙中的「美隊」,XAgent 既有全局觀的領導力,也有細致入微的執行力。

在外循環中,XAgent 展現出作為一個「規劃」(PlanAgent)的領導力,它會把復雜任務拆分成若干簡單任務,并監督問題解決的完整過程。

首先,它將給定的復雜任務分解成更小、更易管理的「子任務」,生成「初始規劃」,形成任務序列。

隨后,它將逐次把每個子任務傳遞給內循環解決。在這個過程中,外循環會不斷監督任務的進度和狀態,并根據反饋對后續規劃進行「迭代優化」。

在內循環中,XAgent 快速轉變身份,展現出作為一個高效「執行者」(ToolAgent)的專業度,確保外循環傳遞的子任務達到預期。

根據子任務性質的不同,它可以從外部系統中檢索工具,并針對子任務進行一步步求解。

在子任務完成后,它將生成當前子任務執行過程的反思,反饋給外循環,指示當前任務是否完成,以及任務執行中的潛在優化點。

如圖所示,用戶給 XAgent 提交了 iris.zip 文件,讓 XAgent 對數據進行分析。

圖片

可以看到,XAgent 首先通過外循環將這個任務分解成了 4 個子任務:

  1. 對數據進行檢查與理解;
  2. 檢查系統的 Python 環境,查看相關數據分析庫是否存在;
  3. 編寫數據分析代碼,對數據進行處理與分析;
  4. 根據 python 代碼執行結果撰寫分析報告。

隨后,在執行每一個子任務時,XAgent 通過內循環熟練地使用文件讀寫、 shell 命令、python notebook 及相應 pandas、sci-kit learn、seaborn、matplotlib 等數據分析庫,甚至會對數據進行可視化分析。

AutoGPT 在執行相同任務時,并沒有制定檢查 python 環境與相關庫的規劃,而是直接開始寫代碼執行,導致使用相關庫時失敗報錯,最終也沒有完成對數據的復雜分析。

人機協作:智能體交互新范式

雖然 AutoGPT 在一定程度上突破了傳統 GPT 模型的局限性,但它仍然存在死循環、錯誤調用等執行出錯的現象,需要人工干預才能解決。

而 XAgent 在設計之初就針對相關問題進行了考量,并引入了專為增強人機協作的交互機制:它可以自主與用戶進行交互,并向人類發出干預和指導的請求。

對于一個智能體而言,「是否能夠與人類協作」也是體現其智能程度的重要指標。

首先,XAgent 具備直觀的界面,用戶可以直接覆蓋或修改它提出的建議,從而將 AI 效率與人類的直覺和專業知識有效結合。

其次,在面臨陌生挑戰的情況下,XAgent 具備「向人類尋求幫助」能力,它會向用戶征求實時反饋、建議或指導,確保即使在不確定的領域,智能體也能發揮出最佳作用。

圖片圖片

這種交互范式,將 AI 的自主性與人類的智慧有機融合,展示了人與 XAgent 之間的全新的協作關系。

如圖所示,用戶想讓 XAgent 幫忙推薦一些好吃的餐館來和朋友聚會,但是卻沒有提供具體詳細的信息。

這個時候 XAgent 可以意識到目前用戶所提供的信息不夠充足,難以進行推薦,于是向人類提出請求,詢問用戶的傾向地點、預算范圍、口味喜好、有哪些忌口等等,在得到用戶的反饋后從而提供了推薦的餐廳。

而 AutoGPT 則直接開始到網絡上搜索餐館信息進行推薦,最終推薦的結果地點不對,也沒有考慮用戶的預算,沒有符合用戶的需求。

高效通信語言,超強工具調用

無論「雙循環」的運轉機制,還是「人機協作」 的交互能力,在 XAgent 的總體設計中,面壁智能和清華團隊著重考慮的是智能體的穩定、高效和安全等核心特性。

結構化的通信方式同樣是建立強大、穩定智能體的重要因素之一。

XAgent 采用 Function Call 作為其內部的通信語言,具備結構化、標準化、統一化等優勢。

  • 結構化:Function Call 具備清晰且嚴謹的格式,可以明確表述所需內容,從而最小化了潛在的錯誤。
  • 標準化:Function Call 可以將與外部工具的交互過程標準化,提供一種通用語言,使智能體具備使用和整合多種工具的能力,解決復雜任務。
  • 統一化:通過將信息摘要、任務規劃、工具執行等所有環節轉化為特定的 Function Call 形式,確保每個環節均以統一的方式進行處理,從而簡化系統設計。

此外,工具調用也是評價 AI Agent 是否具備解決復雜問題的重要能力之一。

XAgent 在設計中原創了工具執行引擎 ToolServer,可以實現更安全、高效、可擴展的工具執行能力。

它在隔離的 Docker 環境中運行,確保工具執行不會危及主系統的穩定性或安全性。

這種設計帶來多重好處:

  • 安全:在 Docker 容器內運行工具可以保護主系統免受潛在危害。
  • 高效:系統可以根據需求和使用模式啟動、停止和重啟節點,實現最佳資源使用。
  • 可擴展:方便管理代碼,調試和擴展性更強。

ToolServer 的關鍵組件包括:ToolServerNode、ToolServerMonitor、ToolServerManager,在執行操作、節點檢查、周期管理等方面提供強大的能力。

目前,XAgent 的 ToolSever 支持 FileSystemEnv、PythonNotoBook、WebEnv、ExecuteShell、RapidAPIEnv、AskHumanforHelp 等多種工具。

XAgent 不僅可以幫我們做一些簡單的任務,它甚至可以幫助我們訓練模型。

比如,用戶希望能夠對電影評論進行分析,判斷一下大眾對電影評價的好壞。這個時候 XAgent 會首先下載 imdb 數據集去訓練一個 BERT 模型,并使用訓練好的 BERT 模型對電影評論進行預測。

圖片

圖片

圖片

圖片

釋放大模型潛力,全面超越 AutoGPT

經過在一系列任務中的測試可以看到(如下圖 a、b 所示),基于 GPT-4 的 XAgent 表現效果在所有基準測試中都超過了原始的 GPT-4,并全面超越了 AutoGPT。

這些任務需要 Agent 推理規劃和使用外部工具的能力,包括:用搜索引擎回答問題的能力(FreshQA+HotpotQA)、Python 編程能力(MBPP)、數學推理能力(MATH)、交互式編程能力(InterCode)、具身推理能力(ALFWorld)、真實復雜任務等。

圖片圖 a:XAgent 在真實復雜任務處理中全面超越 AutoGPT

圖 b:超越 AutoGPTXAgent 在六大 AI Agent 基準測試中全面領先 GPT-4

可以看出,XAgent 的系統設計能夠充分釋放 GPT-4 的基礎能力,并達到極高的測試效果和人類傾向(Human Preference)。

這不僅表明 XAgent 在需要推理規劃的傳統 AI 測試中表現出色,而且在處理復雜的實際指令時具有更高的性能

拓展應用邊界,堅實技術基礎

AI Agent 的出現讓整個行業看到了大模型技術的重要落地方向,無需進行復雜的 prompt 探索,就可以實現整套工作流的任務執行。

作為具有無限潛能的大模型「超級英雄」,XAgent 可以成為每一個普通的人的「個人助理」。它可以幫助我們規劃日程,安排行程,管理生活和工作的時間和資源分配。

它還可以自主使用多種數據采集、處理和分析工具,全自動地完成對海量數據的分析并形成報告,幫助用戶高效獲取重要信息。

此外,XAgent 還能結合外部工具與自主規劃算法,根據環境信息做出決策,以實現更高效和精確的任務執行。

XAgent 的研發團隊是由來自面壁智能和清華大學 THUNLP 實驗室的多位大模型領域的專家和學者組建。他們更像是大模型領域的「超級英雄」。

這一創新成果之所以能夠成功推出,正是團隊在長期的科研工作過程中構建了一系列前沿創新的大模型 Infra,堅實技術基礎,拓展創新和研發的邊界。

面壁智能聯合清華大學 NLP 實驗室、OpenBMB 開源社區打造了一個「三位一體」 的大模型產學研生態布局,提出并發布了多個大模型工具使用框架和引擎:

  • Tool Learning:大模型工具學習范式,將專業工具與大模型的優勢相融合,從而在問題解決方面達到更高的準確性、效率和自主性。
  • BMTools:大模型學習引擎,是讓語言模型使用擴展工具的開源倉庫,同時也是開源社區構建和共享工具平臺。
  • ToolLLM,大模型工具學習框架,給大模型接入 16000+ 真實 API,讓大模型可以通過調用外部工具以完成更復雜的用戶指令任務。
  • WebCPM,中文領域首個支持聯網搜索的模型框架,填補國產大模型該領域的空白,讓大模型能像人類一樣在網頁上實時搜索答案,提高了 AIGC 的實時性和準確性。

XAgent 拓展了 AI 智能體在執行復雜任務中的能力上限,讓我們看到大模型技術融入生產和生活的前沿趨勢和無限潛力。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-05 13:24:51

GPUNLP芯片

2012-11-07 11:24:03

思科實驗室

2015-02-06 09:23:52

賽可達實驗室網絡安全

2025-09-26 08:59:36

2024-01-19 12:12:17

騰訊SecBenc

2013-03-28 10:08:49

UbuntuCCN開源軟件

2025-09-08 23:19:25

2024-02-01 13:03:00

AI模型

2025-11-21 12:04:58

2010-02-03 23:57:48

2010-03-12 09:38:31

IPv6中國電信

2023-08-08 14:36:11

模型AI

2010-07-30 09:54:47

中國首家云計算聯合實驗室

2011-08-29 10:40:02

浪潮英特爾并行計算

2018-07-25 09:47:51

2025-10-20 08:45:00

2025-07-22 10:45:55

2025-07-02 01:40:00

OpenAI人工智能扎克伯格

2021-08-04 09:48:05

數字化
點贊
收藏

51CTO技術棧公眾號

欧美精品亚洲二区| 久久免费偷拍视频| 欧美美女15p| 亚洲av熟女高潮一区二区| 草美女在线观看| 久久精品欧美一区二区三区不卡 | 国产一区二区三区四区五区在线 | www成人啪啪18软件| 99久热在线精品视频观看| 亚洲va韩国va欧美va| 色噜噜色狠狠狠狠狠综合色一| 国产乱淫av片免费| 精品福利av| www.国产精品一二区| 免费a v网站| 日韩午夜视频在线| 欧美午夜性色大片在线观看| 一本久久a久久精品vr综合 | 久久av红桃一区二区小说| 国产一级二级视频| 精品国产亚洲一区二区三区在线| 欧美日韩另类在线| 国产一二三四区在线观看| 欧美男男同志| 99视频精品全部免费在线| 成人网欧美在线视频| 免费的毛片视频| 欧美日韩三级| 久久精品国产亚洲7777| 真实乱视频国产免费观看| 粉嫩久久久久久久极品| 7777精品伊人久久久大香线蕉最新版 | 不卡中文字幕在线观看| 成人香蕉视频| 黄色一区二区在线观看| 韩国无码av片在线观看网站| 男人天堂久久久| 国产欧美日韩中文久久| 欧美激情国产日韩| 五月婷婷伊人网| 国产.欧美.日韩| 91九色对白| 国产免费av观看| 久久99精品一区二区三区| 国产精品电影在线观看| 在线观看 亚洲| 亚洲女优在线| 欧美专区国产专区| 男人日女人网站| 国产欧美日韩亚洲一区二区三区| 欧美黑人xxxx| 国产一级中文字幕| 99成人在线| 亚州国产精品久久久| 国产精品日日夜夜| 亚洲欧洲一区| 欧美综合一区第一页| 日韩 欧美 中文| 久久成人免费| 日韩免费av片在线观看| 久久国产乱子伦精品| 久久中文欧美| 国产精品美女视频网站| 亚洲影视一区二区| 国产麻豆精品theporn| 91免费看蜜桃| 神宫寺奈绪一区二区三区| www.欧美日韩| 欧美成人一区二区在线| 成人免费高清在线播放| 国产精品久久久久影院色老大| 伊人久久青草| 四虎影视国产在线视频| 亚瑟在线精品视频| 国产a视频免费观看| 91精品国产66| 欧美一区二区三区视频在线| 不许穿内裤随时挨c调教h苏绵| 风间由美性色一区二区三区四区 | 精品视频1区2区3区| 美女在线视频一区二区| 婷婷综合国产| 亚洲欧美日韩精品久久奇米色影视 | 成人激情久久| 亚洲第一精品自拍| 美女被到爽高潮视频| 91亚洲国产高清| 欧美高清在线视频观看不卡| av大片免费观看| 免费观看成人av| 国产传媒一区二区| 成人高清网站| 一区二区三区不卡在线观看 | 一区二区三区电影| 欧美人与禽猛交乱配| 狠狠做深爱婷婷久久综合一区| 国产又猛又黄的视频| 国产精品一区二区美女视频免费看| 精品国产伦理网| 黄色片网站免费| 国产精品videosex极品| 国产精品27p| 亚洲精品.www| 中文字幕不卡在线播放| 男人天堂a在线| 农村妇女一区二区| 日韩av资源在线播放| 成年人免费视频播放| 黄色工厂这里只有精品| 国产欧美婷婷中文| 日韩av资源| 亚洲制服丝袜在线| 午夜免费看毛片| 一本久久青青| 久久久久久久影院| 国产欧美日韩综合精品一区二区三区| 91婷婷韩国欧美一区二区| 免费成人深夜夜行网站视频| 亚洲国产福利| 亚洲国产精品系列| 免费在线观看av网址| 蜜桃一区二区三区四区| 麻豆成人av| jizz一区二区三区| 日韩视频中午一区| 天堂av免费在线| 久久精品二区三区| 国产在线精品一区二区三区| 亚洲七七久久综合桃花剧情介绍| 在线精品国精品国产尤物884a| 性农村xxxxx小树林| 亚洲五月综合| 91欧美激情另类亚洲| youjizz在线播放| 日韩欧美在线字幕| aa片在线观看视频在线播放| 国语精品一区| 不卡一区二区三区视频| av电影高清在线观看| 88在线观看91蜜桃国自产| 国产大屁股喷水视频在线观看| 丝袜亚洲精品中文字幕一区| 九色综合婷婷综合| 亚洲啊v在线| 亚洲国产精品中文| 日韩av片在线播放| 99免费精品在线| www.射射射| 日本午夜精品| 欧美一级大片在线观看| 日本福利片在线| 日韩欧美国产成人| 中日韩精品一区二区三区| 国产欧美三级| 免费亚洲一区二区| 国产另类xxxxhd高清| 在线观看日韩欧美| 中文字幕日韩第一页| 国产精品精品国产色婷婷| 色婷婷狠狠18| 一个色综合网| 国产精品免费在线播放| 国产精品yjizz视频网| 亚洲精品国产精品自产a区红杏吧| 日韩精品人妻中文字幕| 久久久久国产成人精品亚洲午夜 | 69成人免费视频| 久久美女高清视频 | 国产在线看一区| 国产制服91一区二区三区制服| 91夜夜蜜桃臀一区二区三区| 亚州国产精品久久久| 国产视频在线看| 91精品国产综合久久福利| 国产亚洲第一页| 久久噜噜亚洲综合| 视频免费1区二区三区| 欧美日韩国内| 欧美一级日本a级v片| 日韩一级特黄| 亚洲91精品在线| av在线天堂播放| 欧美成人女星排名| 日韩精品一区不卡| 亚洲色图丝袜美腿| 中文字幕丰满孑伦无码专区| 久久精品国产**网站演员| 免费人成自慰网站| 日韩精品影视| 国语精品中文字幕| 亚洲精品毛片| 97碰在线观看| 国产最新在线| 日韩精品在线免费观看视频| 91久久精品国产91性色69| 一区二区三区欧美亚洲| 亚洲成人黄色av| 福利一区二区在线| 亚洲老女人av| 亚洲精品男同| 艳母动漫在线免费观看| 亚洲+变态+欧美+另类+精品| 成人在线中文字幕| 亚洲性受xxx喷奶水| 欧美精品在线第一页| 黄色软件在线观看| 亚洲аv电影天堂网| 一区二区三区www污污污网站| 精品久久久国产精品999| 日韩成人短视频| 国产日产欧美一区| 给我免费观看片在线电影的| 国产一区二区福利视频| 欧美黑人又粗又大又爽免费| 亚洲区欧美区| 国产aaa免费视频| 亚洲精品一区二区在线看| 免费在线观看91| 国产精品久久久久久久久久白浆| 国产在线拍偷自揄拍精品| 欧美影视资讯| 欧美自拍视频在线| sm在线观看| 欧美国产日韩视频| 八戒八戒神马在线电影| 中文字幕欧美精品日韩中文字幕| 亚洲av电影一区| 精品国产乱码久久久久久久 | 26uuu成人| 欧美在线电影| 日韩精品欧美在线| 最新亚洲精品| 欧美精品一区二区三区在线看午夜| 亚洲码欧美码一区二区三区| 91九色国产视频| 一区二区三区| 91九色综合久久| 亚洲网站三级| 成人免费黄色网| 97色婷婷成人综合在线观看| 国产日韩欧美日韩| 日韩综合av| 成人有码在线视频| 欧一区二区三区| av资源站久久亚洲| 亚洲综合网狠久久| 国产免费一区二区| 欧美大胆视频| 免费99视频| 精品成人影院| 在线观看一区二区三区三州| 91一区在线| av电影一区二区三区| 中文在线播放一区二区| 成人国产在线看| 亚洲深爱激情| 杨幂毛片午夜性生毛片| 久色婷婷小香蕉久久| 日韩欧美中文在线视频| 国产ts人妖一区二区| 亚洲香蕉中文网| 91看片淫黄大片一级在线观看| 亚洲综合色一区| 国产精品三级久久久久三级| 91香蕉视频污在线观看| 亚洲精选一二三| 粉嫩aⅴ一区二区三区| 一本久久a久久精品亚洲| 中文字幕无码乱码人妻日韩精品| 69堂精品视频| 日本毛片在线观看| 亚洲人在线视频| 久久精品视频免费看| 欧美精品第一页在线播放| 9i看片成人免费高清| 国产精品免费在线免费| 精品精品视频| 蜜桃在线一区二区三区精品| 欧美激情欧美| 国产精品12345| 蜜臀a∨国产成人精品| 国产情侣久久久久aⅴ免费| 久久夜色精品一区| 日韩高清dvd碟片| 精品福利在线观看| 一区二区视频免费| 亚洲精品www久久久| 自拍视频在线免费观看| 久久久久久久久久亚洲| 国产成人精品一区二区三区免费| 成人av电影免费| 欧美亚洲在线日韩| 久草免费福利在线| 日本美女视频一区二区| 亚洲成人精品在线播放| 欧美国产综合色视频| 国产精品成人aaaa在线| 欧美日韩国产大片| 日韩欧美在线番号| 精品中文字幕在线观看| 亚洲高清黄色| 国产精品国产三级国产专区53 | 日韩中文字幕在线视频| 色偷偷偷在线视频播放| 亚洲mm色国产网站| 成人3d动漫在线观看| 国产69精品久久久久久久| 国模大尺度一区二区三区| 成人国产精品久久久网站| 亚洲一区二三区| 97人妻人人澡人人爽人人精品| 精品无人区太爽高潮在线播放| 手机在线免费看av| 国产久一一精品| 欧美日韩中文字幕一区二区三区| 精品久久久久久无码中文野结衣| 蜜桃精品视频在线观看| 91成年人网站| 午夜精品一区二区三区电影天堂| av无码精品一区二区三区宅噜噜| 在线播放国产精品| 免费看av不卡| 久久久久久久久久久一区 | 久久久免费在线观看| www.成人在线.com| 亚洲欧美丝袜| 久久青草久久| 草草地址线路①屁屁影院成人| 亚洲午夜久久久久| 亚洲爱爱综合网| 久久福利视频导航| 欧美专区视频| 国产制服91一区二区三区制服| 精品亚洲porn| 在线观看黄网址| 欧美日韩国产a| 亚洲麻豆精品| 国产日韩av高清| 国产国产精品| 久久精品国产99久久99久久久| 国产精品国模大尺度视频| 中文字幕av影视| 日韩中文在线不卡| 99久久999| 九一免费在线观看| 国产成人午夜电影网| 欧美高清视频一区二区三区| 日韩欧美国产系列| 美女日批视频在线观看| 国产伦精品一区二区三毛| 亚洲激情网站| 欧美一区二区三区成人精品| 欧美视频二区36p| 九九在线视频| 国产激情综合五月久久| 欧美三级情趣内衣| xx欧美撒尿嘘撒尿xx| 中文字幕欧美一| 免费a级片在线观看| 97在线精品国自产拍中文| 久9久9色综合| 日韩一区二区三区久久| 有码一区二区三区| 天堂中文在线官网| 国产成人极品视频| 香蕉av一区二区| 潘金莲一级淫片aaaaa| 精品毛片网大全| av网站无病毒在线| 97自拍视频| 丝袜a∨在线一区二区三区不卡| 黄色激情小视频| 日韩欧美一区二区久久婷婷| 草草视频在线观看| 亚洲成色最大综合在线| 国产精品资源在线观看| www.国产成人| 日韩在线视频网站| 97久久亚洲| 亚洲色图久久久| 亚洲自拍偷拍九九九| 国产在线观看网站| 99国精产品一二二线| 欧美专区一区二区三区| 亚洲视频重口味| 日韩黄在线观看| 最新亚洲国产| 男人操女人免费软件| 亚洲欧洲日韩综合一区二区| 天天爽夜夜爽夜夜爽| 国产美女久久精品香蕉69| 国产精品观看| 中国美女黄色一级片| 日韩大陆欧美高清视频区| 欧美视频免费看| 777久久久精品一区二区三区| 日韩一区在线播放| 可以在线观看的av网站| 国产精品久久久久免费| 麻豆国产欧美一区二区三区|