多 AI 智能體技術架構設計演進剖析 原創
本文將深度探討 AI 智能體技術架構演進和多 AI 智能體當前的架構設計能力,給大家提供一個全面且深入的視角來理解多 AI 智能體的協作架構。

下文我們詳細剖析之。
一、AI 智能體技術架構演進
AI 智能體技術架構至今已經演進了5個階段,下文詳細剖析之:

第一階段:手藝人
手藝人象征著人類腦力的初步應用,這一階段的入門門檻較低,幾乎每個人都能參與其中。然而,能夠達到頂尖水平的手藝人卻寥寥無幾。AI 智能體技術在這一階段主要體現為算法、算力和模態理解。當前的大模型技術正是處于這一階段,當算法突破瓶頸后,其稀缺性將逐漸顯現,從而超越其他模型。AI 智能體技術在這一階段通常用于聊天、總結和翻譯等場景,能夠直接輸出知識。
第二階段:工作室
工作室的核心特點是擁有一個靈魂人物(例如:小老板),負責產品的立項和設計決策,并將具體任務分配給關鍵的手藝人。工作室的產品通常是定制化的,會結合用戶的特定內容進行定制。關鍵技術包括意圖模型和工具使用。在業界,例如:豆包、元寶、頻道問問等 AI 智能體產品,都在進行特定內容的上下文處理,實現總結、問答和聊天等娛樂化功能。
第三階段:流水線
流水線階段的特點是批量化執行和拉線管理。在工廠中,每個流水線都有專門的管理人員監督工作進度,確保生產環節順利進行。對應的 AI 智能體技術包括任務編排、管理和 AI-Devops。例如,任務分發后可以通過多種方式執行并回收結果。產品示例包括豆包的 Coze 平臺和 Dify 平臺。
第四階段:小型組織
小型組織類似于現代工廠的制造部門,關鍵技術是規劃決策算法和自動化技術。在這個階段,任務可能是模糊的,需要規劃和決策算法來優化產品。自動化技術結合 MCP(可能指某種管理控制平臺)可以提高效率。例如,規劃決策算法用于分析問題、數據和工具選擇,而自動化技術則使任務執行得更快。
第五階段:現代企業組織
現代企業組織由多個部門協作,關鍵在于持續穩定的角色驅動。當前,所有上下文都是基于用戶輸入啟動的,但組織需要持續運轉,并實時調整數據輸入和反饋。關鍵技術包括數據共享和自我決策驅動,通過接入更多數據實現自我迭代。目前,環境感知在 AI 智能體上的應用還比較少,但未來 AI 智能體協作的形態應該是持續運營狀態,基于持續的數據輸入對自身進行迭代。
例如,PM(產品經理)和 DS(數據科學家)作為兩個 AI 智能體每天交流信息,他們可能共同開了一個會議,目標更新了。當這個目標需要兩個角色共同完成時,AI 智能體集群可以自我編排,將兩個 AI 智能體整合成一個新的高維 AI 智能體來實現目標(類似于項目組織的概念)。
企業組織通過 OKR(目標與關鍵結果)驅動目標劃分,依據部門定位編排目標。當外部的產品或技術發生變化時,企業會自行更新組織來適應。對于 AI 智能體協作來說,達到企業級別的 AI 智能體會自行通過決策,在已有基礎上創建新的 AI 智能體來適應變化,并在持續的外部數據輸入后進行更新迭代和編排。
總之,各階段的 AI 智能體技術架構演進展示了從手藝人到現代企業組織的逐步發展,每個階段都有相應的技術和應用場景。應用的選擇應根據使用場景和用戶規模來判斷,不一定每個應用都要走到最后階段。
二、AI 智能體能力架構剖析
1、AI 智能體能力核心模塊
AI 智能體的能力主要可以分為以下四個核心部分:

- 知識記憶
- 預測功能
- 動作執行
- 工具能力
第一、知識記憶 (Memory and Knowledge)
AI 智能體的大腦負責記憶和知識的獲取。知識記憶通常通過微調訓練或者特定方案(例如 RAG 的方案)來實現。這些方法使 AI 智能體能夠在不同情況下調用相關知識,從而更好地應對各種任務。

第二、預測功能 (Prediction)
對于預測任務,AI 智能體可以將圖像、多模態數據等轉換成文本形式,然后進行預測。這種轉換使得 AI 智能體在處理不同類型的數據時更加靈活和高效,能夠快速適應多樣化的輸入。

第三、動作執行 (Action)
動作執行是通過工具能力來實現的,例如:
- API 調用
- SQL 調用
- 機械手操作
- 其他工具調用
這些調用都屬于 AI 智能體的動作執行部分,幫助 AI 智能體完成具體的任務操作。

第四、工具能力 (Tool Capability)
在工具能力方面,以 ReAct 架構模式的方案為例,AI 智能體可以實現 API 調用和搜索等功能。這些能力使得 AI 智能體能夠高效地與外部系統交互,獲取所需信息并執行任務。

MCP (萬能插口)
MCP 的概念可以理解為一個萬能的插口。目前,所有工具調用可能各自有獨立的沙箱板,而 MCP 作為一個通用接口,使得所有工具都能接入,從而提高了兼容性和靈活性,MCP 需要建立在 Function Calling 的基礎之上。

RAG (知識補充)
RAG 是一個知識補充機制,用于增強 AI 智能體的知識庫。通過 RAG,AI 智能體可以動態地獲取和更新知識,從而更好地應對復雜多變的任務需求。

總之,當前的 AI 智能體通過整合計算能力、知識記憶、預測功能和動作執行等多個方面,能夠高效地與外部用戶進行交互,并完成復雜的任務。這些能力的實現依賴于各種工具和接口的使用,例如 API 調用、SQL 調用和機械手操作等。通過 MCP 和 RAG 等機制,AI 智能體能夠更加靈活地調用和補充知識,從而提升整體性能。
本文轉載自???玄姐聊AGI?? 作者:玄姐

















