從模型之戰到Agent之戰:未來90天必須關注的3個信號 精華
今天給家人們分享一下,2025 AI Agents的六大趨勢、Multi-Agents的協作架構、Agent的自主L1 ~ L5等級 ~

趨勢一:DeepResearch Agent —— 任務從執行到拆解與監督
我們最熟悉的Agent模式是接收一個任務,然后自己從頭干到尾。
DeepResearch的玩法變了,它引入了一個Manager的角色。
Manager 不親自干活,核心任務是兩件事:
- 拆解任務:把一個復雜問題(比如“分析Q3季度AI Agent行業報告”)拆解成一堆更小的、可以獨立執行的子任務(文獻檢索、數據驗證、圖表生成、摘要撰寫等)。
- 監督與整合:把這些子任務派發給不同的“專家Agent”,然后監督它們的工作,最后將結果整合成一份完整的報告。

Anthropic Multi-Agent Architecture in Action
Anthropic 的 Deep Research,就是用的這種 Orchestrator-Workers 模式。
主Agent(Opus 4)負責策略制定和任務分配,子Agent(Sonnet 4)負責并行執行,性能直接提升了90%以上。
趨勢二:Coding Agents —— 從單人開發到AI軟件團隊
編程可能是Agent最快落地的領域。單個Coding Agent也許能寫一個函數或修復一個bug,但面對整個軟件生命周期(需求、設計、編碼、測試、部署)就有一點扛不住了。
所以大家都在說,未來的AI編程,會是一個AI Team:
- 產品經理Agent:負責理解需求,編寫PRD。
- 架構師Agent:設計系統架構和技術選型。
- 程序員Agent:編寫具體的代碼。
- 測試工程師Agent:編寫單元測試和集成測試。
- 運維工程師Agent:負責部署和監控。

這種協同工作的模式,讓AI真正有能力端到端地交付一個完整的軟件項目,而不再只是個高級的代碼補全工具。
趨勢三:CUA (Computer Using Agents) —— 桌面不再是界面,而是可編程環境
讓Agent操作我們的電腦,一直是行業的終極目標之一。但單一Agent學習操作無數軟件的成本極高,而且非常脆弱。
一個新思路是:為不同的任務和軟件訓練專門的Agent。
- 一個Excel Agent,精通所有表格操作和數據透視。
- 一個Photoshop Agent,擅長圖像處理和設計。
- 一個瀏覽器Agent,負責信息檢索和在線操作。
當一個復雜任務(比如“從網頁下載數據,整理到Excel,然后做成PPT”)下達時,一個“總管Agent”會依次調用這些“專家Agent”來接力完成。
趨勢四:Agentic RAG —— RAG已死,可反思、可規劃的檢索當立
傳統的RAG就是個“問-查-答”的單向過程,AI無法判斷檢索到的內容是否準確或充分。

Agentic RAG則是一個動態的、可反思的多Agent流程:
- 查詢Agent:負責理解用戶問題,并將其轉化為多個檢索查詢。
- 檢索Agent:并行執行查詢,從多個數據源獲取信息。
- 評估Agent:評估檢索結果的質量和相關性,如果信息不足,會要求“查詢Agent”重新生成查詢。
- 總結Agent:基于篩選后的高質量信息,生成最終答案。
這個過程引入了規劃、執行、反思的閉環,讓信息檢索的可靠性發生了質的飛躍。
趨勢五:Agent Protocols —— 讓AI們說同一種語言
當成千上萬的Agent需要協作時,必須有一套統一的“溝通協議”,就像互聯網的TCP/IP一樣。這就是Agent Protocols要解決的問題。

無論是OpenAI的MCP,還是Google的A2A,它們都在嘗試定義一套標準,讓不同的Agent能夠:
- 互相發現 (Discovery):知道彼此的存在和能力。
- 任務分配 (Task Assignment):清晰地傳遞任務和上下文。
- 數據交換 (Data Exchange):安全、高效地共享信息和狀態。
趨勢六:Voice Agents —— 從語音助手到實時AI隊友
未來的語音交互,不會是一個孤立的AI在回答你。當你開車時,一個多Agent語音系統可能正在協作:

- 感知Agent:負責將你的語音轉化為文本,并理解意圖。
- 導航Agent:實時規劃路線。
- 通訊Agent:幫你撥打電話或回復消息。
- 娛樂Agent:控制音樂播放。
它們在一個共享的上下文中無縫協作,提供的是一種情景感知、主動服務的環境智能,這與Siri、小愛同學這類被動響應的“語音助手”有本質區別。
Multi-Agent的協作架構
那么,這些Agent們到底是如何協同工作的呢?微軟Azure和Anthropic給出了幾乎一致的答案,我們可以將其歸納為五種核心編排模式。
1. Sequential Orchestration: 像工廠流水線,每個Agent處理上一個Agent的輸出。適用于“起草-審查-潤色”這類線性工作流。

2. Concurrent Orchestration: 多個Agent同時處理同一個任務,從不同角度提供見解(比如技術、商業、創意),然后匯總。

3.Group Chat Orchestration: 所有Agent在一個共享的對話中協作,由一個“聊天管理器”協調流程,適合頭腦風暴或復雜問題決策。

4. Handoff Orchestration: 任務在一個Agent網絡中動態傳遞,每個Agent評估任務后,決定是自己處理還是移交給更合適的Agent,非常適合復雜的客戶服務場景。

5. Magentic Orchestration: 專為開放式、無預定解決方案的復雜問題設計。一個“經理Agent”會動態構建和完善任務列表,并與“專家Agent”協作來制定和執行計劃。

Agent的治理與風險
當Agent可以自主行動時,一個終極問題浮出水面:我們如何控制它們?
華盛頓大學在2025年的一篇論文中,提出了一個“AI自治五級”框架,它不關注Agent的能力,只關注用戶在交互中的角色。

Levels of Autonomy
- L1 操作員 (Operator):人類完全控制,AI僅提供建議或執行單步操作。
- L2 協作者 (Collaborator):人機協同,多輪溝通,動態分配任務。
- L3 顧問 (Consultant):AI主動規劃和執行,人類提供反饋和方向。
- L4 審批者 (Approver):AI幾乎完全獨立,僅在關鍵節點尋求人類批準。
- L5 觀察者 (Observer):AI完全自主,人類僅監督和擁有“緊急停止按鈕”。
最后
2025年,AI Agent領域最激動人心的故事,不再是關于某個模型跑分又提升了多少,而是關于智能體之間如何形成高效、可靠的協作。
從DeepResearch的任務拆解,到Coding Agent的軟件團隊...
我們正在見證智能體時代的到來。
本文轉載自???探索AGI???,作者:獼猴桃

















