深度解讀大模型最火的智能體(Agent)

上周寫了一篇文章,講大模型兩種模式,一種是 copilot,一種是 agent。
文章出來之后引起了討論,有同學留言覺得 copilot 和 Agent 沒啥區別,核心原因是認為,Copilot是傳統軟件使用AI 增強,這時被包裹成為copilot,另種形式 Agent 是AI系統(目前常見各種對話)包裹傳統系統API,這時稱為Agent。這兩者沒有明顯區別,同樣的實現邏輯。
其實這個是有誤區的。
核心概念區別
Agent 和 Copilot 最核心區別在于是否能自主完成任務,并不是是否調用其他能力。類似自動駕駛里面的 L2,L3的區別。agent 也可以包在傳統軟件里面,是否包,還是獨立的,不是這個核心區別。
AI Agent 是一種智能實體,它能夠感知環境、進行決策和執行動作。AI Agent 通常具有自主性,能夠根據給定的目標或任務,獨立地進行規劃、執行和反思。它們可以分解復雜任務,自我批評和自我反思,從錯誤中學習,并改善結果。AI Agent 可以被視為具有一定程度自主性和復雜推理能力的系統,它們可以在沒有人類直接干預的情況下完成任務。
AI Copilot,另一方面,通常是指一個通過AI技術賦能的智能助手,它協助人類完成各種任務。AI Copilot 可能在特定領域(如編程、寫作、駕駛等)提供幫助,通過與人類的交互來提高效率和創造力。AI Copilot 可能更多地依賴于人類的輸入和指導,而不是完全自主地完成任務。
簡而言之,AI Agent 更強調自主性和獨立完成任務的能力,而 AI Copilot 更側重于作為人類的助手,協助完成特定任務。AI Agent 可能在復雜性和自主性方面更為先進,而 AI Copilot 則更注重與人類的協作和輔助。
講完概念,今天繼續深度下 Agent 的架構,當前問題,業界典型范例給大家參考。
典型Agent 架構
下圖是一個典型的 Agent 架構。

一個 Agent 里面核心幾大塊:
1、大模型:負責思考,給出執行,調用的參數。
2、能力庫:外掛的各種能力,比如約會議,查文檔都是調用另外的系統完成。
3、歷史:主要是記錄上下文
4、用戶澄清:當前 Agent 比較難脫離人的檢查確認,所以一般有這一步用戶的確認和修改過程。
5、最終展示:有多種展示形式,卡片式,或者給自然語言展示結果。
接下來看下 Agent 實際的范例和當前存在的問題。
業界 Agent 范例
Copilot 有很多成功的范例,最出名的有 GitHub copilot,Microsoft office 365 copilot。大模型已經成功在編程,文案,創意等方向有不錯的實踐。
當前智能體 Agent 還處在比較早期的階段,已經有一些比較明顯的成果,當前有些典型的嘗試:
- 角色扮演類:比如英語口語老師,情感分析大師。
- 創作類:各種營銷文案如新媒體文章,小紅書文案編寫等。
- 辦公類:ppt 自動生成,研究報告生成等。
不過總的來說特別實用的 agent 其實還沒有孵化出來。
從另外一個角度思考,大模型是一個全新的領域,,從成熟度角度,可以認為:
GPU > LLM > Agent builder > Agent&Application
越是底層越成熟,也只有底層成熟了才能孵化上層的業務。因此如果要有一個比較不錯的 Agent,可能需要成熟的 Agent builder。可能有又有小伙伴想知道都有哪些 Agent builder,后面找時間詳解一下業界都有哪些 Agent builder各自特點是什么。
下圖是 AI Stack 典型技術棧,給忘記的同學回顧:

當前Agent 存在的問題
人工智能大牛吳恩達是 Agent 的擁躉,先簡單回顧吳恩Agent 四范式:
- Reflection(反思):類似于AI的自我糾錯和迭代。例如,AI系統會檢查自己編寫的代碼,并提出修改建議。
- Tool Use(工具使用):大語言模型調用插件,擴展了其能力。例如,使用Copilot進行聯網搜索或調用代碼插件解決數理邏輯問題。
- Planning(規劃):AI根據用戶輸入的任務,拆解流程、選擇工具、調用、執行并輸出結果。例如,根據一張圖片中的姿態生成一張新圖片,并進行描述。
- Multi-agent(多智能體協作):多個Agent協作完成任務,每個Agent可能扮演不同的角色,如CEO、產品經理或程序員。這種模式模擬了現實生活中的工作場景,能夠處理復雜系統

Agent大家未來肯定看好,但是 agent 當前還是存在比較多的問題,仍能需要工業界持續去改進。
- 性能問題
傳統互聯網產品性能都是毫秒級,調用大模型需要等待的時間較長,一些場景下用戶不愿意等待的。
- 效果問題
純大模型很難上線,還要套用規則或者其他一些手段補充和彌補
- 成本問題
業務真實場景下,調用大模型成本還是很高。
- multi-agent 還沒有起來
沒有把多個 bot組織起來,快速構建大量的智能體。吳恩達認為多agent 效果會很好,但是怎么組合調用,還沒有看到很好的成果經驗。
總的來說,前途是光明的,道路還是曲折的。



































