谷歌大神出手,免費發(fā)布《智能體設(shè)計模式》,AI Agent開發(fā)的終極秘籍
當(dāng)前,AI 領(lǐng)域最火熱的浪潮無疑是 AI Agent(智能體)。從科技巨頭到創(chuàng)業(yè)公司,無數(shù)開發(fā)者正投身于構(gòu)建能夠自主理解、規(guī)劃和執(zhí)行復(fù)雜任務(wù)的智能系統(tǒng)。
然而,在這股「淘金熱」的背后,開發(fā)者們也面臨著巨大的挑戰(zhàn):如何系統(tǒng)性地設(shè)計智能體的行為?如何確保系統(tǒng)的穩(wěn)定性和可靠性?如何避免一次又一次地「重造輪子」?整個領(lǐng)域迫切需要一套經(jīng)過實踐檢驗的「建筑圖紙」和方法論。
學(xué)習(xí),如有一本好書,往往事半功倍。
近日,谷歌資深工程主管、杰出工程師 Antonio Gulli 在網(wǎng)上公開發(fā)布了自己的新書《Agentic Design Patterns(智能體設(shè)計模式)》。

對許多開發(fā)者來說,「設(shè)計模式(Design Pattern)」這個詞并不陌生。它曾在軟件工程領(lǐng)域扮演了「圣經(jīng)」般的角色,將無數(shù)前輩的最佳實踐固化為可復(fù)用的解決方案。而 Antonio Gulli 此舉的意義,正是在于為方興未艾的智能體開發(fā)領(lǐng)域,提供了首批系統(tǒng)性的「設(shè)計模式」,幫助開發(fā)者讓打造強大、可靠的智能體變得有章可循。
現(xiàn)在,雖然該書已經(jīng)在亞馬遜開啟預(yù)售(作者表示全部版稅將捐贈給拯救兒童組織),但感興趣的讀者也可以在谷歌文檔上免費查看全書。
地址:https://docs.google.com/document/d/1rsaK53T3Lg5KoGwvf8ukOUvbELRtH-V0LnOIFDxBryE/preview?tab=t.0#
光看其目錄,就能感覺到,讀完這本書,你就能非常全面地理解智能體 + 代碼:

從目錄的編排上,我們也能看出作者的深思熟慮。這本 400 多頁的著作的結(jié)構(gòu)堪稱一份精心設(shè)計的學(xué)習(xí)路線圖。
第一部分從提示鏈、路由和工具使用等最核心的單元操作入手,如同教授智能體的基本語法。隨后,內(nèi)容逐步深入到記憶、學(xué)習(xí)、多智能體協(xié)作等高級主題,最終在第四部分落腳于安全護欄、評估監(jiān)」和資源優(yōu)化等至關(guān)重要的生產(chǎn)實踐環(huán)節(jié)。
這條路徑清晰地將讀者從構(gòu)建一個簡單的原型,一路引導(dǎo)至打造一個真正能在現(xiàn)實世界中穩(wěn)健運行的復(fù)雜智能系統(tǒng)。因此,這本指南不僅是技術(shù)的集合,更是一次寶貴的機會,讓我們得以一窺頂級科技公司內(nèi)部解決復(fù)雜 AI 工程問題的思維框架和實戰(zhàn)智慧。
這是我們整理的目錄中文版:
引言
是什么讓 AI 系統(tǒng)成為「智能體」?
第一部分
第一章:提示鏈
第二章:路由
第三章:并行化
第四章:反思
第五章:工具使用
第六章:規(guī)劃
第七章:多智能體
第二部分
第八章:記憶管理
第九章:學(xué)習(xí)與適應(yīng)
第十章:模型上下文協(xié)議 (MCP)
第十一章:目標(biāo)設(shè)定與監(jiān)控
第三部分
第十二章:異常處理與恢復(fù)
第十三章:人機協(xié)作(Human-in-the-Loop)
第十四章:知識檢索 (RAG)
第四部分
第十五章:智能體間通信 (A2A)
第十六章:資源感知型優(yōu)化
第十七章:推理技術(shù)
第十八章:護欄 / 安全模式
第十九章:評估與監(jiān)控
第二十章:優(yōu)先級排序
第二十一章:探索與發(fā)現(xiàn)
附錄
附錄 A:高級提示技術(shù)
附錄 B:AI 智能體…… 從 GUI 到現(xiàn)實世界環(huán)境
附錄 C:智能體框架速覽
附錄 D:使用 AgentSpace 構(gòu)建智能體(僅在線)
附錄 E:命令行中的 AI 智能體
附錄 F:深入底層:探秘智能體推理引擎
附錄 G:編碼智能體
下面,我們就來看看這本書的引言部分,以便對該書有一個大致的了解:
歡迎閱讀《智能體設(shè)計模式:構(gòu)建智能系統(tǒng)的實踐指南》。縱觀現(xiàn)代 AI 的發(fā)展,我們能清晰地看到一條演進路徑:從簡單的反應(yīng)式程序,到能夠理解上下文、做出決策并與環(huán)境及其他系統(tǒng)動態(tài)交互的復(fù)雜自主實體。這些實體,就是我們所說的智能體,以及由它們構(gòu)成的智能體系統(tǒng)。
強大的大型語言模型(LLMs)的出現(xiàn),為理解和生成類人文本與媒體內(nèi)容提供了前所未有的能力,并擔(dān)當(dāng)了許多智能體的「認知引擎」。然而,要將這些能力整合進一個能夠可靠達成復(fù)雜目標(biāo)的系統(tǒng),僅僅擁有一個強大的模型是遠遠不夠的。這還需要精心的結(jié)構(gòu)、巧妙的設(shè)計,以及對智能體如何感知、規(guī)劃、行動和交互的深思熟慮。
你可以將構(gòu)建智能系統(tǒng)想象成在一塊「畫布」上進行復(fù)雜的藝術(shù)創(chuàng)作或工程建設(shè)。這塊畫布并非空白的視覺空間,而是指底層的技術(shù)設(shè)施與框架,它們?yōu)橹悄荏w的存在和運作提供了環(huán)境與工具。它是你構(gòu)建智能應(yīng)用的基礎(chǔ),負責(zé)管理狀態(tài)、通信、工具調(diào)用以及邏輯流。
在這塊智能體的畫布上高效地進行構(gòu)建,絕非簡單地堆砌組件。你需要理解那些經(jīng)過驗證的技術(shù) —— 即「模式」—— 它們專為應(yīng)對設(shè)計和實現(xiàn)智能體行為時的常見挑戰(zhàn)而生。正如架構(gòu)模式指導(dǎo)建筑物的建造,或設(shè)計模式構(gòu)建軟件的結(jié)構(gòu)一樣,智能體設(shè)計模式為你提供了一套可復(fù)用的解決方案,用以處理在畫布上賦予智能體生命時會反復(fù)遇到的問題。
什么是智能體系統(tǒng)?
從核心上講,智能體系統(tǒng)是一種計算實體。它被設(shè)計用來感知其環(huán)境(數(shù)字環(huán)境,甚至可能包括物理環(huán)境),基于這些感知和一系列預(yù)設(shè)或習(xí)得的目標(biāo)來做出明智決策,并自主執(zhí)行動作以達成這些目標(biāo)。與遵循刻板、逐步指令的傳統(tǒng)軟件不同,智能體展現(xiàn)出了一定程度的靈活性和主動性。

想象一下,你需要一個系統(tǒng)來處理客戶咨詢。傳統(tǒng)系統(tǒng)可能會遵循固定的腳本。而一個智能體系統(tǒng)則能夠洞察客戶詢問的細微差別,訪問知識庫,與訂單管理等其他內(nèi)部系統(tǒng)交互,甚至可能會提出澄清性問題,并主動解決問題,有時還能預(yù)見客戶未來的需求。這些智能體就在你應(yīng)用程序基礎(chǔ)設(shè)施這塊「畫布」上運行,利用其上可用的服務(wù)和數(shù)據(jù)。
智能體系統(tǒng)通常具備以下特征:自主性(無需持續(xù)的人工監(jiān)督即可行動)、主動性(為達成目標(biāo)而主動發(fā)起行動)和反應(yīng)性(能有效應(yīng)對環(huán)境變化)。它們從根本上是目標(biāo)導(dǎo)向的,始終為實現(xiàn)目標(biāo)而努力。一項關(guān)鍵能力是工具使用,這使其能與外部 API、數(shù)據(jù)庫或服務(wù)交互 —— 相當(dāng)于有效地將其能力延伸到了自身畫布之外。它們擁有記憶,能在多次交互中保留信息,并能與用戶、其他系統(tǒng),甚至是在相同或互聯(lián)畫布上運行的其他智能體進行通信。
要有效地實現(xiàn)這些特性,會引入相當(dāng)大的復(fù)雜性。例如,智能體如何在畫布上的多個步驟之間維持狀態(tài)?它如何決定何時以及如何使用工具?不同智能體之間的通信如何管理?你又該如何構(gòu)建系統(tǒng)的彈性,以應(yīng)對意外結(jié)果或錯誤?
為何模式在智能體開發(fā)中至關(guān)重要
正因存在這些復(fù)雜性,智能體設(shè)計模式才變得不可或缺。它們并非僵化的規(guī)則,而是久經(jīng)考驗的模板或藍圖,為智能體領(lǐng)域的標(biāo)準(zhǔn)設(shè)計與實現(xiàn)挑戰(zhàn)提供了行之有效的方案。通過識別和應(yīng)用這些設(shè)計模式,你將獲得能增強智能體結(jié)構(gòu)、可維護性、可靠性和效率的解決方案,從而更好地在你的畫布上進行構(gòu)建。
使用設(shè)計模式可以幫助你避免為管理對話流、集成外部能力或協(xié)調(diào)多智能體行動等任務(wù)「重造輪子」。它們提供了一種通用語言和結(jié)構(gòu),使你的智能體邏輯更清晰,也更容易被他人(以及未來的你)理解和維護。應(yīng)用專為錯誤處理或狀態(tài)管理設(shè)計的模式,可以直接構(gòu)建出更健壯、更可靠的系統(tǒng)。借助這些成熟的方法,你能加快開發(fā)進程,從而專注于應(yīng)用的獨有之處,而非智能體行為的基礎(chǔ)機制。
本書提煉了 21 個關(guān)鍵的設(shè)計模式,它們是在各種技術(shù)畫布上構(gòu)建復(fù)雜智能體的基礎(chǔ)模塊和核心技術(shù)。理解并應(yīng)用這些模式,將極大地提升你有效設(shè)計和實現(xiàn)智能系統(tǒng)的能力。
本書概覽及使用方法
《智能體設(shè)計模式:構(gòu)建智能系統(tǒng)的實踐指南》旨在成為一份實用且易于上手的資源。本書的核心重點是清晰地解釋每一種智能體模式,并提供具體、可運行的代碼示例來展示其實現(xiàn)。在 21 個專門的章節(jié)中,我們將探索從構(gòu)建序列化操作(提示鏈)和外部交互(工具使用)等基礎(chǔ)概念,到多智能體協(xié)作和自我修正等高級主題的各種設(shè)計模式。
本書按章節(jié)組織,每一章深入探討一個智能體模式。在每個章節(jié)中,你都會看到:
- 模式概覽:清晰解釋該模式及其在智能體設(shè)計中的作用。
- 實際應(yīng)用與用例:通過真實場景說明該模式的寶貴價值及其帶來的好處。
- 動手代碼示例:提供實用、可運行的代碼,演示如何使用主流智能體開發(fā)框架實現(xiàn)該模式。在這里,你將看到如何在技術(shù)畫布的上下文中應(yīng)用模式。
- 關(guān)鍵要點:總結(jié)最核心的內(nèi)容,便于快速回顧。
- 參考文獻:提供用于進一步探索的資源,幫助你更深入地學(xué)習(xí)該模式及相關(guān)概念。
雖然各章節(jié)按循序漸進的方式編排,但你完全可以將本書作為參考手冊,直接翻到能解決你項目中特定挑戰(zhàn)的章節(jié)。附錄部分全面介紹了高級提示技巧、在真實環(huán)境中應(yīng)用 AI 智能體的原則,以及主流智能體框架的概覽。作為補充,我們還提供了僅在線發(fā)布的實踐教程,為你提供使用 AgentSpace 等特定平臺以及命令行界面構(gòu)建智能體的分步指導(dǎo)。全書始終強調(diào)實際應(yīng)用,我們強烈建議你運行代碼示例,親手實驗,并將其改造,用以在你的畫布上構(gòu)建屬于你自己的智能系統(tǒng)。
我常聽到的一個好問題是:「AI 發(fā)展如此之快,為何要寫一本可能很快就過時的書?」我的初衷恰恰相反。正是因為技術(shù)日新月異,我們才更需要退后一步,去識別那些正在穩(wěn)定下來的底層原則。我所討論的 RAG、反思、路由、記憶等模式,正在成為基礎(chǔ)的構(gòu)建模塊。本書旨在邀請讀者一同反思這些核心思想,它們?yōu)槲覀兾磥淼臉?gòu)建工作奠定了基石。人類需要這樣沉淀基礎(chǔ)模式的時刻。
所用框架簡介
為了給代碼示例提供一個可觸摸的「畫布」(亦可參見附錄),我們將主要使用三個主流的智能體開發(fā)框架。LangChain 及其狀態(tài)化擴展 LangGraph,提供了一種靈活的方式來鏈接語言模型和其他組件,為構(gòu)建復(fù)雜的操作序列和圖譜提供了一塊堅實的畫布。Crew AI 提供了一個結(jié)構(gòu)化的框架,專門用于編排多個 AI 智能體的角色和任務(wù),使其成為一塊特別適合協(xié)作型智能體系統(tǒng)的畫布。谷歌智能體開發(fā)工具包 (Google ADK) 則提供了一系列用于構(gòu)建、評估和部署智能體的工具與組件,構(gòu)成了另一塊有價值的畫布,且通常與谷歌的 AI 基礎(chǔ)設(shè)施集成。
這些框架代表了智能體開發(fā)畫布的不同側(cè)面,各有千秋。通過展示跨越這些工具的示例,你將更廣泛地理解,無論你為自己的智能體系統(tǒng)選擇何種特定技術(shù)環(huán)境,這些模式都可以應(yīng)用。所有示例都旨在清晰地闡明模式的核心邏輯及其在相應(yīng)框架畫布上的實現(xiàn),并以清晰易懂和實用為重。
讀完本書,你不僅將理解 21 個核心智能體模式背后的基本概念,還將掌握有效應(yīng)用它們的實踐知識和代碼示例,從而能夠在自己選定的開發(fā)畫布上,構(gòu)建出更加智能、更能干、更自主的系統(tǒng)。現(xiàn)在,就讓我們開啟這段實踐之旅吧!
































