谷歌大神出手，免費發(fā)布《智能體設(shè)計模式》，AI Agent開發(fā)的終極秘籍

2025-10-09 09:05:00

近日，谷歌資深工程主管、杰出工程師?Antonio Gulli?在網(wǎng)上公開發(fā)布了自己的新書《Agentic Design Patterns（智能體設(shè)計模式）》。

當(dāng)前，AI 領(lǐng)域最火熱的浪潮無疑是 AI Agent（智能體）。從科技巨頭到創(chuàng)業(yè)公司，無數(shù)開發(fā)者正投身于構(gòu)建能夠自主理解、規(guī)劃和執(zhí)行復(fù)雜任務(wù)的智能系統(tǒng)。

然而，在這股「淘金熱」的背后，開發(fā)者們也面臨著巨大的挑戰(zhàn)：如何系統(tǒng)性地設(shè)計智能體的行為？如何確保系統(tǒng)的穩(wěn)定性和可靠性？如何避免一次又一次地「重造輪子」？整個領(lǐng)域迫切需要一套經(jīng)過實踐檢驗的「建筑圖紙」和方法論。

學(xué)習(xí)，如有一本好書，往往事半功倍。

近日，谷歌資深工程主管、杰出工程師 Antonio Gulli 在網(wǎng)上公開發(fā)布了自己的新書《Agentic Design Patterns（智能體設(shè)計模式）》。

對許多開發(fā)者來說，「設(shè)計模式（Design Pattern）」這個詞并不陌生。它曾在軟件工程領(lǐng)域扮演了「圣經(jīng)」般的角色，將無數(shù)前輩的最佳實踐固化為可復(fù)用的解決方案。而 Antonio Gulli 此舉的意義，正是在于為方興未艾的智能體開發(fā)領(lǐng)域，提供了首批系統(tǒng)性的「設(shè)計模式」，幫助開發(fā)者讓打造強大、可靠的智能體變得有章可循。

現(xiàn)在，雖然該書已經(jīng)在亞馬遜開啟預(yù)售（作者表示全部版稅將捐贈給拯救兒童組織），但感興趣的讀者也可以在谷歌文檔上免費查看全書。

地址：https://docs.google.com/document/d/1rsaK53T3Lg5KoGwvf8ukOUvbELRtH-V0LnOIFDxBryE/preview?tab=t.0#

光看其目錄，就能感覺到，讀完這本書，你就能非常全面地理解智能體 + 代碼：

從目錄的編排上，我們也能看出作者的深思熟慮。這本 400 多頁的著作的結(jié)構(gòu)堪稱一份精心設(shè)計的學(xué)習(xí)路線圖。

第一部分從提示鏈、路由和工具使用等最核心的單元操作入手，如同教授智能體的基本語法。隨后，內(nèi)容逐步深入到記憶、學(xué)習(xí)、多智能體協(xié)作等高級主題，最終在第四部分落腳于安全護欄、評估監(jiān)」和資源優(yōu)化等至關(guān)重要的生產(chǎn)實踐環(huán)節(jié)。

這條路徑清晰地將讀者從構(gòu)建一個簡單的原型，一路引導(dǎo)至打造一個真正能在現(xiàn)實世界中穩(wěn)健運行的復(fù)雜智能系統(tǒng)。因此，這本指南不僅是技術(shù)的集合，更是一次寶貴的機會，讓我們得以一窺頂級科技公司內(nèi)部解決復(fù)雜 AI 工程問題的思維框架和實戰(zhàn)智慧。

這是我們整理的目錄中文版：

引言

是什么讓 AI 系統(tǒng)成為「智能體」？

第一部分

第一章：提示鏈

第二章：路由

第三章：并行化

第四章：反思

第五章：工具使用

第六章：規(guī)劃

第七章：多智能體

第二部分

第八章：記憶管理

第九章：學(xué)習(xí)與適應(yīng)

第十章：模型上下文協(xié)議 (MCP)

第十一章：目標(biāo)設(shè)定與監(jiān)控

第三部分

第十二章：異常處理與恢復(fù)

第十三章：人機協(xié)作（Human-in-the-Loop）

第十四章：知識檢索 (RAG)

第四部分

第十五章：智能體間通信 (A2A)

第十六章：資源感知型優(yōu)化

第十七章：推理技術(shù)

第十八章：護欄 / 安全模式

第十九章：評估與監(jiān)控

第二十章：優(yōu)先級排序

第二十一章：探索與發(fā)現(xiàn)

附錄

附錄 A：高級提示技術(shù)

附錄 B：AI 智能體…… 從 GUI 到現(xiàn)實世界環(huán)境

附錄 C：智能體框架速覽

附錄 D：使用 AgentSpace 構(gòu)建智能體（僅在線）

附錄 E：命令行中的 AI 智能體

附錄 F：深入底層：探秘智能體推理引擎

附錄 G：編碼智能體

下面，我們就來看看這本書的引言部分，以便對該書有一個大致的了解：

歡迎閱讀《智能體設(shè)計模式：構(gòu)建智能系統(tǒng)的實踐指南》。縱觀現(xiàn)代 AI 的發(fā)展，我們能清晰地看到一條演進路徑：從簡單的反應(yīng)式程序，到能夠理解上下文、做出決策并與環(huán)境及其他系統(tǒng)動態(tài)交互的復(fù)雜自主實體。這些實體，就是我們所說的智能體，以及由它們構(gòu)成的智能體系統(tǒng)。

強大的大型語言模型（LLMs）的出現(xiàn)，為理解和生成類人文本與媒體內(nèi)容提供了前所未有的能力，并擔(dān)當(dāng)了許多智能體的「認知引擎」。然而，要將這些能力整合進一個能夠可靠達成復(fù)雜目標(biāo)的系統(tǒng)，僅僅擁有一個強大的模型是遠遠不夠的。這還需要精心的結(jié)構(gòu)、巧妙的設(shè)計，以及對智能體如何感知、規(guī)劃、行動和交互的深思熟慮。

你可以將構(gòu)建智能系統(tǒng)想象成在一塊「畫布」上進行復(fù)雜的藝術(shù)創(chuàng)作或工程建設(shè)。這塊畫布并非空白的視覺空間，而是指底層的技術(shù)設(shè)施與框架，它們?yōu)橹悄荏w的存在和運作提供了環(huán)境與工具。它是你構(gòu)建智能應(yīng)用的基礎(chǔ)，負責(zé)管理狀態(tài)、通信、工具調(diào)用以及邏輯流。

在這塊智能體的畫布上高效地進行構(gòu)建，絕非簡單地堆砌組件。你需要理解那些經(jīng)過驗證的技術(shù) —— 即「模式」—— 它們專為應(yīng)對設(shè)計和實現(xiàn)智能體行為時的常見挑戰(zhàn)而生。正如架構(gòu)模式指導(dǎo)建筑物的建造，或設(shè)計模式構(gòu)建軟件的結(jié)構(gòu)一樣，智能體設(shè)計模式為你提供了一套可復(fù)用的解決方案，用以處理在畫布上賦予智能體生命時會反復(fù)遇到的問題。

什么是智能體系統(tǒng)？

從核心上講，智能體系統(tǒng)是一種計算實體。它被設(shè)計用來感知其環(huán)境（數(shù)字環(huán)境，甚至可能包括物理環(huán)境），基于這些感知和一系列預(yù)設(shè)或習(xí)得的目標(biāo)來做出明智決策，并自主執(zhí)行動作以達成這些目標(biāo)。與遵循刻板、逐步指令的傳統(tǒng)軟件不同，智能體展現(xiàn)出了一定程度的靈活性和主動性。

想象一下，你需要一個系統(tǒng)來處理客戶咨詢。傳統(tǒng)系統(tǒng)可能會遵循固定的腳本。而一個智能體系統(tǒng)則能夠洞察客戶詢問的細微差別，訪問知識庫，與訂單管理等其他內(nèi)部系統(tǒng)交互，甚至可能會提出澄清性問題，并主動解決問題，有時還能預(yù)見客戶未來的需求。這些智能體就在你應(yīng)用程序基礎(chǔ)設(shè)施這塊「畫布」上運行，利用其上可用的服務(wù)和數(shù)據(jù)。

智能體系統(tǒng)通常具備以下特征：自主性（無需持續(xù)的人工監(jiān)督即可行動）、主動性（為達成目標(biāo)而主動發(fā)起行動）和反應(yīng)性（能有效應(yīng)對環(huán)境變化）。它們從根本上是目標(biāo)導(dǎo)向的，始終為實現(xiàn)目標(biāo)而努力。一項關(guān)鍵能力是工具使用，這使其能與外部 API、數(shù)據(jù)庫或服務(wù)交互 —— 相當(dāng)于有效地將其能力延伸到了自身畫布之外。它們擁有記憶，能在多次交互中保留信息，并能與用戶、其他系統(tǒng)，甚至是在相同或互聯(lián)畫布上運行的其他智能體進行通信。

要有效地實現(xiàn)這些特性，會引入相當(dāng)大的復(fù)雜性。例如，智能體如何在畫布上的多個步驟之間維持狀態(tài)？它如何決定何時以及如何使用工具？不同智能體之間的通信如何管理？你又該如何構(gòu)建系統(tǒng)的彈性，以應(yīng)對意外結(jié)果或錯誤？

為何模式在智能體開發(fā)中至關(guān)重要

正因存在這些復(fù)雜性，智能體設(shè)計模式才變得不可或缺。它們并非僵化的規(guī)則，而是久經(jīng)考驗的模板或藍圖，為智能體領(lǐng)域的標(biāo)準(zhǔn)設(shè)計與實現(xiàn)挑戰(zhàn)提供了行之有效的方案。通過識別和應(yīng)用這些設(shè)計模式，你將獲得能增強智能體結(jié)構(gòu)、可維護性、可靠性和效率的解決方案，從而更好地在你的畫布上進行構(gòu)建。

使用設(shè)計模式可以幫助你避免為管理對話流、集成外部能力或協(xié)調(diào)多智能體行動等任務(wù)「重造輪子」。它們提供了一種通用語言和結(jié)構(gòu)，使你的智能體邏輯更清晰，也更容易被他人（以及未來的你）理解和維護。應(yīng)用專為錯誤處理或狀態(tài)管理設(shè)計的模式，可以直接構(gòu)建出更健壯、更可靠的系統(tǒng)。借助這些成熟的方法，你能加快開發(fā)進程，從而專注于應(yīng)用的獨有之處，而非智能體行為的基礎(chǔ)機制。

本書提煉了 21 個關(guān)鍵的設(shè)計模式，它們是在各種技術(shù)畫布上構(gòu)建復(fù)雜智能體的基礎(chǔ)模塊和核心技術(shù)。理解并應(yīng)用這些模式，將極大地提升你有效設(shè)計和實現(xiàn)智能系統(tǒng)的能力。

本書概覽及使用方法

《智能體設(shè)計模式：構(gòu)建智能系統(tǒng)的實踐指南》旨在成為一份實用且易于上手的資源。本書的核心重點是清晰地解釋每一種智能體模式，并提供具體、可運行的代碼示例來展示其實現(xiàn)。在 21 個專門的章節(jié)中，我們將探索從構(gòu)建序列化操作（提示鏈）和外部交互（工具使用）等基礎(chǔ)概念，到多智能體協(xié)作和自我修正等高級主題的各種設(shè)計模式。

本書按章節(jié)組織，每一章深入探討一個智能體模式。在每個章節(jié)中，你都會看到：

模式概覽：清晰解釋該模式及其在智能體設(shè)計中的作用。
實際應(yīng)用與用例：通過真實場景說明該模式的寶貴價值及其帶來的好處。
動手代碼示例：提供實用、可運行的代碼，演示如何使用主流智能體開發(fā)框架實現(xiàn)該模式。在這里，你將看到如何在技術(shù)畫布的上下文中應(yīng)用模式。
關(guān)鍵要點：總結(jié)最核心的內(nèi)容，便于快速回顧。
參考文獻：提供用于進一步探索的資源，幫助你更深入地學(xué)習(xí)該模式及相關(guān)概念。

雖然各章節(jié)按循序漸進的方式編排，但你完全可以將本書作為參考手冊，直接翻到能解決你項目中特定挑戰(zhàn)的章節(jié)。附錄部分全面介紹了高級提示技巧、在真實環(huán)境中應(yīng)用 AI 智能體的原則，以及主流智能體框架的概覽。作為補充，我們還提供了僅在線發(fā)布的實踐教程，為你提供使用 AgentSpace 等特定平臺以及命令行界面構(gòu)建智能體的分步指導(dǎo)。全書始終強調(diào)實際應(yīng)用，我們強烈建議你運行代碼示例，親手實驗，并將其改造，用以在你的畫布上構(gòu)建屬于你自己的智能系統(tǒng)。

我常聽到的一個好問題是：「AI 發(fā)展如此之快，為何要寫一本可能很快就過時的書？」我的初衷恰恰相反。正是因為技術(shù)日新月異，我們才更需要退后一步，去識別那些正在穩(wěn)定下來的底層原則。我所討論的 RAG、反思、路由、記憶等模式，正在成為基礎(chǔ)的構(gòu)建模塊。本書旨在邀請讀者一同反思這些核心思想，它們?yōu)槲覀兾磥淼臉?gòu)建工作奠定了基石。人類需要這樣沉淀基礎(chǔ)模式的時刻。

所用框架簡介

為了給代碼示例提供一個可觸摸的「畫布」（亦可參見附錄），我們將主要使用三個主流的智能體開發(fā)框架。LangChain 及其狀態(tài)化擴展 LangGraph，提供了一種靈活的方式來鏈接語言模型和其他組件，為構(gòu)建復(fù)雜的操作序列和圖譜提供了一塊堅實的畫布。Crew AI 提供了一個結(jié)構(gòu)化的框架，專門用于編排多個 AI 智能體的角色和任務(wù)，使其成為一塊特別適合協(xié)作型智能體系統(tǒng)的畫布。谷歌智能體開發(fā)工具包 (Google ADK) 則提供了一系列用于構(gòu)建、評估和部署智能體的工具與組件，構(gòu)成了另一塊有價值的畫布，且通常與谷歌的 AI 基礎(chǔ)設(shè)施集成。

這些框架代表了智能體開發(fā)畫布的不同側(cè)面，各有千秋。通過展示跨越這些工具的示例，你將更廣泛地理解，無論你為自己的智能體系統(tǒng)選擇何種特定技術(shù)環(huán)境，這些模式都可以應(yīng)用。所有示例都旨在清晰地闡明模式的核心邏輯及其在相應(yīng)框架畫布上的實現(xiàn)，并以清晰易懂和實用為重。

讀完本書，你不僅將理解 21 個核心智能體模式背后的基本概念，還將掌握有效應(yīng)用它們的實踐知識和代碼示例，從而能夠在自己選定的開發(fā)畫布上，構(gòu)建出更加智能、更能干、更自主的系統(tǒng)。現(xiàn)在，就讓我們開啟這段實踐之旅吧！

責(zé)任編輯：張燕妮來源：機器之心

谷歌智能體開發(fā)者