精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

2025 年:如何構建有效的智能體

發布于 2025-1-24 10:36
瀏覽
0收藏

本篇文章來自Anthropic,我用大模型給翻譯了一下,以下是全文。

過去一年里,我們與數十個團隊合作,跨行業構建大型語言模型(LLM)智能體。通常,最成功的實施案例并不是使用復雜的框架或專門的庫。相反,它們是用簡單、可組合的模式來構建的。

在這篇文章中,我們分享了從與客戶合作及自行構建智能體中學到的經驗,并為開發者提供了構建高效智能體的實用建議。

什么是智能體?

“Agent”可以通過多種方式定義。一些客戶將智能體定義為完全自主的系統,這些系統在較長時間內獨立運行,使用各種工具完成復雜任務。另一些客戶則用這個詞來描述更規范的實現,這些實現遵循預定義的工作流程。在 Anthropic,我們將所有這些變體歸類為智能體系統,但在工作流程和智能體之間劃定了重要的架構區別:

  • 工作流程是通過預定義的代碼路徑來編排LLMs和工具的系統。
  • 另一方面,智能體(Agents)是這樣的系統:大型語言模型(LLMs)在其中動態地指導自己的流程和工具使用,保持對如何完成任務的控制。

下面,我們將詳細探討這兩種類型的智能體系統。在附錄 1(“實踐中的智能體”)中,我們描述了客戶在使用這類系統時發現特別有價值的兩個領域。

智能體可分成兩種:一種是工作流智能體,一種是自主智能體

何時(以及何時不)使用智能體

使用LLMs構建應用程序時,我們建議盡可能尋找最簡單的解決方案,僅在需要時增加復雜性。這可能意味著根本不需要構建智能體系統。代理系統通常會以更高的延遲和成本來換取更好的任務性能,你應該考慮何時這種權衡是合理的。

當需要更多的復雜性時,工作流程為明確定義的任務提供了可預測性和一致性,而當需要大規模的靈活性和模型驅動的決策時,智能體通常是更好的選擇。然而,對于許多應用來說,通過檢索和上下文示例優化單個大型語言模型(LLM)調用通常已經足夠了。

何時以及如何使用框架

有許多框架使得智能體系統更易于實現,包括:

LangChain的LangGraph ;  

Amazon Bedrock 的 AI 智能體框架

Rivet,一個拖放式 GUI LLM工作流構建器;

以及Vellum,另一個用于構建和測試復雜工作流程的 GUI 工具。

這些框架通過簡化標準的低級任務(如調用大型語言模型(LLM)、定義和解析工具以及將調用串聯在一起)來使入門變得容易。然而,它們通常會創建額外的抽象層,這可能會使底層提示和響應變得難以調試。它們還可能讓人產生增加復雜性的誘惑,而實際上一個更簡單的設置就足夠了。

我們建議開發者首先直接使用大型語言模型(LLM)API:許多模式可以用幾行代碼實現。如果你確實使用了框架,請確保你理解底層代碼。對底層機制的錯誤假設是客戶錯誤的常見來源。

查看我們的實用指南以獲取一些示例實現。(https://github.com/anthropics/anthropic-cookbook/tree/main/patterns/agents)

構建模塊、工作流程和智能體

在本節中,我們將探討在生產環境中常見的智能體系統模式。我們將從基礎構建塊——增強型大型語言模型(LLM)開始,逐步增加復雜性,從簡單的組合工作流到自主代理。

構建模塊:增強的LLM

智能體系統的基本構建模塊是一個LLM,通過檢索、工具和記憶等增強功能進行擴展。我們當前的模型(Claude)能夠主動利用這些能力——生成自己的搜索查詢、選擇合適的工具,并決定保留哪些信息。

2025 年:如何構建有效的智能體-AI.x社區

                                                   增強的LLM

我們建議重點關注實施的兩個關鍵方面:根據您的具體用例定制這些功能,并確保它們為您的LLM提供一個簡單、文檔齊全的接口。雖然實現這些增強功能的方法有很多,但一種方法是通過我們最近發布的模型上下文協議,該協議允許開發者通過簡單的客戶端實現與不斷增長的第三方工具生態系統集成。

在本文的剩余部分,我們將假設每個LLM調用都能訪問這些增強功能。

工作流程:提示鏈

提示鏈將任務分解為一系列步驟,其中每個LLM調用處理前一個調用的輸出。您可以在任何中間步驟添加程序化檢查(見下圖中的“gate”),以確保過程仍在正軌上。

2025 年:如何構建有效的智能體-AI.x社區

                                                    提示鏈工作流程


何時使用此工作流:何時使用此工作流:當任務可以輕松且清晰地分解為固定的子任務時,這種工作流最為理想。主要目標是通過使每個LLM調用成為一個更簡單的任務,以犧牲延遲為代價來換取更高的準確性。

提示鏈有用的示例:生成營銷文案,然后將其翻譯成另一種語言。撰寫文檔大綱,檢查大綱是否符合特定標準,然后根據大綱編寫文檔。

代碼示例:

2025 年:如何構建有效的智能體-AI.x社區


工作流程:路由

路由對輸入進行分類并將其引導至專門的后續任務。這種工作流程允許關注點分離,并構建更專業的提示。如果沒有這種工作流程,針對一種輸入的優化可能會損害其他輸入的性能。

2025 年:如何構建有效的智能體-AI.x社區

何時使用此工作流程:路由適用于復雜任務,這些任務具有明顯不同的類別,更適合分開處理,并且分類可以通過LLM或更傳統的分類模型/算法準確處理。

路由有用的示例:

將不同類型的客戶服務查詢(一般問題、退款請求、技術支持)引導至不同的下游流程、提示和工具。

將簡單/常見問題路由到較小的模型(如 Claude 3.5 Haiku),將困難/不常見的問題路由到更強大的模型(如 Claude 3.5 Sonnet),以優化成本和速度。

工作流程:并行化

LLMs 有時可以同時處理一個任務,并通過編程方式聚合它們的輸出。這種工作流程,即并行化,表現為兩種關鍵變體:

分段:將任務分解為并行運行的獨立子任務。

投票:多次運行同一任務以獲得多樣化的輸出。

2025 年:如何構建有效的智能體-AI.x社區

何時使用此工作流程:當劃分的子任務可以并行化以加快速度,或需要多個視角或嘗試以獲得更高置信度的結果時,并行化是有效的。對于具有多重考慮的復雜任務,LLMs通常在每個考慮由單獨的LLM調用處理時表現更好,這樣可以對每個特定方面進行集中關注。

并行化有用的示例:

分段:

  • 實施防護措施,其中一個模型實例處理用戶查詢,而另一個模型則篩選其中的不當內容或請求。這種方法通常比讓同一個LLM調用同時處理防護措施和核心響應表現更好。
  • 自動化評估以評估LLM性能,其中每個LLM調用評估模型在給定提示下性能的不同方面。

投票:

  • 審查一段代碼以查找漏洞,其中多個不同的提示會審查并在發現問題時標記代碼。
  • 評估給定內容是否不當,通過多個提示評估不同方面或要求不同的投票閾值以平衡誤報和漏報。

工作流程:協調器-工作者

在協調者-工作者工作流中,一個中央LLM動態地分解任務,將它們分配給工作者LLMs,并綜合它們的結果。

何時使用此工作流:此工作流非常適合那些無法預測所需子任務的復雜任務(例如,在編碼中,需要更改的文件數量以及每個文件中更改的性質可能取決于任務)。盡管它在拓撲結構上相似,但與并行化的關鍵區別在于其靈活性——子任務并非預先定義,而是由協調器根據具體輸入確定。

編排器-工作者模式有用的示例:

  • 每次對多個文件進行復雜更改的編碼產品。
  • 搜索涉及從多個來源收集和分析信息以尋找可能相關信息的任務。

工作流程:評估者-優化器

在評估器-優化器工作流程中,一個LLM調用生成響應,而另一個在循環中提供評估和反饋。

2025 年:如何構建有效的智能體-AI.x社區

何時使用此工作流程:當我們有明確的評估標準,并且迭代改進能帶來可衡量的價值時,此工作流程尤為有效。適合的兩個標志是,首先,當人類明確表達其反饋時,LLM 的響應可以得到明顯改善;其次,LLM 能夠提供此類反饋。這類似于人類作家在創作一份精煉文檔時可能經歷的迭代寫作過程。

評估優化器有用的示例:

  • 文學翻譯中存在一些細微差別,譯者LLM可能最初未能捕捉到,但評估者LLM可以提供有益的批評。
  • 需要多輪搜索和分析以收集全面信息的復雜搜索任務,評估者決定是否需要進行進一步搜索。

Agents  智能體

智能體在生產中逐漸嶄露頭角,隨著關鍵能力的成熟——理解復雜輸入、參與推理和規劃、可靠地使用工具以及從錯誤中恢復。智能體的工作始于人類用戶的命令或互動討論。一旦任務明確,智能體便獨立規劃和操作,可能會返回給人類以獲取更多信息或判斷。在執行過程中,智能體在每一步從環境中獲取“真實情況”(如工具調用結果或代碼執行)以評估其進展至關重要。智能體隨后可以在檢查點或遇到阻礙時暫停以獲取人類反饋。任務通常在完成時終止,但為了保持控制,也常見包含停止條件(如最大迭代次數)。

智能體可以處理復雜的任務,但它們的實現通常很簡單。它們通常只是LLMs在循環中根據環境反饋使用工具。因此,清晰而周到地設計工具集及其文檔至關重要。我們在附錄 2(“提示工程你的工具”)中擴展了工具開發的最佳實踐。

2025 年:如何構建有效的智能體-AI.x社區

何時使用智能體:智能體可用于開放式問題,這些問題難以或無法預測所需的步驟數量,且無法硬編碼固定路徑。LLM可能會運行多個回合,你必須對其決策能力有一定程度的信任。智能體的自主性使其成為在可信環境中擴展任務的理想選擇。

智能體的自主性意味著更高的成本和錯誤累積的可能性。我們建議在沙盒環境中進行廣泛測試,并設置適當的防護措施。

智能體有用的示例:

以下示例來自我們自己的實現:

一個編碼智能體,用于解決 SWE-bench 任務,這些任務涉及根據任務描述對多個文件進行編輯;

參考我們的“computer use”實現,其中 Claude 使用計算機完成任務。

2025 年:如何構建有效的智能體-AI.x社區

                                             編碼智能體的高級流程

2025 年:如何構建有效的智能體-AI.x社區

                                              結合并自定義這些模式

這些構建模塊并非一成不變。它們是開發者可以根據不同使用場景塑造和組合的常見模式。與任何LLM功能一樣,成功的關鍵在于衡量性能并迭代實現。重申一遍:只有在明顯改善結果時,才應考慮增加復雜性。

總結

在LLM領域的成功并不在于構建最復雜的系統,而在于構建適合您需求的正確系統。從簡單的提示開始,通過全面評估進行優化,只有在更簡單的解決方案不足時,才添加多步驟的智能體系統。

在實現智能體時,我們嘗試遵循三個核心原則:

1、保持智能體設計的簡潔性。

2、優先考慮透明度,明確展示智能體的規劃步驟。

3、精心設計您的智能體-計算機界面(ACI),通過全面的工具文檔和測試。

框架可以幫助您快速入門,但在進入生產階段時,不要猶豫減少抽象層并使用基本組件進行構建。遵循這些原則,您可以創建不僅功能強大,而且可靠、可維護并贏得用戶信任的智能體。

由 Erik Schluntz 和 Barry Zhang 撰寫。本作品借鑒了我們在 Anthropic 構建智能體的經驗以及客戶分享的寶貴見解,對此我們深表感激。

參考:

??https://www.anthropic.com/research/building-effective-agents?cnotallow=1d9695e219e413270aa88f92565888be??

本文轉載自??AI 思與行??,作者:cc ????

收藏
回復
舉報
回復
相關推薦
国产精品久久久久久久电影| 69av一区二区三区| 欧美自拍资源在线| 国产美女免费看| 国语精品一区| 亚洲精品国产电影| 一区二区三区韩国| 免费在线国产视频| 国产欧美一区二区精品婷婷| 亚洲精品日产aⅴ| 亚洲影院在线播放| 亚洲精品国产首次亮相| 国产视频精品自拍| 亚洲AV成人精品| av免费在线一区| 亚洲国产毛片aaaaa无费看| 日韩精品欧美专区| 色欲av伊人久久大香线蕉影院| 欧美a一区二区| 久久久久久久久久久av| 日韩在线视频免费看| 偷拍亚洲精品| 欧美成人女星排名| 天天影视色综合| 欧美黄色网页| 黑人与娇小精品av专区| 黄色片免费在线观看视频| 国产在线视频网址| www.在线成人| 91香蕉视频在线下载| 国产日韩久久久| 国产美女一区| 国产+成+人+亚洲欧洲| 内射一区二区三区| 日韩一区二区在线| 亚洲午夜av久久乱码| 香蕉视频污视频| 中文字幕日韩在线| 日韩一区二区三区视频| 亚洲小视频网站| 国产激情欧美| 欧美伊人久久久久久久久影院| 精品人妻一区二区三区四区在线| 污的网站在线观看| 亚洲理论在线观看| 强伦女教师2:伦理在线观看| jizz在线观看中文| 欧美国产精品专区| 亚洲欧美日韩精品综合在线观看| 免费在线黄色影片| 久久久久国产免费免费| 久久久久久久免费| 日本大片在线观看| 91色porny| 欧美激情导航| 国产在线观看免费| 欧美国产欧美综合| 一区二区三区av| 免费网站看v片在线a| 国产精品久久久久久久第一福利| 亚洲精品一区二区三区av| jizz亚洲| 一区二区在线看| 久久综合久久久久| 国产99在线| 欧美日韩精品在线| 国产一级不卡毛片| 四虎影视国产精品| 日韩欧美久久久| 日本道中文字幕| 天天做夜夜做人人爱精品 | 国产乱人乱偷精品视频a人人澡| 轻轻草成人在线| 成人在线国产精品| 亚洲AV无码成人片在线观看 | 国产肥白大熟妇bbbb视频| 精品久久综合| 超碰97人人做人人爱少妇| 久久亚洲成人av| 噜噜噜在线观看免费视频日韩 | 在线免费观看av网址| 久久成人av少妇免费| 91成人在线看| 欧美xxx.com| 亚洲视频精选在线| xxxx18hd亚洲hd捆绑| 欧美成人ⅴideosxxxxx| 欧美乱妇15p| 亚洲激情 欧美| 欧美肉体xxxx裸体137大胆| 久久人人爽人人爽人人片亚洲| 九九免费精品视频| 麻豆成人精品| 99久久精品无码一区二区毛片| 色wwwwww| 亚洲婷婷综合色高清在线| 青草青青在线视频| 日本久久久久| 日韩经典一区二区三区| 中国1级黄色片| 影音先锋在线一区| 国产精品在线看| 亚洲 另类 春色 国产| 国产精品国产三级国产普通话99| 国产九色porny| 视频欧美精品| 亚洲片av在线| 久久精品视频6| 精品在线免费视频| 欧美一级日本a级v片| 日韩电影免费观看| 欧美日韩mp4| 一区二区三区四区免费| 国产精品大片免费观看| 国产精品精品一区二区三区午夜版| 国产夫绿帽单男3p精品视频| 国产精品丝袜黑色高跟| 欧美三级一级片| 91国内精品| 久久在精品线影院精品国产| 无码日韩精品一区二区| 不卡视频一二三| 男人添女人下部视频免费| 成人一级视频| 亚洲色图35p| 久久一区二区三区视频| 成人性生交大片免费看视频在线| 影音先锋在线亚洲| 亚洲a∨精品一区二区三区导航| 日韩av在线免播放器| 久久艹精品视频| 国精产品一区一区三区mba视频| 日本在线成人一区二区| 亚洲精品福利电影| 日韩av一区二区在线| 在线看成人av| www.亚洲色图| 国产免费黄视频| 精品亚洲自拍| 91精品国产九九九久久久亚洲| 亚洲精品网站在线| 亚洲影视在线播放| 苍井空张开腿实干12次| 欧美fxxxxxx另类| av成人观看| 欧美6一10sex性hd| 精品对白一区国产伦| 免费网站观看www在线观| 国产69精品久久99不卡| 日韩欧美视频免费在线观看| 精品视频在线观看网站| 久久国产色av| 亚洲av永久无码国产精品久久 | 色婷婷**av毛片一区| 最新中文字幕免费| 国产精品日日摸夜夜摸av| 成年人三级黄色片| 伊人久久大香线| 91福利视频导航| 2021中文字幕在线| 精品视频在线播放| 中文字幕永久在线| 中文字幕一区二区三区在线观看| 三级性生活视频| 欧美日韩国内| 久久福利电影| yiren22亚洲综合| 久久av资源网站| 成人毛片在线精品国产| 黄色一区二区在线| 亚洲国产日韩一区无码精品久久久| 日韩精品亚洲一区| 国产精品av免费| 91久久精品无嫩草影院| 91精品国产91久久久久久吃药| 欧美男男同志| 欧美高清性hdvideosex| 成人免费看片98| 久久久不卡影院| 老司机av网站| 裸体素人女欧美日韩| 中文字幕欧美日韩一区二区| 亚洲乱码一区| 国产精品99久久99久久久二8| 亚乱亚乱亚洲乱妇| 亚洲精品一区二区三区在线观看| 男人天堂av在线播放| 亚洲欧洲av在线| av2014天堂网| 久久爱www久久做| 日韩国产一级片| 999久久久免费精品国产| yy111111少妇影院日韩夜片| 亚洲第一二三四区| 久久国产加勒比精品无码| 偷拍25位美女撒尿视频在线观看| 欧美裸体一区二区三区| 中文字幕第15页| 亚洲欧美乱综合| 性欧美一区二区| 成人av网站免费| 国产乱码一区二区三区四区| 99亚洲视频| 国产一二三四五| 精品久久久久久久久久久aⅴ| 成人欧美一区二区三区视频 | 精品久久久网站| 在线观看国产精品入口男同| 亚洲成人资源在线| 亚洲伦理一区二区三区| 久久色成人在线| 亚洲国产精品狼友在线观看| 另类中文字幕网| 粉嫩虎白女毛片人体| 亚洲视频观看| 超薄肉色丝袜足j调教99| 欧美伦理在线视频| 精品亚洲欧美日韩| 中文字幕一区二区三区中文字幕| 国产精品欧美在线| 欧美大片免费高清观看| 午夜精品www| 色爱综合区网| 欧美国产乱视频| 国产视频中文字幕在线观看| 在线观看欧美成人| 国产精品视频二区三区| 国产丝袜一区视频在线观看| 国产 日韩 欧美 精品| 欧美一级夜夜爽| 艳妇乳肉豪妇荡乳av| 欧美亚洲国产bt| 一级黄色av片| 欧美在线|欧美| 在线免费观看日韩视频| 欧美性受极品xxxx喷水| 懂色av蜜臀av粉嫩av分享吧最新章节| 欧美日韩国产精品| 一级片中文字幕| 精品久久久国产| 国产三级av片| 高跟丝袜欧美一区| 香蕉免费毛片视频| 精品久久久中文| 青青操免费在线视频| 婷婷久久综合九色综合绿巨人| 免费观看一级视频| 精品久久久久久久久久久久| 久久高清免费视频| 红桃视频成人在线观看| av黄色在线播放| 色婷婷av一区二区三区gif | 日韩欧美一区中文| 精品黑人一区二区三区在线观看 | 国产日韩精品在线看| 国产亚洲一区二区精品| 婷婷视频在线| 久久国产精品亚洲| jizz一区二区三区| 2019中文字幕在线| 国产日韩另类视频一区| 国产成人鲁鲁免费视频a| 免费在线成人激情电影| 91精品啪aⅴ在线观看国产| 日本少妇精品亚洲第一区| 99国产在线观看| 美女主播精品视频一二三四| 麻豆久久久av免费| 久久美女视频| 黄色成人在线免费观看| 亚洲永久免费| 性欧美1819| 高清不卡一区二区在线| 中文成人无字幕乱码精品区| 国产三区在线成人av| 伊人久久久久久久久久久久久久| 亚洲精品ww久久久久久p站| 国产精品成人国产乱| 日本乱人伦一区| 国产v在线观看| 日韩毛片在线看| 黄网站在线播放| 欧美亚洲第一区| 亚洲国产一区二区久久| 国产免费一区| 日韩精品电影| 免费毛片网站在线观看| 麻豆精品在线视频| 人妻体内射精一区二区三区| 国产视频亚洲色图| 久久9999久久免费精品国产| 在线观看亚洲一区| 黑人精品一区二区三区| 在线观看视频亚洲| 美女在线视频免费| 91在线看www| 国产影视一区| 成年人午夜视频在线观看| 麻豆91在线播放| 麻豆国产精品一区| 亚洲卡通动漫在线| 天堂av免费在线观看| 精品欧美一区二区久久| www.在线播放| 4444欧美成人kkkk| 天堂av一区| 亚洲制服欧美久久| 免费一区视频| 一级黄色电影片| 中文字幕亚洲欧美在线不卡| 成人公开免费视频| 亚洲精品国产免费| 欧美成人精品一区二区男人看| 午夜精品久久久久久久白皮肤 | 免费在线黄色网| 欧美最猛性xxxxx直播| 人妻va精品va欧美va| 久久色免费在线视频| 国产第一亚洲| 亚欧精品在线| 久久婷婷麻豆| 亚洲国产第一区| 亚洲一区二区三区免费视频| 国产欧美日韩成人| xvideos国产精品| 日韩在线观看不卡| 欧美亚洲另类久久综合| 一本久道综合久久精品| 野战少妇38p| 亚洲激情六月丁香| 国产免费久久久| 久久精品国产久精国产思思| 成人看片毛片免费播放器| 日本一区二区三区免费观看| 久久这里有精品15一区二区三区| 中文字幕 亚洲一区| 精品久久久久久中文字幕大豆网| 亚洲精品国产精品乱码不卡| 欧美成人精品在线视频| 精品久久免费| 青青视频免费在线| 国产成人激情av| 久久久久亚洲av无码专区| 日韩欧美国产电影| 欧美色图天堂| 国产伦精品一区二区三毛| 99国产精品| 国产精品一区二区入口九绯色| 激情av一区二区| 女人天堂在线| 国产日韩在线观看av| 国产高清久久| 国偷自产av一区二区三区麻豆| 亚洲一区视频在线观看视频| 可以免费看毛片的网站| 97国产精品久久| 亚洲影院天堂中文av色| 国产熟人av一二三区| 国产精品午夜免费| 国产一区二区在线视频聊天| 欧美成人免费网| 欧美人与动xxxxz0oz| 国产成人亚洲精品无码h在线| 国产午夜精品美女毛片视频| 一二区在线观看| 欧美另类xxx| 日韩精品导航| 簧片在线免费看| 亚洲欧美一区二区三区国产精品| 亚洲黄色在线观看视频| 欧美亚洲国产视频小说| 日韩美女一区二区三区在线观看| 中文字幕久久久久久久| 欧美日韩在线影院| 蜜桃视频在线观看免费视频网站www| 91久久久久久久久久久久久| 亚洲经典在线看| 中文字幕人妻一区二区三区在线视频| 欧美日产在线观看| 国产精品国精产品一二| 久久综合伊人77777麻豆| 久久黄色级2电影| 国产精品第56页| 这里只有精品视频| 国产伦精品一区二区三区在线播放| 日韩免费毛片视频| 亚洲精品写真福利| 香蕉视频成人在线| 91久久精品视频| 亚洲欧美日本日韩| 日本黄色小说视频| 国产亚洲视频在线| 国产厕拍一区| 欧美一级xxxx| 欧美日韩国产一区中文午夜| 久久五月精品| 日韩久久久久久久| proumb性欧美在线观看| 国产一区二区自拍视频| 欧美一级视频在线观看|