精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Anthropic 工程實踐《如何構建多智能體研究系統》

發布于 2025-6-19 06:43
瀏覽
0收藏

一、多智能體系統的優點

  1. 應對研究工作的不可預測性:研究工作通常面臨開放性問題,難以提前預知所需步驟。多智能體系統能夠根據調查過程中出現的新線索動態調整研究方向,與人類研究者類似,自主決策探索路徑,適應復雜多變的研究主題,避免了線性、一次性流程的局限性。
  2. 促進信息壓縮與專注:子智能體通過并行處理不同問題方面,利用各自獨立的上下文窗口,同時探索問題的多個維度,之后提煉出重要信息傳遞給主研究智能體,實現對海量信息的高效壓縮,同時各子智能體獨立運行,減少路徑依賴,保障研究的全面性與獨立性。
  3. 性能擴展優勢:當個體智能達到一定水平后,多智能體系統通過協同合作可實現性能的指數級增長,如同人類社會在信息時代因集體智慧和協作能力而取得的飛速發展。內部評估顯示,以 Claude Opus 4 為主智能體、Claude Sonnet 4 為子智能體的多智能體系統,在處理需要同時探索多個獨立方向的廣度優先查詢任務時,性能超出單智能體 Claude Opus 4 達 90.2%。
  4. 充分利用令牌資源:分析發現,在 BrowseComp 評估中,令牌使用量可解釋 80% 的性能差異,多智能體架構通過將任務分配給具有獨立上下文窗口的多個智能體,增加并行推理能力,有效擴展令牌使用,最新 Claude 模型在提升令牌使用效率方面也發揮了顯著的乘數效應。

二、架構概述

Anthropic 工程實踐《如何構建多智能體研究系統》-AI.x社區

  1. 編排 - 工作者模式:采用主智能體協調、子智能體并行工作的架構。用戶提交查詢后,主智能體分析查詢、制定策略并創建子智能體,子智能體同時探索問題的不同方面,充當智能過濾器,通過迭代使用搜索工具收集信息并返回給主智能體,最終由主智能體整合結果并生成最終回答,區別于傳統靜態檢索的檢索增強生成(RAG)方法,該架構通過多步搜索動態發現相關信息。
  2. 詳細工作流程:以 LeadResearcher 為主智能體,先在內存中保存計劃,避免上下文窗口超限時丟失計劃,然后創建多個子智能體,子智能體獨立進行網絡搜索、評估工具結果并返回發現,LeadResearcher 根據返回結果決定是否需要進一步研究,可創建更多子智能體或優化策略,最終將所有發現傳遞給 CitationAgent 處理引用,確?;卮饻蚀_引用來源。

三、提示工程與智能體評估

Anthropic 工程實踐《如何構建多智能體研究系統》-AI.x社區

  1. 像智能體一樣思考:通過模擬工具觀察智能體基于提示和工具的每一步操作,及時發現智能體的錯誤模式,如過度搜索、查詢過于冗長等,以準確的心理模型為基礎,針對性地優化提示。
  2. 教會協調者如何分配任務:主智能體需將查詢分解為子任務并清晰描述給子智能體,包括目標、輸出格式、工具和來源使用指南及任務邊界等,避免子智能體重復工作或遺漏信息,早期因任務描述簡單模糊導致子智能體誤解任務或執行相同搜索,后來通過詳細描述提升了任務分配的有效性。
  3. 根據查詢復雜度調整努力程度:在提示中嵌入努力程度的調整規則,明確不同類型任務所需的智能體數量和工具調用次數,使主智能體能高效分配資源,防止在簡單查詢上過度投入。
  4. 工具設計與選擇至關重要:智能體與工具的接口如同人機接口般關鍵,為智能體提供明確的工具使用啟發式規則,如優先檢查所有可用工具、匹配工具使用與用戶意圖等,同時確保工具描述清晰準確,以避免智能體因工具描述不佳而誤用工具。
  5. 讓智能體自我改進:Claude 4 模型具備優秀的提示工程能力,可診斷智能體失敗原因并提出改進建議,通過創建工具測試智能體,發現工具關鍵細節和問題,優化工具描述,顯著縮短后續智能體完成任務的時間。
  6. 先廣泛搜索再逐步縮小范圍:引導智能體采取與專家人類研究員類似的搜索策略,先進行簡短、廣泛的查詢,評估可用信息后再逐步聚焦,避免智能體直接使用過長、過于具體的查詢導致結果過少。
  7. 引導思考過程:利用擴展思考模式作為可控的草稿紙,主智能體借助思考規劃方法,子智能體在工具結果后進行交錯思考,評估質量、識別差距并優化下次查詢,提升智能體在適應任務方面的效果。
  8. 并行工具調用的優勢:復雜研究任務涉及多信息源探索,早期智能體的串行搜索效率低下,引入主智能體并行創建多個子智能體以及子智能體并行使用多個工具的方式,大幅縮短了復雜查詢的研究時間,提高了信息覆蓋范圍。

四、對智能體的有效評估

  1. 立即開始小樣本評估:在智能體開發早期,小規模測試案例就能顯著展現提示調整等變更的影響,及時發現低垂果實般的顯著提升效果,避免因等待大規模評估而延誤優化時機。
  2. 大規模有效利用大型語言模型(LLM)作為評判者:研究輸出通常為自由形式文本且答案不唯一,LLM 適合用于評判輸出,可依據評分標準評估輸出的準確性、引用準確性、完整性、來源質量和工具效率等多方面,通過單次 LLM 調用輸出分數和通過 / 失敗等級,實現與人類判斷高度一致且可擴展的評估方式。
  3. 人工評估彌補自動化不足:人工測試能發現自動化評估遺漏的邊緣情況,如智能體在特殊查詢上產生幻覺答案、系統故障或存在細微的來源選擇偏差等,有助于針對性地優化智能體的提示等,完善智能體的行為表現。

五、生產可靠性與工程挑戰

Anthropic 工程實踐《如何構建多智能體研究系統》-AI.x社區

  1. 智能體的狀態保持與錯誤處理:智能體在長時間運行中需保持狀態,為此要可靠地執行代碼并處理錯誤,構建可在錯誤發生后從中斷處恢復的系統,并借助模型的智能讓智能體在工具失敗等情況下靈活適應,結合重試邏輯和定期檢查點等確定性保障措施。
  2. 調試新方法的需求:智能體的動態決策和非確定性增加了調試難度,添加全面的生產追蹤功能,監測智能體的決策模式和交互結構等,幫助診斷智能體失敗原因,系統性地解決問題。
  3. 部署的協調問題:智能體系統是高度狀態化的持續運行系統,部署更新時需防止新代碼破壞正在運行的智能體,采用彩虹部署策略,逐步將流量從舊版本轉移到新版本,確保更新過程的平穩過渡。
  4. 同步執行的瓶頸與異步執行的挑戰:目前主智能體的同步執行方式造成信息流瓶頸,而異步執行雖能增加并行性,卻也帶來了結果協調、狀態一致性和錯誤傳播等新的挑戰,未來隨著模型能力提升,異步執行的性能優勢將更受重視。

六、總結

構建多智能體系統從原型到生產面臨諸多挑戰,如:代碼的生產化改造、錯誤的級聯效應、狀態管理等,但這些系統在開放式研究任務中展現出巨大價值。

通過精心的工程設計、全面的測試、細致的提示與工具設計、穩健的運營實踐以及跨部門協作,能夠可靠地大規模運行,為用戶解決復雜問題帶來變革,如發現商業機會、輔助醫療決策、解決技術難題等。

七、額外建議

  1. 具有狀態變化的智能體的最終狀態評估:評估多輪對話中修改持久狀態的智能體時,聚焦于最終狀態而非每輪交互,對于復雜工作流,可設置離散檢查點,確保各階段狀態變化符合預期。
  2. 長期對話管理:生產智能體在超長對話中需智能壓縮和存儲記憶,采用總結已完成工作階段、外部存儲關鍵信息等策略,必要時創建新子智能體并保持對話連貫性。
  3. 子智能體輸出至文件系統以減少信息失真:通過文件系統獨立存儲子智能體輸出,僅向協調智能體傳遞輕量級引用,避免信息在多階段處理中丟失,同時降低對話歷史中的令牌開銷,特別適用于結構化輸出的生成。

本文轉載自????CourseAI????,作者:CourseAI

收藏
回復
舉報
回復
相關推薦
www.97超碰| 女人又爽又黄免费女仆| 视频在线观看入口黄最新永久免费国产| 国产一区二区三区四区五区美女| 久久99青青精品免费观看| 视频免费在线观看| 日本综合视频| 亚洲精选免费视频| 久久久久久久久久久久久久久久av| 中文人妻av久久人妻18| 亚洲成人av| 日韩av在线一区| 中文字幕 欧美日韩| 国内小视频在线看| 国产精品天天摸av网| av日韩中文字幕| 中文字幕欧美人妻精品| 中文乱码免费一区二区三区下载| 日韩电影中文字幕一区| 天天综合网久久| 超碰成人av| 亚洲欧美区自拍先锋| 久久99国产精品99久久| 国产乱码精品一区二区| 国产日本精品| 欧美韩日一区二区| 亚洲熟女毛茸茸| 亚洲午夜久久| 亚洲国产精品电影| www.国产福利| 日本一区二区三区视频在线| 精品久久久久久久久中文字幕 | 在线观看免费av网址| rebdb初裸写真在线观看| 自拍视频在线观看一区二区| 日本在线成人一区二区| 色欲久久久天天天综合网| 久久爱另类一区二区小说| 欧美一级视频在线观看| 久久人人爽人人爽人人| 91精品久久久久久久久久不卡| 亚洲视频在线免费看| 大乳护士喂奶hd| 成人av激情人伦小说| 在线不卡中文字幕播放| 国产一伦一伦一伦| 欧美va在线观看| 欧美日韩亚洲一区二区| 精品无码一区二区三区爱欲| 在线免费观看的av| 亚洲欧洲一区二区在线播放| 日日噜噜噜噜夜夜爽亚洲精品| 亚洲 欧美 自拍偷拍| 成人免费视频网站在线观看| 亚洲xxxx视频| www.97av.com| 国产69精品久久久久777| 2022国产精品| 国产白浆在线观看| 国产精品一区二区久久不卡 | 99精品人妻无码专区在线视频区| 蜜桃免费网站一区二区三区| 国产精品露脸自拍| 最近中文字幕免费在线观看| 日本不卡免费在线视频| 国产精品视频成人| 国产又粗又长又黄| 国产在线精品一区二区三区不卡 | 免费黄色片视频| 日日欢夜夜爽一区| 国产精品扒开腿做爽爽爽视频| 中文字幕乱码视频| 国产乱码精品一区二区三| 444亚洲人体| 天天干天天爽天天操| 久久综合色天天久久综合图片| 日韩中文一区二区三区| 高清免费电影在线观看| 亚洲一二三专区| 国产男女无遮挡| 草莓视频成人appios| 91精品国产综合久久国产大片| xxxxwww一片| 蜜桃成人av| 日韩在线观看精品| 久一视频在线观看| 久久看片网站| 97se国产在线视频| 欧美在线一卡| 亚洲色大成网站www久久九九| 真实国产乱子伦对白视频| 性欧美xxx69hd高清| 精品视频色一区| 四虎成人免费视频| 国产欧美日韩一区二区三区四区| 中文字幕精品国产| 影音先锋制服丝袜| 国产精品啊啊啊| 97涩涩爰在线观看亚洲| 真实的国产乱xxxx在线91| 麻豆91在线播放免费| 91在线免费视频| 青青草超碰在线| 18欧美乱大交hd1984| 被灌满精子的波多野结衣| 丝袜诱惑一区二区| 欧美久久久一区| 亚洲精品久久一区二区三区777| 亚洲人成亚洲精品| 日韩中文字在线| 欧美一区二区激情视频| 六月婷婷色综合| 国产不卡一区二区在线观看| 久青草国产在线| 亚洲蜜臀av乱码久久精品蜜桃| 欧美一级视频免费看| 日韩欧美专区| 亚洲福利视频免费观看| 国产一区二区精彩视频| 亚洲一区视频| 99精品国产高清一区二区| 你懂的视频在线免费| 夜夜精品视频一区二区| 免费涩涩18网站入口| 色妞ww精品视频7777| 亚洲人成网在线播放| 国产一级做a爱免费视频| 久久亚洲影院| 久草精品电影| 国产成人在线视频免费观看| 日本韩国精品一区二区在线观看| 亚洲综合伊人久久| 久久香蕉精品香蕉| 正在播放国产一区| 波多野结衣国产| 播五月开心婷婷综合| 少妇熟女一区二区| 新片速递亚洲合集欧美合集| 精品久久一二三区| 国产在线一卡二卡| 日本va欧美va精品发布| 日产国产精品精品a∨| 538视频在线| 欧美成人高清电影在线| 日韩精品久久久久久久的张开腿让 | 欧美精品一区二区三区高清aⅴ | 神马久久精品| 亚洲一区二区在线免费观看视频| 久久久久久三级| 色88888久久久久久影院| 欧美贵妇videos办公室| 99久久亚洲精品日本无码| 欧美激情一区三区| 99视频在线免费| 网友自拍区视频精品| 97国产精品视频| 亚洲AV无码一区二区三区少妇| 中文字幕日本乱码精品影院| 另类小说第一页| 国产一区二区三区四区五区 | 精品久久免费视频| 国产精品资源在线看| 亚洲精品国产精品国自产观看| 成人看片毛片免费播放器| 中文字幕亚洲一区| 波多野结衣午夜| 国产午夜三级一区二区三| 国产xxxxx视频| 国产乱码精品一区二区三区四区| 国产成人涩涩涩视频在线观看| 国产在线91| 欧美三级电影在线看| 亚洲毛片亚洲毛片亚洲毛片| 国产在线一区观看| 日本成人在线不卡| www.爱久久| 97色在线视频| 九色视频在线播放| 欧美午夜在线观看| 激情无码人妻又粗又大| 国内久久精品视频| 亚洲中文字幕无码一区二区三区| 99国产精品久久一区二区三区| 高清视频欧美一级| 天堂а√在线8种子蜜桃视频 | 在线看日韩av| 91在线公开视频| 亚洲综合另类小说| 岛国精品资源网站| 日av在线不卡| 国产成人三级视频| 老司机成人在线| 国产成人综合精品| 巨大荫蒂视频欧美另类大| 精品国产污网站| 成人黄色激情视频| 亚洲欧美国产毛片在线| 中文字幕成人免费视频| 国产婷婷精品| 亚洲国产精品久久久久久女王| 9999精品视频| 91成品人片a无限观看| 视频一区二区三区不卡| 91麻豆精品国产自产在线| 日本高清不卡码| 亚洲色大成网站www久久九九| 在线中文字日产幕| 日韩精品欧美精品| 国产91porn| 综合干狼人综合首页| 国产91精品入口17c| xx欧美视频| 欧美久久精品午夜青青大伊人 | 国产精品综合视频| 国产精品少妇在线视频| 女人天堂亚洲aⅴ在线观看| 日韩精品无码一区二区三区| 一区中文字幕电影| 国产欧美一区二区| 国产在线看片免费视频在线观看| 视频在线一区二区| 免费资源在线观看| 欧美一区二区三区免费视频| 欧美日韩a v| 亚洲国产精品影院| 三级av在线免费观看| 26uuu精品一区二区在线观看| 国产在线视频三区| 天堂久久久久va久久久久| 久久久亚洲国产精品| 亚洲精品国产偷自在线观看| 日本最新一区二区三区视频观看| 国产图片一区| 91色精品视频在线| 福利视频亚洲| 国产精品爽爽爽| 欧美一区国产| 97精品视频在线播放| 4438x成人网全国最大| 在线视频中文亚洲| 888av在线| 一区二区三欧美| 欧美3p视频在线观看| 亚洲国产精品悠悠久久琪琪| 性一交一乱一精一晶| 欧美男人的天堂一二区| 一区二区日韩视频| 欧美日韩午夜在线| www.亚洲激情| 在线中文字幕一区| 成人免费毛片视频| 午夜精品一区二区三区三上悠亚| 亚洲国产综合久久| 亚洲一区二区高清| 国产精品成人国产乱| 亚洲欧美另类图片小说| 色欲人妻综合网| 亚洲欧洲精品一区二区三区不卡 | 亚洲日本韩国一区| 我要看一级黄色录像| 国产精品久久久久影院老司| 欧美老熟妇乱大交xxxxx| 国产午夜精品久久| 91成人在线免费视频| 久久一留热品黄| 人妻av无码一区二区三区| 久久免费的精品国产v∧| 91激情视频在线观看| 日本一区二区三区国色天香| 黄色片网站免费| 国产精品三级视频| 亚洲一区电影在线观看| 国产精品女人毛片| 97成人资源站| 一区二区免费看| 伊人国产在线观看| 色悠悠久久综合| 中文字幕永久免费视频| 日韩欧美精品在线| 欧美一区二区三区黄片| 亚洲精品国产精品乱码不99按摩| 天天干,天天操,天天射| 国产亚洲精品久久| 日本三级视频在线观看| 久久国产精彩视频| 成年网站在线视频网站| 欧美在线视频网| 成人福利片在线| 91沈先生作品| 国产精品115| 日韩在线第一区| 欧美黄色一区二区| 国产日产欧美视频| 蜜桃av一区二区在线观看| 97免费公开视频| 成人爱爱电影网址| 亚洲女优在线观看| 一区二区在线看| 日韩黄色片网站| 日韩欧美国产精品一区| 六十路在线观看| 超薄丝袜一区二区| 色老头在线一区二区三区| 国产精品久久久久久久美男| 激情视频亚洲| 欧美日韩在线高清| 国产精品videosex极品| 男人天堂1024| 国产一区二区美女| 国精产品一区一区三区免费视频| 亚洲欧洲日产国产综合网| 欧美一区二区三区不卡视频| 日韩一区二区三免费高清| 欧美美女搞黄| 久久久久亚洲精品国产| 欧美影视资讯| 蜜桃网站成人| 午夜精品久久99蜜桃的功能介绍| 丁香啪啪综合成人亚洲| 国产精品538一区二区在线| 国产 xxxx| 亚洲一区二区视频| 久久国产香蕉视频| 日韩av有码在线| 最新国产露脸在线观看| 国产99久久久欧美黑人 | 天天干天天曰天天操| 国产三级精品三级| 国产午夜福利一区二区| 69堂亚洲精品首页| 福利视频在线看| 欧美一区二三区| 红杏成人性视频免费看| 日本不卡久久| 鲁大师影院一区二区三区| yjizz视频| 亚洲美女偷拍久久| 一本到在线视频| 最新91在线视频| 亚洲va中文在线播放免费| 久久久久一区二区三区| 精品动漫一区| 色综合久久五月| 亚洲国产成人91porn| 精品免费久久久| 久久久精品一区二区| 日韩欧美三区| 美女在线免费视频| 国产在线精品国自产拍免费| 四虎国产成人精品免费一女五男| 色婷婷综合久色| 九色在线免费| 国产精品草莓在线免费观看 | 快播日韩欧美| 国产欧美不卡| 久久久久久亚洲中文字幕无码| 精品成人国产在线观看男人呻吟| 欧美视频xxx| 97久久精品人搡人人玩| 欧美a一欧美| 久久这里只有精品23| 99天天综合性| 在线观看免费国产视频| 日韩女优制服丝袜电影| 91精品国产黑色瑜伽裤| 国产亚洲情侣一区二区无| 亚洲精选在线| caopor在线| 在线视频欧美区| 中文日本在线观看| 国产精品伦子伦免费视频| 日韩中文首页| 最新国产黄色网址| 国产精品欧美精品| 精品久久国产视频| 久久久欧美精品| 亚洲另类av| 色网站在线视频| 亚洲一区二区视频| 日韩在线无毛| 欧美在线播放视频| 网友自拍一区| 国产精品区在线| 亚洲精品国产视频| 婷婷在线免费观看| 国产成人高清激情视频在线观看| 亚洲小说图片| 原创真实夫妻啪啪av| 香蕉影视欧美成人| 国产日本在线观看| 国产一区视频在线播放| 亚洲毛片av| a天堂中文字幕| 在线91免费看| 美女高潮视频在线看| 亚洲国产欧美一区二区三区不卡| 国产精品资源在线| 国产又黄又爽又色| 欧美另类交人妖| 深爱激情综合网|