精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

你的AI Agent為何總“犯傻”?構(gòu)建生產(chǎn)級(jí)Agent所需的六大工程原則

人工智能
當(dāng)你被 Agent 的行為所困擾時(shí),記住,問(wèn)題很可能出在缺失的工具、模糊的提示或不足的上下文,而不是模型本身的局限性。

隨著 AI Agent 技術(shù)的興起,許多開(kāi)發(fā)者都投入到構(gòu)建智能體的浪潮中,但很快就會(huì)發(fā)現(xiàn),讓 Agent 穩(wěn)定、可靠地工作遠(yuǎn)非想象中容易。它們時(shí)而產(chǎn)生幻覺(jué),時(shí)而偏離軌道,時(shí)而做出一些令人費(fèi)解的“愚蠢”行為。最近,來(lái)自 app.build 的 Arseni Kravchenko 分享了他們?cè)跇?gòu)建生產(chǎn)級(jí) AI Agent 過(guò)程中總結(jié)出的六大核心工程原則。這些原則摒棄了虛無(wú)縹緲的“提示詞黑魔法”,回歸到堅(jiān)實(shí)的軟件工程基礎(chǔ)。對(duì)于正在或計(jì)劃使用 Go 構(gòu)建 AI Agent 的開(kāi)發(fā)者來(lái)說(shuō),這是一份寶貴的實(shí)踐指南。

圖片

原則一:投資你的系統(tǒng)提示 (System Prompt)

許多人對(duì)“提示詞工程”持懷疑態(tài)度,認(rèn)為它充滿了“我奶奶快不行了,請(qǐng)幫幫我”之類的奇技淫巧。然而,作者指出,現(xiàn)代 LLM 真正需要的是直接、詳細(xì)、清晰且無(wú)矛盾的上下文,而非情感操控。

對(duì)于開(kāi)發(fā)者而言,你要做的就是不要耍小聰明,要把系統(tǒng)提示當(dāng)作給 Agent 的API 文檔來(lái)寫(xiě)。

當(dāng)你為 Agent 提供一個(gè)通過(guò) os/exec 調(diào)用的工具時(shí),不要只告訴它工具的名字。在系統(tǒng)提示中清晰地說(shuō)明:

  • 工具的完整命令是什么。
  • 每個(gè)參數(shù)的含義、類型和格式
  • 預(yù)期的輸出格式以及如何解析它。
  • 前置條件和錯(cuò)誤情況

一個(gè)詳盡的系統(tǒng)提示是 Agent 可靠行為的基石。

原則二:拆分上下文 (Split the Context)

“上下文工程”是比“提示詞工程”更重要的概念。巨大的、單一的上下文不僅成本高、延遲大,還會(huì)導(dǎo)致模型出現(xiàn)“注意力衰減”,忽略掉關(guān)鍵信息。

作者建議大家:默認(rèn)只提供最少必要知識(shí),并通過(guò)工具讓 Agent 在需要時(shí)主動(dòng)獲取更多上下文。

與其在初始提示中塞入整個(gè)項(xiàng)目的源代碼,不如:

  • 提供文件列表:在提示中只給出項(xiàng)目的文件樹(shù)結(jié)構(gòu)。
  • 提供 read_file 工具:讓 Agent 在需要時(shí),通過(guò)調(diào)用這個(gè)工具來(lái)讀取特定文件的內(nèi)容。
  • 上下文壓縮:在 Agent 的反饋循環(huán)中,主動(dòng)使用工具(甚至另一個(gè) LLM)來(lái)壓縮和總結(jié)日志、工具輸出等動(dòng)態(tài)信息,避免上下文無(wú)限膨脹。


圖片


如上圖所示,將一個(gè)龐大的任務(wù)分解為多個(gè)具有專注上下文的、可編排的子任務(wù),是構(gòu)建高效 Agent 的關(guān)鍵。

原則三:精心設(shè)計(jì)你的工具 (Design Tools Carefully)

工具是 AI Agent 的核心。設(shè)計(jì)給 Agent 用的工具,比設(shè)計(jì)給人用的 API 更具挑戰(zhàn)性,因?yàn)?LLM 不會(huì)“讀心術(shù)”,它們會(huì)毫不留情地濫用你留下的任何漏洞。

作者建議:把你的 Agent 當(dāng)成一個(gè)聰明但容易分心的初級(jí)開(kāi)發(fā)者,為它設(shè)計(jì) API:

  • 保持粒度一致:工具(函數(shù))應(yīng)該有相似的抽象層次。不要混用一個(gè) read_byte 和一個(gè) deploy_to_kubernetes
  • 限制數(shù)量和參數(shù):一個(gè)典型的工程 Agent 通常只有不到 10 個(gè)核心工具,每個(gè)工具只有 1-3 個(gè)嚴(yán)格類型的參數(shù)。
  • 追求冪等性:盡可能讓工具是冪等的,這可以極大地簡(jiǎn)化 Agent 的狀態(tài)管理和錯(cuò)誤恢復(fù)邏輯。
  • 清晰、無(wú)歧義、無(wú)冗余:確保沒(méi)有兩個(gè)工具的功能是重疊的,這會(huì)讓 LLM 感到困惑。

原則四:設(shè)計(jì)一個(gè)反饋循環(huán) (Design a Feedback Loop)

一個(gè)沒(méi)有驗(yàn)證和反饋的 Agent 是不可靠的。優(yōu)秀的 Agent 系統(tǒng)總是將 LLM 的創(chuàng)造力與傳統(tǒng)軟件的嚴(yán)格性結(jié)合起來(lái),形成一個(gè)“演員-評(píng)論家”(Actor-Critic)模型:讓 LLM Actor 自由創(chuàng)造,讓嚴(yán)格的 Critic 程序來(lái)驗(yàn)證。

對(duì)于開(kāi)發(fā)者來(lái)說(shuō),這是一個(gè)天然的優(yōu)勢(shì)領(lǐng)域!

  • Actor (LLM):負(fù)責(zé)生成代碼、配置文件或執(zhí)行計(jì)劃。
  • Critic:負(fù)責(zé)執(zhí)行一系列自動(dòng)化驗(yàn)證:
  • 代碼能否編譯通過(guò)
  • 代碼能否通過(guò)測(cè)試
  • 代碼是否符合靜態(tài)檢查規(guī)范
  • 領(lǐng)域特定不變量:例如,如果 Agent 修改了訂單系統(tǒng),是否依然滿足“訂單總價(jià)等于所有商品價(jià)格之和”這個(gè)業(yè)務(wù)規(guī)則?

這個(gè)反饋循環(huán)不僅能過(guò)濾掉錯(cuò)誤的輸出,更是 Agent 學(xué)習(xí)和改進(jìn)的基礎(chǔ)。

原則五:用 LLM 驅(qū)動(dòng)錯(cuò)誤分析

當(dāng) Agent 失敗時(shí),手動(dòng)排查海量的日志是不現(xiàn)實(shí)的。我們可以構(gòu)建一個(gè)“meta Agent”來(lái)解決這個(gè)問(wèn)題,即讓另一個(gè) LLM 來(lái)分析失敗 Agent 的日志,找出問(wèn)題的根源。

流程

  1. 建立一個(gè)基線版本的 Agent。
  2. 部署多個(gè)實(shí)例并收集它們的執(zhí)行軌跡和日志。
  3. 將失敗的日志喂給一個(gè)具有更大上下文窗口(如 Gemini 1.5 Pro)的 LLM進(jìn)行分析。
  4. 根據(jù) LLM 的分析洞察,改進(jìn)基線 Agent 的系統(tǒng)提示、工具或上下文管理。

圖片


這個(gè)元循環(huán)能高效地發(fā)現(xiàn)我們自己可能忽略的系統(tǒng)性問(wèn)題。

原則六:令人沮喪的行為是系統(tǒng)問(wèn)題的信號(hào)

當(dāng) Agent 做出一些“愚蠢”的行為,比如忽略你的明確指令,或者用一種奇怪的方式繞過(guò)問(wèn)題時(shí),我們的第一反應(yīng)通常是“這個(gè)模型真笨”。

但作者建議:先調(diào)試你自己的系統(tǒng),再怪罪模型。

作者分享了一個(gè)親身經(jīng)歷:他明確要求 Agent 使用一個(gè)集成工具來(lái)獲取數(shù)據(jù),但 Agent 卻固執(zhí)地使用模擬的隨機(jī)數(shù)據(jù)。在憤怒地檢查日志后,他發(fā)現(xiàn)自己忘了給 Agent 配置正確的 API 密鑰。Agent 嘗試調(diào)用工具,連續(xù)失敗,最后只能選擇一個(gè)它能走的通的、但卻是錯(cuò)誤的路徑。

因此,當(dāng)你的 Agent 行為異常時(shí),請(qǐng)檢查一下:

  • 工具是否缺失? 它是否需要一個(gè) write_file 的能力而你沒(méi)有提供?
  • 提示是否模糊? 你是否清晰地解釋了工具的用法和邊界?
  • 上下文是否充分? 它是否因?yàn)槿鄙俦匾畔ⅲū热缫粋€(gè) API 密鑰或文件權(quán)限)而無(wú)法執(zhí)行任務(wù)?

小結(jié)

構(gòu)建有效的 AI Agent,關(guān)鍵不在于尋找一個(gè)能解決所有問(wèn)題的“銀彈”提示或高級(jí)框架。它回歸到了系統(tǒng)設(shè)計(jì)和嚴(yán)謹(jǐn)?shù)能浖こ?/span>

作為開(kāi)發(fā)者,我們應(yīng)該聚焦于:

  • 清晰的指令(通過(guò)系統(tǒng)提示)
  • 精簡(jiǎn)的上下文管理(通過(guò)工具和壓縮)
  • 健壯的工具接口(簡(jiǎn)單、冪等、無(wú)歧義)
  • 自動(dòng)化的驗(yàn)證循環(huán)(編譯、測(cè)試、靜態(tài)檢查)

當(dāng)你被 Agent 的行為所困擾時(shí),記住,問(wèn)題很可能出在缺失的工具、模糊的提示或不足的上下文,而不是模型本身的局限性。將錯(cuò)誤分析視為開(kāi)發(fā)過(guò)程中的一等公民,我們的目標(biāo)不是構(gòu)建一個(gè)從不犯錯(cuò)的完美 Agent,而是構(gòu)建一個(gè)可靠的、可恢復(fù)的、能夠優(yōu)雅地失敗并被我們迭代改進(jìn)的Agent。

責(zé)任編輯:武曉燕 來(lái)源: TonyBai
相關(guān)推薦

2025-06-03 01:43:00

2025-01-17 09:30:21

2018-02-23 17:04:00

AI時(shí)代需求漸旺工作崗位

2025-07-04 07:21:49

2024-12-19 09:50:04

2024-07-30 11:21:17

TTSAIAgent

2025-08-08 02:11:12

AI誤區(qū)PPT

2025-05-08 07:54:24

2017-04-21 07:10:12

谷歌AI芯片理由

2022-11-24 11:20:12

2025-06-05 01:55:00

AIAgent技術(shù)

2025-07-29 19:20:20

2025-06-03 01:04:00

MCPAI架構(gòu)

2025-04-01 08:05:00

智能體人工智能MCP

2024-07-22 13:58:33

2022-08-07 23:37:53

測(cè)試軟件開(kāi)發(fā)自動(dòng)化

2012-02-07 13:29:25

云計(jì)算HP

2024-07-02 11:16:21

2025-07-08 08:34:04

2012-07-18 19:31:43

IBMWebSphere徐剛
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美精品videos性欧美| 欧美亚洲综合久久| 久久青青草原一区二区| 日本欧美www| 蜜臀视频在线观看| 超碰免费公开在线| 成人的网站免费观看| 日本精品视频在线播放| 国产wwwwxxxx| 欧洲精品一区| 在线播放/欧美激情| 国产素人在线观看| 黄网页免费在线观看| 91麻豆123| 亚洲精品免费网站| 五月天婷婷导航| 亚洲午夜视频| www.欧美精品| 丰满少妇在线观看资源站| 成人短视频软件网站大全app| 午夜亚洲福利老司机| 在线观看日本一区| 日中文字幕在线| 国产精品影视在线观看| 国产福利精品视频| 日韩毛片在线播放| 亚洲九九在线| 中文字幕日韩在线播放| 人妻无码一区二区三区| 视频二区欧美毛片免费观看| 欧洲精品视频在线观看| 免费观看国产精品视频| 在线看福利影| 亚洲视频一区二区在线观看| 欧美亚州在线观看| 五月婷婷开心中文字幕| 国产成人一区在线| 91美女高潮出水| 在线观看xxxx| 美女国产一区| 欧美亚洲视频一区二区| 国产午夜福利一区二区| 一区二区三区在线电影| 日韩有码在线电影| а天堂中文在线资源| 热久久天天拍国产| 色系列之999| 精品一区二区6| 国际精品欧美精品| 国产亚洲精品91在线| 短视频在线观看| 粉嫩久久久久久久极品| 精品国免费一区二区三区| 中文写幕一区二区三区免费观成熟| 男人亚洲天堂| 欧美夫妻性生活| 伊人成人免费视频| 2020国产精品极品色在线观看| 欧美一区二区三区在线观看| 婷婷激情小说网| 国产一区二区三区免费观看在线| 欧美精品日韩综合在线| 尤物网站在线看| 影音先锋欧美激情| 日韩欧美国产三级电影视频| 丰满少妇中文字幕| 国产欧美啪啪| 精品sm捆绑视频| 亚洲一区二区三区四区五区六区| 亚洲人成网www| 国产亚洲视频在线观看| 国产美女网站视频| 亚洲国产精品久久久天堂| 欧美另类高清videos| 日韩精品一区二区av| 可以看av的网站久久看| 日本在线精品视频| 中文字幕在线观看高清| 国产一区二区不卡| 国产呦系列欧美呦日韩呦| 每日更新av在线播放| 国产精品久久久爽爽爽麻豆色哟哟| 中文一区一区三区免费| av电影在线免费| 色国产精品一区在线观看| 女同激情久久av久久| 国产欧美一区二区三区米奇| 亚洲无限av看| 侵犯稚嫩小箩莉h文系列小说| 韩国久久久久| 欧美一区视频在线| 97人妻一区二区精品免费视频| 大尺度一区二区| 欧洲国产精品| 青青青草视频在线| 91成人在线免费观看| 日本r级电影在线观看| 日韩成人午夜| 久久久国产91| 性色av免费观看| 国产成人精品影视| 色播亚洲视频在线观看| 日本aa在线| 欧美日韩一二三| 欧美一区二区免费在线观看| 日韩精品免费| 51色欧美片视频在线观看| 国产精品久久久久久69| 久久久精品黄色| 日本精品久久久久久久久久| 国产精品黄色片| 日韩二区三区在线| 国产成人自拍网站| 三级精品在线观看| 国产一区二区黄色| 在线视频国产区| 欧美久久一二区| 精品人妻少妇嫩草av无码| 欧美区国产区| 成人精品在线观看| 国产高清一级毛片在线不卡| 午夜精品国产更新| 男人操女人下面视频| 欧美色图国产精品| 欧美在线一区二区三区四| 丰满人妻一区二区三区无码av| 中文字幕亚洲在| wwww.国产| 国产探花一区| 欧美在线视频一区二区| 无码国产精品高潮久久99| 亚洲六月丁香色婷婷综合久久| 天天爱天天操天天干| 伊人精品一区| 国产91av在线| 外国精品视频在线观看 | 国精产品一区一区三区视频| 免费看一区二区三区| 日韩在线观看网站| 日韩xxx视频| 国产亚洲人成网站| 久久国产色av免费观看| 精品一区在线| 日本精品久久久久久久| 头脑特工队2在线播放| 狠狠色噜噜狠狠狠狠97| 亚洲精品乱码久久久久久久| 亚洲国产专区| 国产一区在线免费| 黄色污网站在线观看| 亚洲精品乱码久久久久久金桔影视| 久久久精品视频免费| 成人免费视频视频在线观看免费 | 黄色成人在线观看| 欧美久久久影院| 91九色丨porny丨极品女神| 国产一区在线精品| 久草视频这里只有精品| 国产精品国产| 欧美亚洲日本网站| 国产高清一级毛片在线不卡| 欧美性生活大片视频| 黄色激情小视频| 国内精品视频一区二区三区八戒| 日韩第一页在线观看| 亚洲开心激情| 777精品视频| 黄色电影免费在线看| 欧美少妇bbb| 永久免费看片直接| 粉嫩嫩av羞羞动漫久久久| 日韩精品xxxx| 国产一区二区三区网| 成人黄在线观看| 美女精品导航| 亚洲男人av电影| 亚洲综合视频在线播放| 一区二区成人在线| 无码人妻aⅴ一区二区三区 | 亚洲18女电影在线观看| 97人妻精品一区二区三区免 | av在线免费观看网| 91精品欧美久久久久久动漫| 国产亚洲第一页| 国产亚洲欧美日韩在线一区| 亚洲第一区第二区第三区| 在线观看不卡| 日韩伦理一区二区三区av在线| 亚洲视频资源| 7777精品久久久久久| 日本在线观看免费| 亚洲国产日韩一区| 在线免费观看av片| 午夜精品在线看| 久久精品国产亚洲AV成人婷婷| 国产99一区视频免费| 国产成人综合一区| 国产综合欧美| 亚洲日本精品一区| 日韩激情网站| 亚洲一区二区三区毛片| 欧美动物xxx| 久久久久久久国产精品| 又爽又大又黄a级毛片在线视频| 精品成人一区二区三区| 一区二区不卡视频在线观看| 婷婷综合另类小说色区| √天堂中文官网8在线| www久久久久| youjizz.com日本| 韩国一区二区三区| 熟妇人妻无乱码中文字幕真矢织江| 欧美福利网址| 一本久久a久久精品vr综合 | 精品人妻人人做人人爽| 成人嫩草影院| 欧美三日本三级少妇三99| 天堂va在线高清一区| 国产区精品视频| 欧美亚洲韩国| 欧美一区二区三区图| 天天色天天射天天综合网| 最近2019中文字幕一页二页| 日韩精品一二| 亚洲国产精品字幕| www香蕉视频| 91精品久久久久久久久99蜜臂| 日韩av黄色片| 亚洲一区二区在线播放相泽| 999久久久国产| 国产日产欧美一区二区三区 | 草民电影神马电影一区二区| 国产亚洲视频中文字幕视频| 欧美 中文字幕| 日韩一区二区免费高清| 在线观看国产小视频| 色婷婷久久久亚洲一区二区三区| 国产大片中文字幕在线观看| 亚洲激情自拍视频| 成年人一级黄色片| 亚洲欧洲精品一区二区精品久久久| 成人激情五月天| 久久精品视频在线免费观看| 一本色道综合久久欧美日韩精品| 99国产精品久久久| 亚洲一区二区观看| 久久久激情视频| 性欧美精品男男| 中文在线资源观看网站视频免费不卡 | 久久黄色免费看| 久久不射中文字幕| 北条麻妃av高潮尖叫在线观看| 久久精品伊人| 亚洲免费av一区二区三区| 三级影片在线观看欧美日韩一区二区| www.爱色av.com| 日韩一区欧美二区| 五月天亚洲视频| 加勒比av一区二区| 99热这里只有精品2| 国产99久久久久| 国产高清自拍视频| 国产欧美综合在线观看第十页| 欧美激情视频二区| 中文字幕亚洲精品在线观看| 成人在线观看免费完整| 一卡二卡欧美日韩| 免费日韩一级片| 色婷婷综合久久久中文一区二区| 7799精品视频天天看| 欧美三级日韩在线| 国产色视频在线| 亚洲成人av片| 免费理论片在线观看播放老| 一区二区成人精品| 毛片在线看网站| 久久久久久久999| 国产亚洲一区二区手机在线观看 | 亚洲午夜久久| 国产91av视频在线观看| 国自产拍偷拍福利精品免费一| 中国丰满人妻videoshd| 久久机这里只有精品| 无码人妻一区二区三区免费n鬼沢| 99精品久久只有精品| 国产精品久久免费观看| 一卡二卡三卡日韩欧美| 国产免费a视频| 日韩久久精品一区| 国产在线日本| 欧美激情精品久久久久久| 日本精品不卡| 福利视频一区二区三区| 欧美一区二区三区激情视频| 人妻互换免费中文字幕| 日韩 欧美一区二区三区| 国产在线a视频| 国产精品天天摸av网| 国产真实的和子乱拍在线观看| 欧美在线啊v一区| 亚洲国产精品久久久久久久| 永久免费精品影视网站| 操喷在线视频| 91精品久久久久久久久久另类| 欧美偷窥清纯综合图区| 日韩 欧美 自拍| 日韩精品一区第一页| 午夜性福利视频| 国产精品国产三级国产普通话三级| 国产稀缺真实呦乱在线| 欧美精品国产精品| 国产视频第一区| 91国产中文字幕| 无人区乱码一区二区三区| 先锋影音欧美| 久久久久国产精品一区三寸| 色诱av手机版| 亚洲色图欧美偷拍| 在线免费看av的网站| 亚洲免费av电影| 国产美女高潮在线观看| 亚洲自拍偷拍第一页| 99久久综合| 杨幂毛片午夜性生毛片| 久久久久久久综合日本| 日韩av片在线播放| 精品美女在线播放| 69xxx在线| 91免费看片在线| 婷婷综合久久| 在线不卡一区二区三区| 欧美国产日韩精品免费观看| 波多野结衣视频网站| 亚洲高清福利视频| 9765激情中文在线| 国产精品一区二区在线观看| 欧美日本中文| 国产ts在线观看| 一区二区国产盗摄色噜噜| 亚洲爱情岛论坛永久| 久久99热精品| 日本精品国产| 日本福利视频网站| 岛国精品在线观看| 中日韩精品视频在线观看| 亚洲国产中文字幕在线观看| 96av在线| 欧美福利一区二区三区| 久久一区激情| 久久久久久国产免费a片| 在线观看91精品国产入口| 国产小视频在线| 国产精品久久久久久久久久三级| 激情五月综合| 色噜噜狠狠永久免费| 国产精品激情偷乱一区二区∴| 夜夜躁狠狠躁日日躁av| 久久精品男人天堂| 日韩一二三区在线观看| 日本一本中文字幕| 99久久er热在这里只有精品15 | 久久www成人_看片免费不卡| 久久久久久国产精品无码| 日本高清不卡在线观看| 在线观看黄av| 91手机在线观看| 国产偷自视频区视频一区二区| 国产一区二区三区四区五区六区| 精品污污网站免费看| 菠萝蜜视频国产在线播放| 国产精品欧美久久| 亚洲一级在线| 91无套直看片红桃在线观看| 欧美一区永久视频免费观看| 国产极品人妖在线观看| 欧美高清视频一区| 国产美女视频一区| 国产三级av片| 日韩在线免费av| 精品淫伦v久久水蜜桃| 丁香婷婷激情网| 亚洲一区二区三区自拍| 国家队第一季免费高清在线观看| 成人国内精品久久久久一区| 亚洲二区在线| 亚洲一级片在线播放| 精品国产露脸精彩对白| 影视一区二区三区| 青青在线视频免费观看| 久久精品欧美一区二区三区不卡| 国产美女www爽爽爽视频| 欧美在线视频a| 欧美精品麻豆| 免费网站在线高清观看| 欧美大片日本大片免费观看| gogo亚洲高清大胆美女人体| 青青草综合视频| 国产欧美一区二区精品忘忧草| 亚洲第一成人av| 国产日韩在线看|