精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Anthropic:怎么才能控制模型的行為,做好Agents?

人工智能
提示工程關(guān)注的是“怎么寫好提示詞”,上下文工程關(guān)注的是“怎么管理整個上下文狀態(tài)”——包括系統(tǒng)指令、工具、外部數(shù)據(jù)、消息歷史、MCP等所有信息。

嘿,大家好!這里是一個專注于前沿AI和智能體的頻道~

Anthropic 最近又發(fā)了一篇關(guān)于 AI Agents 的博客,過去幾個月已經(jīng)連續(xù)好幾篇了。

我覺得他們關(guān)于Agents的內(nèi)容整體都挺好的,寫的也很有實踐意義。

今天的分享,圍繞一個核心問題:如何配置上下文,才能讓模型持續(xù)輸出期望的行為。

TLDR:

上下文是有限資源,存在 Context Rot現(xiàn)象。 好的上下文工程 = 找到最小的高信號 token 集,最大化期望結(jié)果。

長時間任務(wù)三板斧:壓縮、結(jié)構(gòu)化筆記、子智能體。

新的趨勢是 Just-in-time策略:不預(yù)處理所有數(shù)據(jù),而是維護(hù)輕量級標(biāo)識符(文件路徑、鏈接),運(yùn)行時動態(tài)加載。

混合策略是實踐共識,Claude Code 采用混合模型:CLAUDE.md 直接放入上下文(預(yù)處理),glob/grep 讓 Agent 即時探索。

什么是上下文工程?

先說清楚概念。上下文指的是調(diào)用大模型時包含的所有 token。

而上下文工程就是在 LLM 固有約束下,優(yōu)化這些 token,以實現(xiàn)預(yù)期結(jié)果的工程問題。

簡單來說:提示工程關(guān)注的是“怎么寫好提示詞”,上下文工程關(guān)注的是“怎么管理整個上下文狀態(tài)”——包括系統(tǒng)指令、工具、外部數(shù)據(jù)、消息歷史、MCP等所有信息。

圖片圖片

早期,大多數(shù)用例是一次性的分類或文本生成任務(wù),寫好提示詞就夠了。

但現(xiàn)在我們要構(gòu)建的是能在多輪推理、長時間運(yùn)行的 Agent,這些 Agent 每次循環(huán)都會生成更多可能相關(guān)的數(shù)據(jù),這些信息必須被持續(xù)精煉。

為什么上下文很珍貴!

Anthropic的核心insight是:上下文是有限資源,邊際收益遞減

盡管模型能處理越來越大的上下文窗口,但研究發(fā)現(xiàn)了一個現(xiàn)象叫 Context Rot——隨著上下文 token 數(shù)量增加,模型準(zhǔn)確召回信息的能力會下降。

這不是某個模型的問題,而是所有模型的共性。

原因在于 Transformer 架構(gòu)本身:每個 token 都要關(guān)注(attend)其他所有 token,這產(chǎn)生了 n2 的兩兩關(guān)系。上下文越長,模型捕獲這些關(guān)系的能力就越被稀釋。

這意味著:好的上下文工程就是找到最小的、高信號的 token 集合,最大化期望結(jié)果的可能性。

上下文的構(gòu)成

Anthropic 給出了覆蓋上下文的各個組成部分:

System Prompts

要極其清晰,使用簡單直接的語言,并且要在正確的高度呈現(xiàn)想法。

那什么叫正確的高度?Anthropic 指出了兩個極端的失敗模式:

  • 一個是把復(fù)雜的、脆弱的 if-else 邏輯硬編碼進(jìn)提示詞
  • 另一個是提供模糊的、高層次的指導(dǎo),無法給 LLM 具體信號

最優(yōu)的高度在中間:足夠具體以有效引導(dǎo)行為,又足夠靈活讓模型獲得強(qiáng)啟發(fā)式指導(dǎo)。

圖片圖片

建議用 XML 標(biāo)簽或 Markdown 標(biāo)題組織提示詞(如 <background_information>## Tool guidance 等),但格式也逐漸變得不那么重要,因為模型越來越強(qiáng)了。

核心原則是:追求完整可以概述預(yù)期行為的最小集合。但是,最小不等于短——仍然需要給 Agent 足夠的前置信息。

Tools

工具讓 Agent 能與環(huán)境交互、拉取新上下文。

最常見的失敗模式是:工具集臃腫,覆蓋太多功能,或?qū)е率褂媚膫€工具的決策點(diǎn)模糊不清。

如果人都無法明確說出某個情況該用哪個工具,AI Agent 更做不到。

Examples

Few-shot prompting 是公認(rèn)的有效方法。

但 Anthropic 提到,不建議把一堆邊緣案例塞進(jìn)提示詞,試圖闡述 LLM 應(yīng)該遵循的每條規(guī)則。

相反,應(yīng)該想辦法構(gòu)建一組多樣的、典型的示例,有效展示 Agent 的預(yù)期行為。

對 LLM 來說,示例就是一圖勝千言。

從預(yù)處理到即時策略

傳統(tǒng)做法是用基于向量的檢索在推理前就把相關(guān)上下文準(zhǔn)備好。

但現(xiàn)在越來越多人在用 Just-in-time 上下文策略。

核心思路:不預(yù)處理所有相關(guān)數(shù)據(jù),而是維護(hù)輕量級標(biāo)識符(文件路徑、存儲查詢、網(wǎng)頁鏈接等),用工具在運(yùn)行時動態(tài)加載數(shù)據(jù)到上下文。

Anthropic 自己的 Claude Code 就是這么做的。模型可以寫目標(biāo)查詢、存儲結(jié)果,利用 Bash 命令如 head 和 tail 分析大量數(shù)據(jù),而不用把完整數(shù)據(jù)對象加載到上下文。

這種方式模仿人類認(rèn)知:我們不會記住整個信息語料庫,而是引入外部組織和索引系統(tǒng)(文件系統(tǒng)、收件箱、書簽)按需檢索相關(guān)信息。

這種方法還實現(xiàn)了 Progressive Disclosure ——讓 Agent 通過探索逐步發(fā)現(xiàn)相關(guān)上下文。

每次交互產(chǎn)生的上下文為下一個決策提供信息:文件大小暗示復(fù)雜度;命名規(guī)范暗示用途;時間戳可以代表相關(guān)性。

當(dāng)然,這有權(quán)衡:運(yùn)行時探索比檢索預(yù)計算數(shù)據(jù)慢。

而且需要有非常精妙的工程,確保 LLM 有正確的工具和啟發(fā)式方法來有效找到信息。

最有效的 Agent 可能采用混合策略:部分?jǐn)?shù)據(jù)預(yù)先檢索以提高速度,部分由 Agent 自主探索。

Claude Code 就是混合模型:CLAUDE.md 文件會直接放入上下文,而 glob 和 grep 等原語讓它能即時導(dǎo)航環(huán)境、檢索文件。

長時間任務(wù)的上下文工程

對于需要幾十分鐘到幾小時連續(xù)工作的長時間任務(wù),Agent 需要專門技術(shù)來應(yīng)對上下文窗口限制。

Anthropic 提供了三個策略:

Compaction

把接近上下文窗口限制的對話進(jìn)行總結(jié),用摘要重新啟動新的上下文窗口。這通常是上下文工程的第一個杠桿。

在 Claude Code 中,會把消息歷史傳給模型總結(jié)壓縮關(guān)鍵細(xì)節(jié)。模型保留架構(gòu)決策、未解決的 bug、實現(xiàn)細(xì)節(jié),同時丟棄冗余的工具輸出或消息。然后 Agent 用壓縮后的上下文加最近訪問的 5 個文件繼續(xù)工作。

壓縮的藝術(shù)在于選擇保留什么、丟棄什么。過度激進(jìn)的壓縮可能丟失微妙但關(guān)鍵的上下文。

Structured Note-taking

也叫智能體記憶。Agent 定期把筆記寫到上下文窗口外的持久化內(nèi)存中,之后再拉回上下文窗口。

Claude Code 創(chuàng)建待辦清單,或你的自定義 Agent 維護(hù) NOTES.md 文件,這種簡單模式讓 Agent 跨復(fù)雜任務(wù)追蹤進(jìn)度,維護(hù)原本會在幾十次工具調(diào)用中丟失的關(guān)鍵上下文和依賴。

Sub-agent Architectures

與其讓一個 Agent 維護(hù)整個項目的狀態(tài),不如讓專門的子智能體處理有清晰上下文窗口的聚焦任務(wù)。

主 Agent 用高層計劃協(xié)調(diào),子智能體執(zhí)行深度技術(shù)工作或使用工具查找相關(guān)信息。

每個子智能體可能廣泛探索,使用大量 token,但只返回結(jié)果的精簡總結(jié)(通常 1,000-2,000 token)。

這實現(xiàn)了清晰的關(guān)注點(diǎn)分離——詳細(xì)搜索上下文隔離在子智能體內(nèi),主 Agent 專注于綜合和分析結(jié)果。

實踐建議

在上下文的不同組成部分(系統(tǒng)提示、工具、示例、消息歷史等)都要深思熟慮,保持信息豐富但緊湊。

選擇哪種方法取決于任務(wù)特征:

  • 上下文壓縮適合需要大量來回的任務(wù),保持對話流
  • 記筆記適合有清晰里程碑的迭代開發(fā)
  • 多智能體架構(gòu)適合并行探索有回報的復(fù)雜研究和分析

如何在擴(kuò)展交互中,保持連貫性,是構(gòu)建 Agent 的核心。

最后

Anthropic 在 Sonnet 4.5 發(fā)布時,還在 Claude Developer Platform 上發(fā)布了公開測試版的記憶工具,地址在:http://anthropic.com/news/context-management

通過基于文件的系統(tǒng)讓存儲和查詢上下文窗口外的信息變得更容易。同時也有記憶和上下文管理 cookbook,地址在:https://github.com/anthropics/claude-cookbooks/blob/main/tool_use/memory_cookbook.ipynb。

責(zé)任編輯:武曉燕 來源: 探索AGI
相關(guān)推薦

2024-12-19 09:48:59

2011-11-18 09:16:20

團(tuán)隊管理

2009-07-06 18:24:51

IT資產(chǎn)運(yùn)維管理廣通信達(dá)科技

2020-10-22 20:45:37

辦公

2023-12-27 14:06:00

模型訓(xùn)練

2022-04-11 15:05:32

元宇宙虛擬工作空間虛假身份注冊

2017-02-09 08:35:37

2024-11-21 13:53:09

微軟AI技術(shù)

2024-10-31 13:40:24

GitHubCopilot人工智能

2009-01-12 11:16:58

控制器控制器行為行為結(jié)果

2024-04-11 13:34:37

大語言模型

2010-09-25 12:51:45

DHCP Relay

2023-11-05 15:09:35

模型AI

2010-03-02 14:41:00

WCF行為控制

2024-04-18 08:30:00

留存分析模型數(shù)據(jù)分析

2023-02-01 23:00:42

大數(shù)據(jù)

2025-01-10 10:30:00

大模型統(tǒng)計評估

2010-02-25 09:36:28

WCF行為控制

2014-02-18 09:37:57

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

日韩欧美亚洲精品| 97av在线影院| 中文字幕丰满乱码| 国产一二区在线观看| 国产一区二区调教| 欧美精品久久久久久久| 亚洲久久久久久| 992tv国产精品成人影院| 国产精品你懂的在线| 亚洲精品免费网站| 国产情侣自拍av| 欧美疯狂party性派对| 欧美一级在线视频| 久久美女福利视频| 国产美女av在线| 91在线你懂得| 成人国产精品一区二区| 国产第一页在线播放| 国产精品一区二区三区av麻 | 一区二区亚洲| 在线精品一区二区| 亚洲精品电影久久久| 麻豆一区二区在线观看| 人妻激情偷乱视频一区二区三区| 国产极品人妖在线观看| 国产女人aaa级久久久级| 成年人精品视频| 性色av蜜臀av色欲av| 日韩av懂色| 精品国产福利在线| 激情视频小说图片| 国产在线高清| 国产免费黄色片| 欧美亚洲综合视频| 亚洲电影第三页| 欧美日韩国产一区二区| 国产精品91视频| 美女视频黄免费| 日韩电影二区| 精品一区二区亚洲| youjizz.com日本| 祥仔av免费一区二区三区四区| 日韩精品久久久久久久| 美女久久久久| 日韩视频123| 亚洲国产日韩欧美在线观看| 新版的欧美在线视频| 亚洲精品国产高清久久伦理二区| 中文字幕日韩免费视频| 婷婷五月色综合| 亚洲国产成人在线观看| 久热成人在线视频| 国产精品白嫩初高中害羞小美女| 国产又爽又黄的视频| 欧美日韩a区| 国产精品影视在线观看| 91精品国产色综合久久不卡98口| 校园春色 亚洲| 五月婷婷亚洲| 久久精品国产v日韩v亚洲| 99国产精品免费| 精品视频免费| 色先锋资源久久综合5566| 五月天精品视频| 精品久久久亚洲| 亚洲天堂2020| 女人裸体性做爰全过| 成人一区而且| 久久久精品999| 午夜免费激情视频| 欧美日韩亚洲一区| 国模精品视频一区二区| 日本熟妇毛茸茸丰满| 亚洲一区二区免费看| 人妖精品videosex性欧美| 波多野结衣在线电影| 日韩精品视频网| 国产精品视频免费在线观看| 91国内精品视频| 国产黄色精品网站| 国产一区二区免费电影| 你懂的视频在线| 国产精品拍天天在线| 在线码字幕一区| 成人日韩欧美| 五月激情六月综合| 538在线视频观看| 亚洲免费资源| 亚洲成人教育av| 一本加勒比北条麻妃| 日韩理论片av| 欧美精品福利在线| 波多野结衣一二区| 国产精品小仙女| 久久久综合香蕉尹人综合网| eeuss影院www在线播放| 伊人开心综合网| 欧美日韩中文在线视频| 日韩成人综合网| 精品福利av导航| www.99热| 影音先锋亚洲电影| 国产一区红桃视频| 特黄aaaaaaaaa真人毛片| 国产丝袜欧美中文另类| 国产精品av免费| 中文在线а√天堂| 日韩视频永久免费| 中文字幕av久久爽一区| 国产精品草草| 国产精品一二三在线| 欧美一区,二区| 国产精品剧情在线亚洲| 青青青国产在线观看| 精品三级在线| 日韩精品在线视频美女| 亚洲天堂一级片| 亚洲免费精品| 51蜜桃传媒精品一区二区| 六十路在线观看| 亚洲中国最大av网站| 免费涩涩18网站入口| 夜夜添无码一区二区三区| 超碰中文在线| 欧美日韩一区精品| 亚洲精品视频大全| 好看不卡的中文字幕| 国产精品久久久久久久午夜| 亚洲卡一卡二卡三| 17c精品麻豆一区二区免费| www.日日操| 久久国产精品色av免费看| 久久久精品在线观看| 中文字幕人成人乱码亚洲电影| 成人高清免费观看| 一级性生活视频| jvid一区二区三区| 国产一区二区日韩| 亚洲天堂男人av| 99精品欧美一区| 99色这里只有精品| 深夜激情久久| 欧美高清视频一区二区| 国产女同91疯狂高潮互磨| 欧美国产日韩一二三区| 欧美性猛交xxx乱久交| 九九亚洲视频| 日韩免费观看av| 免费在线性爱视频| 色一情一伦一子一伦一区| 五月开心播播网| 最新亚洲一区| 国产伦精品一区二区三区在线 | 精品夜夜嗨av一区二区三区| 日韩亚洲欧美精品| 日韩欧美精品电影| 亚洲日韩第一页| 久久人人爽人人爽人人片av免费| 久久综合九色综合欧美就去吻| 国产女大学生av| 亚洲区小说区| 国产精品va在线播放我和闺蜜| 美女毛片在线看| 91国模大尺度私拍在线视频| 亚洲精品一区二区三区影院忠贞| 日韩影院免费视频| 在线视频不卡国产| 麻豆久久一区| 国内精品小视频| 亚洲人妻一区二区| 一本色道久久综合亚洲91 | 麻豆三级在线观看| 日韩欧美三级| 97人摸人人澡人人人超一碰| 99久久精品免费看国产小宝寻花| 精品久久久久久久人人人人传媒| 日韩欧美激情视频| 久久久久久久性| 亚洲va综合va国产va中文| 综合视频在线| 看欧美日韩国产| 欧美大片网站| 欧美精品激情在线观看| 免费在线国产| 884aa四虎影成人精品一区| 久久高清无码视频| 久久女同精品一区二区| 欧美激情第3页| 最新国产乱人伦偷精品免费网站| 日本一区二区三区免费看| 色成人综合网| 午夜免费久久久久| 在线观看免费版| 精品国产乱码久久久久久闺蜜| 国产一区免费看| 一区二区欧美视频| 谁有免费的黄色网址| 国产成人av电影在线观看| 亚洲五月天综合| 国内精品久久久久久久影视蜜臀| 日本不卡高清视频一区| 日韩免费一级| 国产精品国产三级国产aⅴ浪潮 | 亚洲人成网亚洲欧洲无码| 国产一区在线播放| 美女扒开腿让男人桶爽久久软| 日韩色av导航| 免费黄色在线视频网站| 欧美一区二区三区在线观看 | 国产精品二区三区| 亚洲天堂1区| 97国产精品免费视频| 高清全集视频免费在线| 亚洲午夜未满十八勿入免费观看全集| 性猛交富婆╳xxx乱大交天津| 在线看不卡av| 国产农村妇女aaaaa视频| 一区二区三区在线免费观看| 超碰97av在线| 久久人人爽爽爽人久久久| 成年女人免费视频| 国产精品一级在线| 国产又大又黄又粗又爽| 欧美亚洲专区| 久在线观看视频| 亚洲性视频h| 强开小嫩苞一区二区三区网站| 欧美日韩中文字幕一区二区三区| 精品国产一区二区三| 成人av综合网| 97人人模人人爽人人少妇| 成人影院网站ww555久久精品| 国产va免费精品高清在线| 99riav视频在线观看| 欧美大片在线免费观看| 超碰在线最新| 操人视频在线观看欧美| 麻豆视频在线观看免费| 国产亚洲一区二区在线| 九色视频在线播放| 日韩高清人体午夜| 神马久久精品| 日韩高清免费观看| 女人天堂在线| 亚洲小视频在线观看| 日韩亚洲视频在线观看| 亚洲美女激情视频| 牛牛影视精品影视| 一区二区三区四区视频| 草草影院在线观看| 中国人与牲禽动交精品| 91在线品视觉盛宴免费| 一区二区三区四区精品| 天堂а√在线资源在线| 精品国产一区二区三区久久久狼 | 国产精品每日更新在线播放网址| 美女被到爽高潮视频| 久久久99久久精品欧美| 在线免费观看麻豆| 国产精品久久久久久久久久免费看| 日韩不卡av在线| 中文字幕亚洲在| 朝桐光av在线| 亚洲成人动漫在线观看| 六月丁香激情综合| 日本高清不卡一区| 一区二区国产欧美| 精品免费视频一区二区| 天天干天天干天天干| 亚洲欧美精品suv| jizz在线观看| www.欧美免费| 2021天堂中文幕一二区在线观| 2021国产精品视频| 开心久久婷婷综合中文字幕| 亚洲综合社区网| 日韩有码av| 伊人婷婷久久| 亚洲激情午夜| 国产精品视频黄色| 国产成人av资源| 久久久久久久毛片| 樱桃视频在线观看一区| 国产精品免费精品一区| 欧美情侣在线播放| 色呦呦中文字幕| 中文字幕在线精品| 国产美女一区视频| 国产精品户外野外| 爱爱精品视频| 香蕉久久夜色| 亚洲美女黄网| 中文字幕久久av| 91片黄在线观看| 成人在线观看小视频| 一本色道久久加勒比精品| 国产女人爽到高潮a毛片| 亚洲美女在线视频| www在线观看播放免费视频日本| 欧美一区二区三区…… | 337p亚洲精品色噜噜噜| 五月激情丁香婷婷| zzjj国产精品一区二区| 亚洲风情在线资源| 99在线视频播放| 久久高清精品| 欧美日韩第二页| 成人免费视频一区| 成年人免费视频播放| 天天做天天摸天天爽国产一区| 国产精品久久久久毛片| 亚洲欧美一区二区激情| 国产嫩草在线视频| 成人黄色片网站| 欧美极品在线观看| 一女被多男玩喷潮视频| 国产不卡视频一区二区三区| www.xx日本| 91精品福利视频| 污视频在线免费| 欧美激情欧美激情在线五月| 亚洲一区有码| 亚洲mv在线看| 日韩精品一级中文字幕精品视频免费观看 | 精品国产免费视频| 国产写真视频在线观看| 国产精品视频免费在线| 狠狠综合久久av一区二区蜜桃 | 操人在线观看| 97久久精品午夜一区二区| 91精品国产91久久久久久密臀| www.色就是色| 国产亚洲短视频| 中文人妻av久久人妻18| 日韩av最新在线| 蜜桃麻豆影像在线观看| 狠狠色综合网站久久久久久久| 国产精品二区影院| 丰满饥渴老女人hd| 亚洲精品中文在线观看| 国产偷拍一区二区| 欧美精品在线极品| 欧美成人精品一级| 亚洲av首页在线| 国产91富婆露脸刺激对白| 久草视频在线免费看| 亚洲精品一区二区三区99| 女同视频在线观看| 精品国产免费一区二区三区 | 亚洲精品手机在线观看| 国产精品网站在线| 亚洲天堂网在线观看视频| 色妞欧美日韩在线| 曰本一区二区| 亚洲五码在线观看视频| 国产黄色成人av| 日本特黄一级片| 国产视频一区在线| 黄色成人在线视频| 亚洲人一区二区| 国内久久婷婷综合| 久久成人国产精品入口| 亚洲精品美女在线观看播放| 韩国成人漫画| 亚洲成人精品电影在线观看| 精品一区二区在线看| 国产真实乱偷精品视频| 日韩电影第一页| 成人在线免费av| 日本天堂免费a| 99国产精品国产精品毛片| 青青国产在线视频| 久久久精品电影| 欧美日韩精品一区二区三区在线观看| 国产精品丝袜久久久久久消防器材| 国产亚洲女人久久久久毛片| 一级爱爱免费视频| 欧美激情视频一区二区| 亚洲精品国产setv| www.五月天色| 五月婷婷综合在线| 国产大学生校花援交在线播放| 91精品视频在线看| 亚洲激情成人| 色偷偷男人天堂| 精品成人免费观看| jizzjizz少妇亚洲水多| 国产乱淫av片杨贵妃| 久久精品视频在线看| 99久久精品国产一区二区成人| 4k岛国日韩精品**专区| 色999日韩| 日本一区二区在线免费观看| 欧美日韩中文字幕精品| av资源在线播放| 99亚洲精品视频| 久久综合网色—综合色88| 99久久亚洲精品日本无码| 日本久久久久久久久| 欧美精品导航|