精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微調已死?Agentic上下文工程登場,無需微調實現模型進化

人工智能 新聞
一篇來自斯坦福大學、SambaNova、UC 伯克利的論文近日引發了廣泛討論。他們提出了一種名為?Agentic Context Engineering(智能體 / 主動式上下文工程)的技術,讓語言模型無需微調也能實現自我提升!

是什么,讓一位 AI 自動化架構師發出了「微調已死」的感慨?

一篇來自斯坦福大學、SambaNova、UC 伯克利的論文近日引發了廣泛討論。他們提出了一種名為 Agentic Context Engineering(智能體 / 主動式上下文工程)的技術,讓語言模型無需微調也能實現自我提升!

  • 論文標題:Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models
  • 論文地址:https://www.arxiv.org/abs/2510.04618

一切要從上下文適應說起

當代基于大型語言模型(LLM)的 AI 系統(如 LLM 智能體與復合式 AI 系統)越來越依賴于上下文自適應(context adaptation)。

具體來說,上下文自適應是在模型訓練完成后,通過在輸入中引入更明確的指令、結構化的推理步驟或領域特定的輸入格式,從而提升模型性能。很顯然,這與直接修改模型參數的微調方法大不相同。

我們知道,上下文構成了眾多 AI 系統組件的基礎,包括:引導下游任務的系統提示詞、承載既往事實與經驗的記憶機制以及用于減少幻覺、補充知識的事實證據。

而與參數更新相比,通過上下文進行適應具有若干核心優勢:上下文對于用戶與開發者而言更具可解釋性;能夠在運行時快速整合新知識;并且可以在復合系統的多個模型或模塊之間共享。與此同時,長上下文語言模型的進展以及高效推理機制(如 KV 緩存復用)也使基于上下文的方法愈發具有現實可行性。因此,上下文自適應正逐漸成為構建高性能、可擴展且具備自我改進能力的 AI 系統的核心范式。

然而,現有上下文自適應方法仍存在兩大局限。

其一是「簡約偏置」(brevity bias):許多提示詞優化器傾向于追求簡潔、普適的指令,而忽略了知識的充分積累。例如,GEPA 將簡短視為優點,但這種抽象化可能遺漏實踐中至關重要的領域啟發式規則、工具使用指南或常見錯誤模式。此類優化目標雖能在部分指標上奏效,卻常無法捕捉智能體或知識密集型應用所需的細節策略。

其二是「上下文塌縮」(context collapse):依賴 LLM 對整體提示進行重寫的方式,往往會隨著時間推移退化為更短、更模糊的摘要,從而造成性能驟降(見圖 2)。在諸如交互式智能體、領域特定編程、以及金融或法律分析等任務中,系統性能依賴于保留細致的、任務相關的知識,而非將其壓縮掉。

隨著智能體與知識密集型推理對可靠性的要求不斷提高,近期研究逐漸轉向構建「信息飽和」的上下文,也就是借助長上下文 LLM 的進展來容納更多潛在有用信息。

但這個斯坦福大學、SambaNova、UC 伯克利聯合團隊認為:上下文不應是簡短的摘要,而應成為全面、動態演化的「作戰手冊(playbooks)」—— 內容詳實、包容、富含領域洞見。與人類不同,LLM 在提供長而細致的上下文時表現更好,并能自主提煉關鍵信息。因此,與其壓縮領域啟發與策略,不如將其保留,讓模型在推理時自行決定哪些信息最為重要。

在這一見解的基礎上,主動式上下文工程(ACE)應運而生。

主動式上下文工程(ACE)

該團隊提出的 ACE(Agentic Context Engineering) 框架能夠實現可擴展且高效的上下文自適應,并且離線(如系統提示優化)與在線(如測試時記憶自適應)場景都適用。

與以往將知識蒸餾為簡短摘要或靜態指令的方法不同,ACE 是將上下文視為不斷演化的作戰手冊,能夠持續積累、蒸餾與組織策略。

基于 Dynamic Cheatsheet(參閱  arXiv:2504.07952)的 agentic 架構,ACE 引入三種協作角色:

  • 生成器(Generator):生成推理軌跡;
  • 反思器(Reflector):從成功與錯誤中蒸餾具體洞見;
  • 整編器(Curator):將這些洞見整合進結構化的上下文更新。

這一設計模仿了人類的學習方式,即「實驗–反思–整合」,同時可避免讓單一模型承擔所有職能所導致的瓶頸。

為應對前文提到的簡約偏置與上下文塌縮問題,ACE 引入了三項關鍵創新:

  • 專職反思者模塊:將評估與洞見提取與整編(curation)過程解耦,提高上下文質量與下游性能;
  • 增量式 Delta 更新機制:以局部編輯替代整體重寫,顯著降低延遲與計算開銷;
  • grow-and-refine 機制:在持續擴充的同時抑制冗余,實現上下文的穩態演化。

在工作流程上,生成器首先會針對新任務生成推理軌跡,揭示出有效策略與常見陷阱;反思器對這些軌跡進行評析,提煉經驗并可多輪迭代優化;整編器再將這些經驗整合為緊湊的增量條目(delta entries),并通過輕量的、非 LLM 的邏輯機制合并至現有上下文中。

由于更新項是局部化的,多個增量可并行合并,從而實現批量適應與擴展。ACE 還支持多輪(multi-epoch)自適應,使相同任務可被多次重訪以持續強化上下文。

增量式 Delta 更新

ACE 的核心設計理念是:將上下文表示為結構化的條目集合(bullets),而非單一的整體提示詞。

每個條目包含兩部分:

  • 元數據(metadata):唯一標識符,以及「有用 / 有害」計數器;
  • 內容(content):比如可復用策略、領域概念或常見錯誤模式。

在解決新問題時,生成器會標記哪些條目起到了幫助或誤導作用,從而為反思器提供改進依據。

這種條目化設計帶來了三大特性:

  • 局部化(localization):只更新相關條目;
  • 細粒度檢索:生成器可聚焦于最相關的知識;
  • 增量式適應:推理時可高效進行合并、剪枝與去重。

ACE 不會重寫整個上下文,而是生成緊湊的增量上下文(delta contexts):由反思器提煉、整編器整合的一小組候選條目。

這種方式既避免了整體重寫的高計算成本與延遲,又能保持舊知識并持續吸收新見解。隨著上下文的增長,該機制為長周期或高知識密度的任務提供了必要的可擴展性。

Grow-and-Refine

在持續增長的基礎上,ACE 通過定期或延遲蒸餾來確保上下文保持緊湊與相關性。

在 Grow-and-Refine 過程中,新條目會被追加到上下文中,而已有條目則通過元數據更新(如計數器遞增)進行原地修訂。

去重步驟則通過語義嵌入比較條目相似度來消除冗余。

該過程可在每次增量更新后主動執行,也可在上下文窗口超限時被動觸發,具體取決于延遲與精度要求。

增量更新與 Grow-and-Refine 機制共同維持了上下文的動態可擴展性與高相關性。

ACE 的效果如何?

該團隊進行了實驗,對新提出的方法進行了驗證。

具體來說,他們在兩類任務上進行了實驗:智能體類任務與領域特定任務。

  • 智能體任務采用 AppWorld 基準,該基準涵蓋多輪推理、工具調用與環境交互等復雜行為,包含不同難度的場景(普通與挑戰模式),并設有公開排行榜以評估智能體的真實表現。
  • 領域特定任務則聚焦于金融分析,使用 FiNER 與 Formula 兩個數據集:前者要求識別 XBRL 財報文檔中的細粒度實體類型,后者則考察模型在結構化財報中的數值推理與計算能力。

而作為對比的基線方法則包括以下幾種:

  • ICL(In-Context Learning):通過在輸入中提供示例演示實現少樣本學習;
  • MIPROv2 與 GEPA:兩種主流提示優化算法,分別基于貝葉斯優化與反思進化策略;
  • Dynamic Cheatsheet(DC):一種測試時自適應記憶機制,可積累可復用的策略與知識。

相比之下,ACE 在相同基模型與運行條件下,通過其「生成–反思–整合」的主動上下文工程框架,實現了更高的準確度、更快的適應速度以及更低的計算成本。

實驗下來,ACE 表現優異,下圖給出了其整體表現 —— 毫無疑問地優勢明顯。

首先,ACE 確實能實現高性能、自我改進的智能體。

通過動態優化輸入上下文,ACE 實現了智能體的自我改進。在 AppWorld 基準上,ACE 在無需標注數據的情況下,僅憑執行反饋就能提升性能高達 17.1%,使開源小模型的表現接近最強商用系統。

下圖展示了在 AppWorld 基準上,ACE 生成的上下文示例(部分)。可以看到,ACE 生成的上下文包含了詳細的、領域特定的洞見,以及可直接使用的工具與代碼,構成了一個面向大型語言模型應用的完整「作戰手冊」。

同時,ACE 也能大幅提升在領域特定任務上的表現:在復雜的金融推理任務中,ACE 通過構建含豐富領域知識的「作戰手冊」,平均性能提升 8.6%。

該團隊也通過消融實驗驗證了其新設計的有效性,結果表明:反思器與多輪蒸餾等組件對性能提升至關重要。

最后,該團隊也分析了 ACE 的成本與延遲,發現這兩個指標都有顯著下降:ACE 通過增量更新與輕量化合并機制,使適應延遲平均降低 86.9%,并減少了生成消耗。

至于 ACE 究竟能否做到讓「微調已死」,還需要讀者您自己判斷,畢竟該研究也在網上遭到了一些批評。

結語

該團隊總結道:「長上下文 ≠ 更高 Serving 成本?!贡M管 ACE 生成的上下文比 GEPA 等方法更長,但并不會導致推理成本或顯存使用線性增加。

現代 serving 基礎設施已通過 KV 緩存復用、壓縮與卸載等機制,對長上下文負載進行了優化,使得常用的上下文片段可被緩存,避免重復計算。隨著系統層優化的持續進步,長上下文方法(如 ACE)的實際部署成本將進一步下降。

同時,該團隊還分析了這項研究對在線與持續學習帶來的啟示。

在線學習與持續學習是應對分布漂移(distribution shifts)與訓練數據有限性的重要方向。ACE 為傳統模型微調提供了一種靈活且高效的替代方案:更新上下文通常比更新模型參數更低成本,同時具備可解釋性,還可能實現選擇性遺忘(selective unlearning)—— 這可用于隱私保護、合規以及剔除錯誤或過時信息。

該團隊認為,ACE 未來有望成為推動持續學習與負責任學習的核心機制之一。

你覺得這項技術的潛力如何?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-14 09:54:28

2025-10-11 08:52:06

2024-12-10 09:07:17

2023-06-15 15:45:42

自然語言語言模型

2025-10-29 08:40:00

2025-10-20 09:06:00

2025-10-14 10:03:11

CompLLMLLMRAG

2024-04-29 13:09:10

LLM架構性能

2025-10-31 16:06:19

AI參數微調

2025-11-20 08:44:32

2025-05-09 07:50:30

2025-10-13 09:03:00

2024-06-19 12:50:39

2025-07-30 09:00:00

模型訓練數據

2025-03-18 08:14:05

2022-09-15 08:01:14

繼承基礎設施基礎服務

2025-10-17 09:13:36

2017-05-11 14:00:02

Flask請求上下文應用上下文

2024-05-06 13:01:21

數據模型

2024-03-14 08:11:45

模型RoPELlama
點贊
收藏

51CTO技術棧公眾號

91视频久久久| 人妻精品久久久久中文字幕 | 国产在线播放一区三区四| 精品国偷自产在线视频99| 一级特黄性色生活片| 成人黄色在线电影| 成人av在线观| 国产欧美一区二区| 日韩欧美a级片| 国产精品三级| 欧美不卡在线视频| 午夜免费一区二区| 美女高潮在线观看| 亚洲欧美aⅴ...| 欧美不卡三区| 韩国av免费在线| 麻豆传媒一区二区三区| 69av在线播放| 欧美毛片在线观看| 欧美一区电影| 日韩极品精品视频免费观看| 亚洲精品乱码久久久久久动漫| 澳门成人av网| 亚洲自拍偷拍九九九| 亚洲高清在线播放| 深夜视频在线免费| 国产成a人亚洲精品| 国产精品久久久久久久久借妻| 国产在线视频99| 91精品啪在线观看国产81旧版 | 香港三日本8a三级少妇三级99| 欧美成人黄色| 色婷婷综合久久久中文一区二区| 国产成人亚洲综合无码| 日本美女在线中文版| 99视频有精品| 国产一区二区视频在线免费观看 | 亚洲国产成人一区| 亚洲成人手机在线观看| 日韩免费在线电影| 91极品视觉盛宴| 午夜肉伦伦影院| 蜜桃av在线| 午夜精品视频在线观看| 久操手机在线视频| 羞羞视频在线观看不卡| 自拍av一区二区三区| 一区二区三区四区五区视频| 国产无套粉嫩白浆在线2022年| 91视频观看视频| 国产中文一区二区| 日本成人动漫在线观看| 成人18视频在线播放| 97av自拍| 亚洲精华国产精华精华液网站| 国产精品自在在线| 亚洲综合国产精品| 成人黄色免费视频| 国产东北露脸精品视频| 92看片淫黄大片看国产片| 国产精品自产拍| 国产一区福利在线| 91沈先生播放一区二区| 精品国产一级片| 波多野结衣91| 欧美成人dvd在线视频| 精品亚洲成a人片在线观看| 久久久久久免费毛片精品| 日本一区高清不卡| 天天在线视频色| 亚洲欧美一区二区三区极速播放| 特级黄色录像片| 久久香蕉一区| 欧美日韩国产在线看| 成人三级视频在线播放| www.一区| 日韩欧美在线网站| 免费的av网站| 欧美日韩久久精品| 久色乳综合思思在线视频| 久久久国产成人| 先锋亚洲精品| 国产欧美日韩中文| 囯产精品久久久久久| 久久综合九色综合欧美98| 五月婷婷一区| 午夜羞羞小视频在线观看| 五月激情丁香一区二区三区| www.日日操| 精品久久亚洲| 亚洲男子天堂网| 男人晚上看的视频| 在线观看日韩av电影| 人妖精品videosex性欧美| 国产又爽又黄免费软件| av中文字幕亚洲| 婷婷久久伊人| 24小时免费看片在线观看| 日本韩国欧美三级| 国产精品一级无码| 菠萝蜜一区二区| 国产69精品久久久久99| 亚洲免费视频二区| 成人精品高清在线| 一区中文字幕在线观看| 自拍视频在线看| 欧美一级日韩免费不卡| 亚洲国产欧美视频| 亚洲精品国产成人影院| 日本91av在线播放| 农村少妇久久久久久久| 国产精品人人做人人爽人人添| 成人在线视频一区二区三区| 不卡亚洲精品| 日韩经典中文字幕| 久久婷婷国产麻豆91| 美女一区二区久久| 免费观看国产成人| wwww亚洲| 日韩亚洲欧美高清| 疯狂撞击丝袜人妻| 免费亚洲电影在线| 免费看成人av| 国产h片在线观看| 日韩欧美高清一区| 少妇高潮惨叫久久久久| 性一交一乱一区二区洋洋av| 国产精品视频一区二区三区经| 日本黄色片在线观看| 在线亚洲一区观看| 可以直接看的无码av| 亚洲网站在线| 97人人干人人| av毛片在线播放| 欧美精品三级在线观看| 在线免费观看视频| 老鸭窝毛片一区二区三区| 国产精品一区视频| av伦理在线| 精品国产乱码久久久久久牛牛 | 国产精品丝袜高跟| 能在线看的av| 色先锋资源久久综合| 右手影院亚洲欧美| 久久国产日本精品| 欧美一二三四五区| 偷拍精品精品一区二区三区| 日韩精品免费观看| 久久久成人免费视频| 久久久一区二区三区| 日韩a在线播放| 亚洲欧洲美洲国产香蕉| 欧美在线一级va免费观看| 天天干天天摸天天操| 亚洲成人午夜影院| 动漫美女无遮挡免费| 亚洲第一黄色| 久久久久久九九九九| 亚洲私拍视频| 一本一本久久a久久精品牛牛影视| 懂色av中文字幕| 国产精品国产三级国产专播品爱网 | 欧美日韩的一区二区| 国产精品1区2区3区4区| 国产自产视频一区二区三区| 日本中文字幕一级片| 成人三级毛片| 国产精品av网站| 秋霞影院午夜丰满少妇在线视频| 欧美日韩极品在线观看一区| 亚洲女人久久久| 国产精品原创巨作av| 国产肉体ⅹxxx137大胆| 色婷婷久久久| 国产免费观看久久黄| 密臀av在线| 亚洲精品一区中文字幕乱码| 国产情侣免费视频| 亚洲视频在线一区二区| 无码人妻一区二区三区精品视频| 99视频一区| 午夜免费电影一区在线观看| 国产精品日韩精品在线播放| 国语自产精品视频在线看抢先版图片 | 日韩激情av在线播放| 亚洲精品国产精品国自产网站按摩| 亚洲视频综合在线| v8888av| 国产一区二区三区久久悠悠色av | 免费污视频在线观看| 亚洲精品一区在线观看香蕉| 国产一区二区三区在线观看| 亚洲成av人**亚洲成av**| 国产av自拍一区| 国产乱人伦偷精品视频免下载 | 久久机这里只有精品| 嫩草影院中文字幕| 清纯唯美综合亚洲| 国产精品日韩高清| 久久久久黄色| 国内外成人免费激情在线视频网站 | 91成人短视频在线观看| 91av国产在线| 在线电影福利片| 中文字幕成人在线| 亚洲欧洲综合在线| 日韩精品一区二区三区中文不卡 | 韩国一区二区三区| 人妻精品无码一区二区三区| 亚洲欧美网站在线观看| 日本精品一区二区| 国产精品对白久久久久粗| 国产欧美在线视频| sis001欧美| 97超碰国产精品女人人人爽| 1024在线播放| 日韩中文字幕视频| 国产在线超碰| 日韩精品亚洲精品| 人妻va精品va欧美va| 欧美一区永久视频免费观看| 波多野结衣视频在线观看| 亚洲成人在线免费| 九九热国产在线| 亚洲桃色在线一区| а天堂中文在线资源| 国产亚洲精品福利| 中日韩精品一区二区三区| 成人av在线网| 国产白袜脚足j棉袜在线观看 | 国产日韩欧美不卡| 手机免费看av片| 国v精品久久久网| 一级片黄色免费| 另类小说综合欧美亚洲| 午夜视频你懂的| 日韩精彩视频在线观看| 国产在线观看福利| 欧美亚洲一级| 37pao成人国产永久免费视频| 99在线|亚洲一区二区| 97视频在线免费| 亚洲国产日韩欧美一区二区三区| 日韩成人手机在线| 国产精品v亚洲精品v日韩精品| 欧美少妇一级片| 亚洲乱码在线| 水蜜桃在线免费观看| 亚洲深深色噜噜狠狠爱网站| 超碰成人在线免费观看| 我不卡神马影院| eeuss中文| 欧美日本一区二区视频在线观看| 2021国产视频| 99精品久久| 国产亚洲天堂网| 日韩1区2区日韩1区2区| 日韩不卡一二三| 激情图片小说一区| 古装做爰无遮挡三级聊斋艳谭| 国产美女精品人人做人人爽| 精品国产午夜福利在线观看| 国产成人av一区| 亚洲欧美色图视频| 国产亚洲精品资源在线26u| 女人十八毛片嫩草av| 亚洲欧美偷拍三级| 国产一级久久久| 大伊人狠狠躁夜夜躁av一区| 亚洲 日本 欧美 中文幕| 欧美午夜精品一区| 亚欧无线一线二线三线区别| 黄色污污视频软件| 在线看三级电影| 国产亚洲激情| 亚洲在线一区二区三区| 久久影院在线观看| 9191国产视频| 欧美日韩中文字幕在线观看| 免费在线视频欧美| 欧美va久久久噜噜噜久久| 成人p站proumb入口| 波多野结衣在线高清| 亚洲综合激情网| 国产亚洲精品码| 精品人伦一区二区三区蜜桃网站| youjizz在线视频| 欧美日韩黄色影视| 性一交一乱一精一晶| 日韩精品视频在线播放| 成人免费在线电影| 欧美日韩国产成人高清视频| 中文字幕资源网在线观看免费| 成人黄色午夜影院| 欧美丝袜足交| 异国色恋浪漫潭| 夜夜嗨一区二区三区| 性欧美在线视频| 久久久三级国产网站| 丰满少妇被猛烈进入一区二区| 午夜激情久久久| 91麻豆一区二区| 精品一区二区三区四区在线| 国产精品va在线观看视色| 人人爽久久涩噜噜噜网站| 日韩精品视频一区二区三区| 欧美一区二区视频17c| 欧美特黄视频| 天天干天天爽天天射| 91麻豆国产福利精品| 久热这里有精品| 欧美羞羞免费网站| 婷婷视频在线观看| 久久91超碰青草是什么| 国产亚洲人成a在线v网站| 精品视频导航| 韩国在线视频一区| 性久久久久久久久久久久久久| 久久久久久久久久久久久夜| 国产性一乱一性一伧一色| 欧美日韩情趣电影| 国产色在线 com| 青草成人免费视频| 岛国av一区| 真实国产乱子伦对白视频| 久久国产麻豆精品| 亚洲天堂久久新| 亚洲成人777| www.五月激情| 久久亚洲国产精品| 日本成人一区二区| 亚洲一区二区三区欧美| 久久中文在线| 法国空姐电影在线观看| 欧美日韩国产中字| 天堂成人在线| 18久久久久久| 日日狠狠久久偷偷综合色| 91九色丨porny丨国产jk| 丰满白嫩尤物一区二区| 国产av无码专区亚洲av毛网站| 在线电影一区二区三区| 欧美成人高清在线| 亚洲一区二区久久久久久| 亚洲成人av| 秋霞午夜鲁丝一区二区| 玉足女爽爽91| 刘玥91精选国产在线观看| 欧美激情网站在线观看| 成人爽a毛片| 欧美 日韩 国产 高清| 99久久综合色| 制服.丝袜.亚洲.中文.综合懂色| 风间由美中文字幕在线看视频国产欧美 | 美女搞黄视频在线观看| 精品蜜桃传媒| 久久福利精品| 人妻少妇无码精品视频区| 欧美在线短视频| 亚洲欧美视频一区二区| 92裸体在线视频网站| 欧美三级不卡| 水蜜桃av无码| 一本久久精品一区二区| 国产高清自拍视频在线观看| 国产欧美久久一区二区| 天天做综合网| wwwxx日本| 一本一本大道香蕉久在线精品| 成年人在线观看视频| 国产专区欧美专区| 狠狠噜噜久久| 日韩人妻无码一区二区三区| 在线观看91视频| 黄色免费网站在线| 国产在线资源一区| 日韩和欧美一区二区三区| 北条麻妃在线观看视频| 欧美精品一区男女天堂| 不卡福利视频| 国产精品12p| 久久综合九色综合欧美就去吻| 少妇又紧又色又爽又刺激视频 | 日韩欧美三级一区二区| 国内久久精品视频| 亚洲一区欧美在线| 色小说视频一区| www.国产精品一区| wwwwww.色| 亚洲国产一区在线观看| 国产小视频免费在线网址| 亚洲一区二区在线| 亚洲一区图片| 69xx绿帽三人行| 国产手机视频精品| 欧美电影在线观看一区| 国产成人无码一二三区视频| 亚洲视频在线一区观看| 精品999视频| 国产精品日韩一区二区免费视频|