精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Memory-R1:強化學習如何大幅提升 LLM 記憶 Agent 能力

譯文 精選
人工智能
大語言模型(LLMs)已成為眾多 AI 突破的核心技術,廣泛應用于聊天機器人、編程助手、問答系統、創意寫作等領域。然而,盡管功能強大,這些模型仍然是無狀態的:每次查詢都是獨立的,無法記住之前的交互內容。受到固定上下文窗口的限制,它們無法在長時間對話或跨會話任務中積累持久記憶,更難以基于復雜的歷史信息進行推理。

譯者 | 劉汪洋

審校 | 重樓

Memory-R1 通過強化學習為 LLM 智能體提供主動且高效的記憶管理能力,實現了最先進的效果。

大語言模型(LLMs)已成為眾多 AI 突破的核心技術,廣泛應用于聊天機器人、編程助手、問答系統、創意寫作等領域。然而,盡管功能強大,這些模型仍然是無狀態的:每次查詢都是獨立的,無法記住之前的交互內容。受到固定上下文窗口的限制,它們無法在長時間對話或跨會話任務中積累持久記憶,更難以基于復雜的歷史信息進行推理。雖然檢索增強生成(RAG)等近期方案試圖通過在提示中附加歷史信息來解決這一問題,但往往產生嘈雜、未經篩選的上下文,要么用大量無關細節淹沒模型,要么遺漏關鍵信息。

來自慕尼黑大學、慕尼黑工業大學、劍橋大學和香港大學的聯合研究團隊提出了 Memory-R1,一個能夠教會 LLM 智能體如何決定記憶內容和使用方式的創新框架。在這個框架下,LLM 智能體學會了主動管理和運用外部記憶,可以自主決定哪些信息需要添加、更新、刪除或忽略,并在回答問題時有效過濾噪音。關鍵創新是利用強化學習(RL)訓練這些行為:系統只需要基于結果的獎勵信號就能學習,大大減少了監督需求,同時在多種模型和任務中都表現出色。

LLMs 為什么難以處理記憶?

設想這樣一個多輪對話場景:用戶在第一輪中說:"我領養了一只叫 Buddy 的狗。"隨后又補充:"我又領養了一只叫 Scout 的狗。"面對這種情況,系統應該替換原有信息、合并兩條信息,還是忽略這次更新?傳統記憶系統往往會判斷失誤,它們可能刪除"Buddy"的記錄并添加"Scout",錯誤地將新信息理解為矛盾而非補充。久而久之,這類系統會失去連貫性,導致用戶知識呈現碎片化而非有機演進。

RAG 系統雖能檢索信息,卻缺乏過濾機制:無關條目會污染推理過程,噪音干擾模型的注意力。而人類的做法截然不同,我們會廣泛搜索信息,然后有選擇地篩選出重要內容。目前大多數 AI 記憶系統都是靜態的,依賴人工設計的啟發式規則來決定記憶內容,而非通過反饋進行學習。

Memory-R1 框架

Memory-R1 的核心架構包含兩個專門的 RL 微調智能體:

  • 記憶管理器:在每輪對話結束后決定執行何種記憶操作(添加、更新、刪除或無操作),動態維護外部記憶庫。
  • 回答 Agent:針對每個用戶問題,檢索最多 60 個候選記憶片段,將其精煉為最相關的子集,然后基于這些過濾后的上下文進行推理并生成答案。

兩個組件均采用強化學習進行訓練——具體使用近端策略優化(PPO)或群體相對策略優化(GRPO)算法——僅將問答準確性作為獎勵信號。這意味著智能體無需人工標注的記憶操作數據,而是通過試錯機制學習,直接優化最終任務性能。

記憶管理器:學習編輯知識

每輪對話結束后,LLM 會提取其中的關鍵事實。記憶管理器隨即從記憶庫中檢索相關條目,并選擇相應的操作:

  • 添加:插入尚未存在的新信息。
  • 更新:當新細節詳細說明或完善先前事實時,將其合并到現有記憶中。
  • 刪除:移除過時或矛盾的信息。
  • 無操作:如果沒有添加相關內容,則保持記憶不變。

訓練:記憶管理器根據回答 Agent 基于新編輯的記憶庫所生成答案的質量來進行更新。如果記憶操作能夠幫助回答 Agent 生成準確回答,記憶管理器就會獲得正獎勵。這種基于結果的獎勵機制避免了對記憶操作進行大量人工標注。

具體案例:當用戶先說"我領養了一只叫 Buddy 的狗",后來又說"我又領養了一只叫 Scout 的狗"時,傳統系統往往會刪除"Buddy"的記錄并添加"Scout",錯誤地將其視為矛盾信息。而經過 RL 訓練的記憶管理器則會更新記憶為:"Andrew 領養了兩只狗,Buddy 和 Scout",從而維持了知識庫的連貫性和成長性。

消融實驗:RL 微調顯著改善了記憶管理,PPO 和 GRPO 都優于基于上下文的啟發式管理器。系統實現了知識的融合貫通,而非割裂分散。

回答 Agent:選擇性推理

對于每個問題,系統使用 RAG 檢索多達 60 個候選記憶。但回答 Agent不是將所有這些都輸入給 LLM,而是首先對候選集進行提煉,只保留最相關的條目,然后再生成答案。

訓練:回答 Agent 也使用 RL 訓練,使用其答案與標準答案之間的精確匹配作為獎勵。這鼓勵它專注于過濾噪音和在高質量上下文上進行推理。

示例:當被問到"John 住在海灘附近還是山區附近?"時,傳統 LLM 受到無關記憶的影響可能輸出"山區"。然而,Memory-R1 的回答 Agent 在回答之前只提取海灘相關的條目,從而得出正確的"海灘"回答。

消融實驗結果:RL 微調顯著提升了靜態檢索的答案質量。記憶精煉(過濾無關記憶)機制進一步提升了性能表現。在更優秀的記憶管理器配合下,收益更為明顯,產生了多重疊加的改進效果。

訓練數據效率

Memory-R1 的訓練非常高效:只用 152 個問答對就能訓練出有效的模型。原因在于智能體能直接從最終結果中學習,不需要大量人工標注的記憶操作數據。這種最小化監督的方式使系統能夠輕松擴展到大規模、真實世界的對話歷史場景。

評估采用的 LOCOMO 基準包含多輪對話(每個對話約 600 輪,平均 26,000 tokens)及相應的問答對,涵蓋單跳推理、多跳推理、開放域問答和時間推理等多個維度——這為測試長期記憶管理能力提供了理想的評估環境。

實驗結果

研究團隊在 LLaMA-3.1-8B-Instruct 和 Qwen-2.5-7B-Instruct 兩個基礎模型上測試了 Memory-R1,并與多個對比基準(LOCOMO、Zep、A-Mem、LangMem、Mem0)進行對比。主要評估指標包括:

  • F1 分數:衡量預測答案與標準答案之間的重疊程度。
  • BLEU-1 分數:評估單詞級別的詞匯相似性。
  • LLM 評判:采用獨立的 LLM 代替人類來評估答案的事實準確性、相關性和完整性。
  • 實驗結果:Memory-R1-GRPO 實現了最佳整體性能,在 LLaMA-3.1-8B 模型上相比 Mem0(此前的最佳基線)實現了 F1 分數 48% 的提升、BLEU-1 分數 69% 的提升,以及 LLM 評判分數 37% 的提升。在 Qwen-2.5-7B 模型上也觀察到了類似的明顯改進。這些改進效果涵蓋各類問題,且在多種模型架構中都能復現。

為什么這很重要

Memory-R1 證明了記憶管理和利用能力是可以習得的,LLM 智能體無需依賴脆弱的啟發式規則。通過采用結果驅動的 RL 方法,該系統實現了:

  • 知識的自動整合,伴隨對話發展而非簡單分割或覆蓋。
  • 有效的噪音過濾,在回答過程中提升事實準確性和推理質量。
  • 高效的學習機制,僅需少量監督即可擴展至真實世界的長期任務。
  • 良好的跨模型泛化性,為下一代智能體式、記憶感知 AI 系統奠定了堅實基礎。

結論

Memory-R1 成功將 LLM 智能體從無狀態限制中解放出來,通過強化學習賦予它們有效管理和運用長期記憶的能力。通過將記憶操作和信息過濾重新定義為 RL 問題,該方法以最小的監督需求和優異的通用性達到了頂尖的性能表現。這意味著 AI 系統正從單純的對話能力邁向具備記憶、學習和推理能力的智能體,為用戶提供更加豐富、持久且實用的 AI 體驗。

常見問題解答

問題1:Memory-R1 相比傳統 LLM 記憶系統有何優勢?

Memory-R1 采用強化學習主動管理記憶,即智能決定信息的添加、更新、刪除或保留。相比靜態的啟發式方法,實現了更加智能的知識整合和更少的信息碎片化。

問題2:Memory-R1如何提升長對話中的答案質量?

回答 Agent 采用"記憶精煉"策略:從檢索到的最多 60 個記憶片段中篩選出與當前問題最相關的內容,相比于簡單地將所有上下文直接輸入模型,這種方式有效減少了噪音干擾并大幅改善了事實準確性。

問題3:Memory-R1 的訓練數據效率如何?

非常高效。Memory-R1 僅使用 152 個問答對就達到了業界領先的性能提升,這得益于其面向結果的 RL 獎勵機制,避免了對每個記憶操作進行昂貴人工標注的需要。

查看論文鏈接。歡迎查看我們的GitHub頁面獲取教程、代碼和筆記

原文標題:Memory-R1: How Reinforcement Learning Supercharges LLM Memory Agents,作者:Asif Razzaq

譯者介紹

劉汪洋,51CTO社區編輯,昵稱:明明如月,一個擁有 5 年開發經驗的某大廠高級 Java 工程師。

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2024-09-30 14:40:00

AI強化學習框架

2025-06-23 09:09:00

2025-11-07 08:44:38

2025-03-25 09:12:00

LIMAI模型

2025-10-11 04:00:00

2023-04-23 10:12:14

算法強化學習

2025-05-30 04:00:00

IBMRLVRGRPO

2025-05-28 02:25:00

2025-04-09 09:15:00

數據模型AI

2025-04-09 09:41:43

2025-02-25 08:06:05

2025-06-16 08:46:00

2024-09-13 06:32:25

2025-11-10 04:15:00

2025-06-10 11:22:09

強化學習AI模型

2025-04-25 13:34:53

R1DeepSeekAgent

2025-06-23 09:26:24

2025-06-09 09:32:35

2025-03-07 09:24:00

2025-06-05 06:36:17

點贊
收藏

51CTO技術棧公眾號

欧美丝袜激情| 成人bbav| 成人性生交大片免费看中文| 欧美极品美女电影一区| 日韩少妇一区二区| 成人看片网页| 亚洲婷婷综合久久一本伊一区| 国产极品精品在线观看| 蜜桃传媒一区二区亚洲av| 成人国产一区| 亚洲国产精品久久艾草纯爱| 欧美久久综合性欧美| 国产乱淫a∨片免费观看| 国内精品嫩模av私拍在线观看| 亚洲欧美国产一区二区三区| 亚洲日本黄色片| 欧亚av在线| 18欧美亚洲精品| 欧美下载看逼逼| 免费观看黄色一级视频| 欧美a级一区二区| 国内揄拍国内精品少妇国语| 疯狂撞击丝袜人妻| 综合亚洲色图| 精品福利二区三区| 亚洲免费黄色网| 97成人资源| 亚洲第一狼人社区| 91麻豆天美传媒在线| www视频在线观看免费| 91麻豆文化传媒在线观看| 97超碰人人模人人爽人人看| 一起草av在线| 日韩高清在线不卡| 26uuu久久噜噜噜噜| 美女视频黄免费| 天天影视综合| 久久精品国产欧美激情| 九一在线免费观看| 精品美女久久久| 精品网站999www| 欧类av怡春院| 国产精品18hdxxxⅹ在线| 日韩免费一区二区| 欧美视频国产视频| 四虎国产精品成人免费影视| 欧美亚洲综合另类| 激情五月亚洲色图| 欧美日韩电影免费看| 精品久久久免费| 日本a视频在线观看| 久草在线视频网站| 夜夜嗨av一区二区三区四季av| aaa免费在线观看| 国产不卡在线| 亚洲老妇xxxxxx| 无码人妻精品一区二区三区99v| 国产69精品久久久久9| 无码任你躁久久久久久老妇| 97品白浆高清久久久久久| 欧美一区二区福利在线| 性生活在线视频| 成人在线视频区| 欧美一级黄色大片| 18禁一区二区三区| 91精品入口| 亚洲丁香婷深爱综合| 亚洲av成人片无码| 欧洲vs亚洲vs国产| 日韩成人中文字幕| 国产制服丝袜在线| 精品一级毛片| xxxxx成人.com| 中文字幕手机在线观看| 亚洲午夜在线| 青青青国产精品一区二区| 日韩 国产 欧美| 久久综合中文| 97成人超碰免| 特级西西444www大胆免费看| 久久精品久久综合| 成人动漫在线视频| 欧美拍拍视频| 国产精品久久久久一区二区三区| 宅男av一区二区三区| 性xxxfreexxxx性欧美| 亚洲成av人在线观看| 欧美综合在线观看视频| 婷婷久久综合九色综合99蜜桃| 欧美电影免费提供在线观看| 亚洲精品在线视频免费观看| 欧美呦呦网站| 欧美激情欧美激情在线五月| 亚洲天堂av片| 国模少妇一区二区三区| 精品日韩电影| a级影片在线观看| 色婷婷一区二区| 99九九99九九九99九他书对| 国产伦精品一区二区三区免费优势| 一本色道久久88精品综合| 午夜写真片福利电影网| 免费一区视频| 亚洲在线第一页| 免费看男男www网站入口在线| 中文字幕一区二区视频| 中国丰满人妻videoshd| av一级久久| 亚洲男人天堂网站| 久久久久久久久久久久久女过产乱| 一区二区三区精品视频在线观看| 国产一区二区丝袜| 日韩在线免费播放| 一区二区三区在线视频免费 | 日本成人一区| 亚洲欧美另类图片小说| 97公开免费视频| 国产精品45p| 麻豆国产精品va在线观看不卡| 欧美黑人一区二区| 丁香婷婷综合激情五月色| 亚洲日本精品| av日韩亚洲| 亚洲精品91美女久久久久久久| 久久久久人妻一区精品色| 性欧美精品高清| 国产精品乱码一区二区三区| 久草中文在线观看| 欧美伊人久久久久久久久影院| 亚洲一区二区三区综合| 欧美影视一区| 91色琪琪电影亚洲精品久久| 番号集在线观看| 岛国精品视频在线播放| 911亚洲精选| 亚洲天堂免费| 成人写真福利网| 3p视频在线观看| 欧美图区在线视频| 波多野在线播放| 视频一区二区三区入口| 久热这里只精品99re8久| 国产剧情av在线播放| 日韩免费成人网| 妺妺窝人体色www在线下载| 国产老肥熟一区二区三区| 香蕉视频在线网址| 国产亚洲观看| 欧美老肥婆性猛交视频| 精品久久久久成人码免费动漫| ...xxx性欧美| 99九九精品视频| 欧美激情综合色综合啪啪| 亚洲最大av网站| 在线看一级片| 精品黑人一区二区三区久久| 久久综合激情网| 成人av免费网站| 九色在线视频观看| 亚洲精品中文字幕99999| 日韩av男人的天堂| 91伦理视频在线观看| 欧美日韩视频专区在线播放| 国产中文字幕久久| 国产乱色国产精品免费视频| 免费看欧美一级片| 全球av集中精品导航福利| 日本中文字幕久久看| av黄色在线观看| 7777女厕盗摄久久久| 欧美片一区二区| 99久久免费精品高清特色大片| 久久综合九色综合88i| 美女亚洲一区| 国产这里只有精品| 羞羞电影在线观看www| 亚洲激情视频在线播放| 99久久久久久久久| 国产精品萝li| 99riav国产精品视频| 国产精品主播| 亚洲欧美成人一区| 一区三区自拍| 青青久久aⅴ北条麻妃| 黄色免费在线观看网站| 精品人在线二区三区| 国产精品一区二区三区四| 国产欧美精品区一区二区三区| 日本精品一区在线| 亚洲一区二区动漫| 亚洲精品成人a8198a| 中文字幕日韩高清在线| 欧洲亚洲妇女av| 大地资源网3页在线观看| 亚洲国产精品99久久| 日韩欧美国产另类| 亚洲综合视频在线| 精品日韩在线视频| 成人av网站在线观看| 成人亚洲视频在线观看| 国模一区二区三区| 神马一区二区影院| 超碰精品在线| 国产欧美一区二区白浆黑人| 99在线视频影院| 色综合伊人色综合网| 亚洲欧美丝袜中文综合| 3d成人h动漫网站入口| 丰满少妇xoxoxo视频| 亚洲综合一区在线| 亚洲欧美卡通动漫| 久久综合九色综合97_久久久| 伊人成人免费视频| 免费日本视频一区| 男人揉女人奶房视频60分| 在线精品小视频| 五月天色一区| 亚州国产精品| 国产精品v欧美精品∨日韩| 国产精品天堂蜜av在线播放 | 国产一区二区三区影视| 国模极品一区二区三区| 黄色一级大片在线免费看产| 亚洲欧美中文日韩在线v日本| 亚洲国产精品久久久久爰性色| 欧美日韩国产a| 波多野结衣电车痴汉| 天天综合色天天综合| 91精品国产高清一区二区三蜜臀| 中文字幕不卡在线| 色哟哟精品观看| 91丨九色porny丨蝌蚪| 折磨小男生性器羞耻的故事| 国产毛片精品国产一区二区三区| 中文字幕在线观看日| 男人的j进女人的j一区| 亚洲三级视频网站| 久久天堂成人| 成人在线观看黄| 亚洲欧美网站| 欧美 日韩 亚洲 一区| 欧美日韩天堂| 很污的网站在线观看| 黄色精品网站| 六月婷婷在线视频| 最新日韩av| 黄色片网址在线观看| 亚洲精品偷拍| 国产资源在线视频| 一区二区三区国产在线| 1024精品视频| 欧美亚洲一区二区三区| 国产中文字幕免费观看| 久久激情视频| 四虎永久在线精品无码视频| 三级欧美在线一区| 粉嫩虎白女毛片人体| 日韩成人伦理电影在线观看| 日韩一区二区三区不卡视频| 精品一区二区三区在线播放 | 亚洲午夜小视频| 黄色av免费在线看| 国产亚洲视频中文字幕视频| 成年人在线观看视频| 日韩在线视频一区| 亚洲小说区图片| 亚州欧美日韩中文视频| 黑人巨大亚洲一区二区久| 国产精品精品久久久久久| 日本一区二区三区中文字幕 | av免费在线播放网站| 日韩精品久久理论片| 国产亚洲视频一区| 国产成人aaa| 亚洲天堂久久新| 中文字幕在线不卡| 久久99久久久| 欧美性猛交xxxx免费看| 亚洲天堂国产精品| 日韩精品一区二区三区老鸭窝| 香蕉久久一区二区三区| 一区三区二区视频| av毛片在线播放| 91精品国产自产91精品| 成人做爰视频www| 成人精品水蜜桃| 极品美女一区二区三区| 日韩成人午夜影院| 亚洲少妇诱惑| 91精品999| 北条麻妃国产九九精品视频| 娇妻被老王脔到高潮失禁视频| 亚洲精品视频免费看| 少妇太紧太爽又黄又硬又爽| 精品视频一区三区九区| 天天干视频在线| www.国产一区| 麻豆mv在线看| 亚洲jizzjizz日本少妇| 亚洲春色h网| 欧美交换配乱吟粗大25p| 毛片一区二区| 极品人妻一区二区| 欧美国产禁国产网站cc| 日韩三级一区二区三区| 欧美另类一区二区三区| 天堂91在线| 欧美尺度大的性做爰视频| 免费观看成人性生生活片| 亚洲综合一区二区不卡| 国模精品一区| 日韩欧美视频网站| 成人在线一区二区三区| 国产午夜精品理论片在线| 91福利精品视频| 亚洲欧美日本在线观看| 欧美猛交免费看| 日韩成人在线一区| 日本在线观看一区| 亚洲高清不卡| 四川一级毛毛片| 最新国产の精品合集bt伙计| 精品人妻无码一区二区性色| 亚洲国产精品字幕| 综合久久2019| 91在线观看免费高清| 久久精品国产www456c0m| 国产xxxxx视频| 91在线免费视频观看| 久久国产精品波多野结衣| 制服丝袜亚洲色图| 香蕉视频网站在线观看| 国产精品福利在线| 国产亚洲欧美日韩在线观看一区二区 | 欧美成免费一区二区视频| 欧美日韩在线视频一区二区三区| 国产91高潮流白浆在线麻豆| 91在线播放观看| 欧美一区二区三区日韩视频| 日本不卡视频| 国产主播喷水一区二区| 天天天综合网| 在线视频一二区| 成人欧美一区二区三区小说 | 麻豆freexxxx性91精品| 欧美人妻一区二区三区| 91福利视频网站| 91在线看片| 91在线免费观看网站| 自由日本语亚洲人高潮| 香蕉视频1024| 亚洲影视在线播放| 天天干天天舔天天射| 欧美一区深夜视频| 国产精品欧美在线观看| 天天爱天天操天天干| 国产精品女主播在线观看| 在线播放亚洲精品| 久久视频国产精品免费视频在线| 95精品视频| 男人天堂a在线| 99视频一区二区| 97久久久久久久| 亚洲午夜av久久乱码| 久久99久久久精品欧美| 一本一生久久a久久精品综合蜜| 紧缚奴在线一区二区三区| 三级影片在线看| 亚洲成人亚洲激情| 日本在线精品| 26uuu成人| 成人黄色av电影| 欧美亚洲另类小说| www.久久色.com| 婷婷综合国产| 2022亚洲天堂| 最新久久zyz资源站| 色噜噜在线播放| 国产精品扒开腿做爽爽爽视频| 97精品一区二区| 精品人妻一区二区免费| 欧美性xxxxx极品娇小| 伊人免费在线| 成人黄动漫网站免费| 日韩av网站免费在线| 欧美人禽zoz0强交| 亚洲男人的天堂在线| 伊人久久大香| 黑人糟蹋人妻hd中文字幕| 国产精品国产精品国产专区不蜜 | 日韩一级特黄毛片| 91美女福利视频| 国产裸体无遮挡| 欧美一级淫片播放口| 亚洲成人一区| 精品夜夜澡人妻无码av| 欧美一区二区三区免费| 欧美专区福利免费| 国产精品国产三级国产专区51| 国产色综合一区|