精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

突破Agent長程推理效率瓶頸!MIT&新加坡國立聯合推出強化學習新訓練方法

人工智能 新聞
MIT和新加坡國立大學聯合提出了MEM1框架。實驗結果顯示,7B參數MEM1模型的推理速度能達到傳統14B模型的3.5倍,同時峰值上下文token(peak token)數量約為后者1/4。

AI Agent正在被要求處理越來越多復雜的任務。

但當它要不停地查資料、跳頁面、篩選信息時,顯存狂飆、算力吃緊的問題就來了。

針對這一難題,MIT和新加坡國立大學聯合提出了MEM1框架。實驗結果顯示,7B參數MEM1模型的推理速度能達到傳統14B模型的3.5倍,同時峰值上下文token(peak token)數量約為后者1/4。

該框架提出了一種基于強化學習的推理方案,通過讓智能體學會將記憶更新作為上下文的一部分,從而實現近似常量級的顯存開銷(near constant memory)。

目前相關論文已被大語言模型會議COLM 2025 Reasoning,Attention & Memory:RAM 2 workshop收錄為口頭報告(Oral),會議將于今年10月份在加拿大蒙特利爾舉辦。

MEM1:讓AI學會自主整理思緒+管理工作記憶

想象一位科研工作者連續工作一周后的大腦——充斥著各種公式、實驗數據和臨時靈感,但真正用于解決問題的只是其中核心片段。

對于人來說,每過一段時間起身喝杯咖啡醒醒腦,可以整理思緒,但是對于AI agent來說,這就難了。

經典的大語言模型采用全上下文提示技術,每輪交互都完整附上所有歷史記錄。隨著對話輪次增加,計算成本和內存需求都呈線性增長(O(N))

無限線性增長的上下文導致三個嚴重問題:

  • 無限增長的計算代價;
  • 超出訓練長度的泛化失效;
  • 因信息過載導致的推理能力退化,即使相關信息仍在上下文中,模型也無法有效利用它們。

MEM1的核心創新在于通過訓練的方式讓模型自主將記憶與推理統一

不同于簡單地添加外部記憶模塊(如RAG類的方法),MEM1通過端到端強化學習訓練代理,使其在每一步自動完成三個關鍵操作:

1、提取——從新觀察中識別關鍵信息;2、整合——將新信息與內部記憶狀態融合;3、修剪——丟棄冗余或無關內容。

通過這種訓練方法,AI Agent僅需維護自己上下文中的一個<IS>內部狀態(Internal State),這個<IS>包含之前上下文中所有模型自己認為需要保留的重要信息。

通過引入<IS>,模型的上下文不會隨交互輪次增加而膨脹

不僅如此,<IS>的引入使得模型的推理過程與記憶整合可以有機地結合在一起,它不僅提供對當前查詢的深度洞察,還充當“工作記憶”,從收集信息中提取關鍵組件構建下一步推理。

這種過程也十分符合人們自己整理思緒的過程:雜亂陳舊的記憶被遺忘,同時隨著記憶被整合,下一步的工作重點也隨之顯現出來。

MEM1采用端到端的基于結果獎勵(Outcome Reward)的強化學習訓練方式,并引入一種特殊的注意力掩碼機制(Attention Mask)。

該機制限定Agent在生成下一步輸出時只能關注到上一輪交互的內容,從而迫使其學會對歷史信息進行高效壓縮,同時提升推理與問題求解能力。

相對于傳統的RL訓練,MEM1在rollout期間引入了多個trajectories來訓練compressed reasoning。為了提升訓練效率,MEM1使用attention masking技巧將面向同一個任務的多個trajectories壓縮成一個進行高效訓練。

在推理階段,MEM1 agent會在推理時由agent自主地不斷整合自己的context。整合完之后,之前的memory會自動從context中移出,從而達到在長程環境交互任務下控制context長度的目的。

上圖為MEM1(下)和現有推理模型(上)在長程任務上上下文占用的對比,可以看出現有推理模型上下文會隨著輪次增加線性增長,但MEM1每一輪后將被壓縮過的信息移出context使得上下文保持近似不變。

推理與信息整合的雙重能力

經典的RL環境通常是為短交互設計,并不能很好的鼓勵模型進行長期多輪的推理。大家比較熟知的多輪對話數據集,例如hotpot QA等通常也只需要模型進行兩輪推理。

為了驗證MEM1訓練方法的效果,MEM1團隊基于現有的數據集構造了一個高難度多目標問答任務的訓練環境。團隊基于以下不同領域的數據集構建了訓練環境并進行訓練:

1、Doc檢索QA:模擬研究代理查閱內部文檔;

2、開放域Web QA:真實網絡環境信息獲取;

3、多輪網購:WebShop平臺的復雜決策鏈。

團隊在2目標任務上訓練MEM1 agent,然后在復雜的16目標任務上測試。

MEM1展現出了超越訓練范圍的強大泛化能力,在16目標任務上,MEM1準確率,上下文長度,推理速度三個維度上全方面超過比他更大的模型以及帶有外部記憶模塊的模型。

隨后,研究團隊對MEM1 agent的推理行為進行了定性分析,發現MEM1在處理多輪搜索推理任務時成功展現出了推理與信息整合的雙重能力

記憶方面,MEM1展現出了分問題獨立存儲以及信息更新能力。在推理方面,MEM1能夠掌握自適應的搜索策略,例如拆解子問題,調整關鍵詞查詢,以及任務規劃等等。

MEM1為處理AI Agent長推理上下文這一重大挑戰提供了一個非常有意思的思路。

當下工業界處理上下文仍是以接入外部記憶模塊作為主流方法。但是這種做法通常需要很繁瑣的工程,而且效果難以掌控。

隨著AI Agent端到端強化學習范式的興起,智能體記憶或許可以通過RL的方式讓模型自己來處理。正如MEM1團隊提到的:智能不是讓AI記住一切,而是教會它自己決定應該如何記憶。

論文地址:https://arxiv.org/abs/2506.15841

代碼地址:https://github.com/MIT-MI/MEM1

開源模型:https://huggingface.co/Mem-Lab/Qwen2.5-7B-RL-RAG-Q2-EM-Release

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-27 10:10:43

AI模型技術

2025-06-09 09:32:35

2025-08-07 09:16:41

2025-09-24 09:10:24

2025-03-03 09:12:00

2025-10-11 09:23:28

RLPT強化學習預訓練數據

2025-06-25 09:28:38

2017-02-27 11:36:31

阿里

2020-06-30 09:54:30

框架AI開發

2022-04-11 15:30:48

深度學習數據分析

2025-07-25 09:03:24

2020-09-02 10:36:52

機器人人工智能系統

2020-04-15 16:44:38

谷歌強化學習算法

2025-06-20 08:40:32

2025-10-21 09:06:00

2022-11-27 12:50:01

AI算法MIT

2025-05-09 08:40:00

2025-07-22 09:05:00

強化學習AI模型

2025-10-08 10:26:04

2025-11-12 04:10:00

阿里ROLL FlashChatGPT
點贊
收藏

51CTO技術棧公眾號

免费网站在线观看人| 中国一级免费毛片| 亚洲日本免费电影| 成人欧美一区二区三区黑人麻豆| 成人在线视频福利| 青娱乐国产精品| 国产精品毛片视频| 色94色欧美sute亚洲13| 亚洲午夜精品福利| www.精品久久| 久久国产毛片| 久久精品福利视频| www.啪啪.com| 日本欧美日韩| 亚洲美女视频一区| 欧美日韩精品不卡| 国产婷婷一区二区三区久久| 日韩视频三区| 中文字幕精品av| 中国男女全黄大片| 免费污视频在线一区| 亚洲激情在线激情| 日韩视频在线播放| 囯产精品久久久久久| 丝袜美腿成人在线| 久久久久久久一| 91香蕉国产视频| 国产精品chinese在线观看| 欧美亚洲日本一区| 久久久久久www| 日本在线看片免费人成视1000| 老司机午夜福利视频| 高清国产一区二区三区四区五区| 亚洲国产精品久久不卡毛片| 亚洲精品免费在线看| 日韩中文字幕综合| 韩国精品一区二区| 国产精品777| 国产精品99无码一区二区| 久久在线电影| 亚洲图片在区色| 亚州av综合色区无码一区| av一级久久| 欧美色视频一区| 国产无套粉嫩白浆内谢的出处| 国产天堂在线播放视频| 亚洲人吸女人奶水| 在线观看亚洲视频啊啊啊啊| 美女做暖暖视频免费在线观看全部网址91| 国产精品456| 国产一区二区丝袜高跟鞋图片| 国产精品suv一区| 日韩网站在线| 欧美精品video| 91精品国产高清一区二区三蜜臀| 欧美成免费一区二区视频| 亚洲日本中文字幕| 受虐m奴xxx在线观看| 偷拍自拍一区| 亚洲国产欧美一区二区三区久久| 特黄特色免费视频| 亚洲**毛片| 日韩一区二区三区三四区视频在线观看| 亚洲综合在线网站| 日本在线精品| 欧美午夜不卡在线观看免费| 欧美午夜性生活| 日本精品在线中文字幕| 欧美中文字幕一区二区三区 | 国产黄色av网站| 精品一区二区三区av| 国产在线播放91| 97人妻精品一区二区三区动漫| 久久精品国产99| 91精品免费久久久久久久久| 国产又粗又黄视频| 国产一区二区美女诱惑| 999在线观看免费大全电视剧| av免费在线观看不卡| 国产成人免费视频精品含羞草妖精| 成人亚洲欧美一区二区三区| 精品人妻一区二区三区浪潮在线 | 亚洲av无码乱码国产精品| 国产精品12区| 国产在线精品一区| 日本福利片在线| 日本一区二区不卡视频| 久久天天东北熟女毛茸茸| 国产精品—色呦呦| 欧美午夜精品久久久久久浪潮| 日本成年人网址| 日本国产欧美| 日韩一区二区三区在线视频| 久久久久成人精品无码中文字幕| 九色精品91| 久久黄色av网站| 黄色激情视频在线观看| 久久最新视频| 5g国产欧美日韩视频| 婷婷五月综合久久中文字幕| 国产欧美一区二区精品性| 熟女视频一区二区三区| 3d玉蒲团在线观看| 欧美性xxxxhd| 波多野结衣免费观看| 狠狠一区二区三区| 日韩一区二区三区xxxx| 99热国产在线观看| 狠狠色丁香九九婷婷综合五月 | 久久精品福利| 亚洲欧美精品中文字幕在线| 潘金莲一级黄色片| 亚洲一区成人| 国产精品丝袜白浆摸在线 | 国产麻豆日韩| 99视频在线观看地址| 另类尿喷潮videofree| 国产欧美一区二区精品性色超碰| 91手机视频在线| 在线天堂资源| 日韩一级片在线观看| 中文字幕一区二区人妻在线不卡| 外国成人免费视频| 日本成人免费在线| 成人久久精品人妻一区二区三区| 国产色婷婷亚洲99精品小说| 男人添女人下部视频免费| 亚洲mmav| 亚洲精品99久久久久| 男人的午夜天堂| 久久久久国内| 国产九色精品| sm国产在线调教视频| 日本韩国欧美一区| www.免费av| 国产一区久久| 91在线高清免费观看| 成人免费在线电影| 日韩欧美中文在线| 中文字幕a在线观看| 亚洲字幕久久| 国产精品视频专区| 国产专区在线| 一本一道久久a久久精品 | 精品日韩在线一区| 久久99久久99精品免费看小说| 日韩中文字幕一区二区三区| 九色91在线视频| 97人人在线视频| 日韩欧美电影一二三| 天天色影综合网| 久久se精品一区二区| 日韩av电影免费播放| 91久久国产综合久久91猫猫| 亚洲国产精品人久久电影| 国产在线成人精品午夜| 成人自拍视频在线| 精品无码国产一区二区三区av| 狂野欧美xxxx韩国少妇| 麻豆乱码国产一区二区三区 | 蜜桃久久av| 欧美亚洲另类在线一区二区三区| 国产h片在线观看| 日韩av网站导航| 日韩手机在线观看| 91在线观看视频| 国产日产欧美视频| 黑人操亚洲人| 国产精品久久久久久婷婷天堂| 可以免费看污视频的网站在线| 欧美色播在线播放| 久久久久久九九九九九| 蜜臀av国产精品久久久久| 亚洲欧洲精品一区| 成人综合日日夜夜| 欧美日韩高清区| 日韩中文字幕免费观看| 精品久久久中文| 我和岳m愉情xxxⅹ视频| 日本aⅴ精品一区二区三区 | 欧美中文在线观看| 久久手机免费观看| 欧美日韩精品三区| 四虎免费在线视频| 99热这里都是精品| 国产三级三级三级看三级| 国产精品麻豆久久| 国产成人女人毛片视频在线| 国产美女高潮在线| 国产一区二区三区久久精品 | 最新超碰在线| 亚洲缚视频在线观看| 久久精品视频5| 综合久久综合久久| 精品熟女一区二区三区| 久久久水蜜桃av免费网站| 先锋影音网一区| 清纯唯美激情亚洲| 国产不卡精品视男人的天堂| 精品国产白色丝袜高跟鞋| 亚洲精品www久久久| 国产精品第6页| 中文字幕在线一区免费| www.17c.com喷水少妇| 奇米精品一区二区三区在线观看| 91九色国产ts另类人妖| 天天躁日日躁狠狠躁欧美| 国产女精品视频网站免费| 成人高潮aa毛片免费| 亚洲偷熟乱区亚洲香蕉av| 亚洲av无码一区二区三区性色| 欧美性xxxx极品hd满灌| 国产黄在线免费观看| 久久久综合精品| www.桃色.com| 久久精品麻豆| 免费的一级黄色片| 日韩av有码| 另类小说综合网| 欧洲大片精品免费永久看nba| 欧美中文字幕在线播放| 二区在线播放| 在线视频欧美日韩精品| 黄色av小说在线观看| 欧美精品一二三区| 99热只有这里有精品| 一级做a爱片久久| 天天舔天天操天天干| 99精品视频一区| 午夜影院免费观看视频| 日韩高清在线不卡| 九九九九免费视频| 亚洲午夜伦理| 欧美 国产 精品| 日韩黄色大片| 欧美亚洲爱爱另类综合| 牛牛影视一区二区三区免费看| 91欧美视频网站| 成人在线观看免费视频| 欧美一级黄色网| 91在线超碰| 欧美精品福利视频| 最新国产在线拍揄自揄视频| 日韩亚洲精品视频| av在线电影院| 亚洲偷欧美偷国内偷| 欧美中文在线| 日韩精品视频中文在线观看| 国产91免费在线观看| 日韩无一区二区| 国产精品久久久久久久久毛片 | 丁香花在线观看完整版电影| 久久精品中文字幕电影| 色开心亚洲综合| 中日韩午夜理伦电影免费| 国产特黄在线| 亚洲成人久久久久| 熟妇人妻av无码一区二区三区| 精品嫩草影院久久| 亚洲av无码一区二区乱子伦 | 天天综合网天天综合| 亚洲精品99久久久久| 少妇又色又爽又黄的视频| 欧美精品一区二| 日韩在线观看视频网站| 亚洲成人中文字幕| 手机看片国产1024| 精品夜色国产国偷在线| 日本不卡免费播放| 一区二区三区亚洲| 婷婷免费在线视频| 精品国产自在精品国产浪潮| 国产色在线观看| 欧美黑人xxxⅹ高潮交| 九色porny自拍视频在线播放 | 日韩国产欧美精品| 成人羞羞网站入口| 久久久久亚洲av无码专区喷水| 在线成人直播| 成人免费在线网| 翔田千里一区二区| av在线无限看| 极品少妇xxxx精品少妇偷拍| 宇都宫紫苑在线播放| 成av人片一区二区| 法国空姐电影在线观看| 国产精品免费视频一区| 欧美爱爱小视频| 精品久久久久久久久国产字幕| 色一情一乱一伦| 欧美日本韩国一区二区三区视频 | h片精品在线观看| 欧美专区日韩视频| 日韩久久一区| 国产伦理久久久| 秋霞欧美视频| 成人一级生活片| 日本v片在线高清不卡在线观看| 午夜影院免费版| 久久天天做天天爱综合色| 亚洲一区电影在线观看| 精品久久久一区二区| 夜夜嗨aⅴ一区二区三区| 欧美精品一区二区在线观看| 国产日本在线观看| 欧美激情aaaa| 欧美色片在线观看| http;//www.99re视频| 国内黄色精品| av日韩一区二区三区| 美腿丝袜亚洲综合| 中出视频在线观看| 亚洲欧美一区二区三区孕妇| 欧美在线观看不卡| 欧美成人r级一区二区三区| 风间由美一区| 97国产精品人人爽人人做| 四虎影视国产精品| 欧美高清视频一区二区三区在线观看| 亚洲无中文字幕| 日日噜噜噜噜久久久精品毛片| 成人av在线一区二区三区| 小嫩苞一区二区三区| 色999日韩国产欧美一区二区| 午夜精品一二三区| 久久精品影视伊人网| av免费在线一区| 欧美福利精品| 亚洲精品男同| 小日子的在线观看免费第8集| 欧美激情资源网| 久久久成人免费视频| 亚洲成av人乱码色午夜| 二区三区四区高清视频在线观看| 国产精品福利网| 亚欧洲精品视频在线观看| 日韩人妻无码精品久久久不卡| 国产麻豆日韩欧美久久| 美女福利视频网| 欧美综合一区二区| 美女欧美视频在线观看免费 | av在线下载| 国产啪精品视频| 欧洲三级视频| 亚洲中文字幕久久精品无码喷水| 99久久免费精品| 精品深夜av无码一区二区老年| 欧美一区中文字幕| 国产成人l区| 91视频免费网站| 国产精品99久久久久久动医院| 69久久久久久| 亚洲国产成人在线| 中文字幕在线日亚洲9| 影音先锋欧美精品| 97欧美成人| 亚洲欧美日韩精品在线| 久久精品久久99精品久久| 成人免费视频入口| 欧美日韩成人激情| 精品视频在线一区二区| 3d动漫精品啪啪一区二区三区免费| 久久久久久影院| 亚洲一区二区偷拍| 一区二区三区在线播放| 亚洲高清视频网站| 韩剧1988免费观看全集| 看全色黄大色大片免费久久久| 老太脱裤子让老头玩xxxxx| av午夜一区麻豆| 蜜臀精品一区二区三区| 亚洲无限av看| 四虎精品一区二区免费| 992tv成人免费观看| 国产成人精品一区二区三区四区 | 天天干免费视频| 欧美亚洲另类在线| 欧美日韩水蜜桃| 亚洲精品永久视频| 亚洲午夜羞羞片| 欧美女同网站| 国产日韩欧美中文在线播放| 91精品国产乱码久久久久久| 日本少妇xxx| 欧美日韩国产色视频| 国产精品麻豆一区二区三区| 国产日韩欧美中文| 在线看片一区| 日本少妇高潮喷水xxxxxxx| 欧美日韩不卡在线| 91精品国产黑色瑜伽裤| 日产精品久久久一区二区| 国产综合色在线| 欧美不卡视频在线观看| 中文字幕久热精品在线视频| 欧美影院在线| 动漫av免费观看| 亚洲精品成a人| 国产视频精品久久| 成人国产1314www色视频|