精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型

發布于 2025-11-4 07:34
瀏覽
0收藏

你有沒有過這種經歷:手機更新個系統,之前會用的功能突然找不到北?連我們人類學個新APP都要摸索半天,更別說讓AI在陌生環境里“即插即用”了。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

最近我在ICLR 2025的論文里發現一個叫REGENT的AI智能體,不用練幾百萬次,也不用裝個“超級大腦”,就靠“翻筆記”的本事,在機器人操控、游戲通關這些任務里,比那些參數多3倍、數據多10倍的大模型還厲害。今天我們聊聊這個“會抄作業還會舉一反三”的AI到底怎么回事。

先吐槽下:現在的AI都是“偏科生”

要理解REGENT的牛,得先說說現在的AI有多“死板”。

我們總聽說“大模型”很厲害,比如能玩幾十種游戲的Gato,能操控機器人的JAT。但這些AI有個通病:學新東西要“拆家式”投入。就像一個只會死記硬背的學霸,要學新題型,就得把整本練習冊重新做一遍——參數要堆到百億級,數據要喂到上億條,最后換個新環境(比如從“打乒乓球”游戲換成“打外星人”),還是會懵。

朋友做機器人實驗時就踩過坑:訓練好的機械臂能疊杯子,換個大點的盤子,就得重新喂幾百次演示數據,調半天參數。用論文里的話說,這叫“缺乏跨環境自適應能力”,說人話就是“不會舉一反三”。

更麻煩的是,這些大模型還“傲嬌”:就算給它點新環境的演示,比如教它玩新游戲的10個片段,它也得“閉關修煉”(微調)半天,最后效果還不一定好。就像你給朋友看了兩遍新家電的用法,他還得對著說明書研究一小時,最后可能還按錯鍵。

破局思路:先從“抄作業”開始——R&P的意外驚喜

REGENT團隊最聰明的地方,是先放下“堆模型堆數據”的執念,問了個簡單問題:能不能讓AI像學生抄作業一樣,遇到不會的題,先找最像的例題照著做?

他們搞了個超簡單的方法,叫“Retrieve and Play(R&P)”,翻譯過來就是“檢索了就用”。原理說出來你可能會笑:

比如AI在玩《吃豆人》,現在遇到一個“怪物在左邊,豆子在右邊”的場景(狀態),它就去之前給的演示數據里,找和當前場景最像的那一幕,然后直接用那一幕里的動作(比如“向右走”)。就像你考試時遇到一道數學題,想不起來公式,翻了翻筆記,找到一道條件差不多的題,照著它的步驟寫答案。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

最讓我驚訝的是實驗結果:這個連神經網絡都沒有的“笨方法”,在Atari游戲、機器人抓取這些任務里,居然和Gato、JAT這些大模型打得有來有回,甚至還能贏。

這就像一個沒上過高數課的學生,就靠死記硬背例題,居然考贏了天天刷題的學霸。這說明什么?有時候“找對參考”比“硬記知識”更重要。AI適應新環境的瓶頸,可能不是“腦子不夠大”,而是“不會查資料”。

REGENT的真本事:把“抄作業”和“真本事”結合起來

但R&P有個明顯的問題:如果遇到演示數據里沒有的“新題”怎么辦?比如演示里只有“吃豆人躲1個怪物”的場景,突然出現3個怪物,R&P就傻眼了。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

這時候REGENT就登場了。它的核心思路很簡單:讓AI既會“抄作業”(R&P),又有自己的“解題思路”(Transformer模型),兩者結合著來

我給你打個比方:把REGENT比作一個學做家常菜的新手廚師。

“抄作業”打底(R&P):廚房里有本食譜(演示數據),遇到不會做的菜,先翻食譜找最像的做法——比如要做“番茄炒蛋”,先看食譜里“番茄炒雞蛋”的步驟,知道先炒蛋再炒番茄。ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

“經驗調整”補漏(Transformer):但新手廚師也不是完全照抄,他會根據自己之前炒過“青椒炒蛋”的經驗(預訓練學到的知識),調整火候——比如知道雞蛋容易老,炒的時候火可以小一點。

聰明的“折中方案”:如果當前場景和食譜里的幾乎一樣(比如番茄和雞蛋的比例都一樣),就主要照食譜來;如果場景差別大(比如番茄多了一半),就多靠自己的經驗調整。這就像你抄作業時,遇到題干稍微變化的題,會根據自己的理解改幾個步驟,而不是全抄。

具體到技術上,REGENT是個“半參數化”智能體——可以理解為“帶了本工具書的工程師”:

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

參數部分(Transformer):相當于工程師腦子里的基礎知識,比如電路原理、機械結構,是預訓練好的,不用每次換任務都重新學。

非參數部分(檢索庫):相當于工程師隨身帶的工具書,里面是各種具體任務的案例(比如修冰箱的步驟、裝空調的圖紙),遇到新任務就查,不用把所有案例都記在腦子里。

這種設計的好處太明顯了:不用超大模型,也不用海量數據。REGENT的參數只有1.38億(比JAT少30%,比Gato少90%),預訓練數據只有1450萬條(比JAT少5-10倍),但效果卻更好。

三大創新點:為什么REGENT能“以小勝大”?

讀論文時,我特別注意到REGENT的三個設計,看似簡單,實則戳中了傳統AI的痛點:

1. 檢索優先:讓“參考資料”替模型“減負”

傳統大模型像個“書呆子”,把所有知識都塞在腦子里,結果遇到新問題反而反應慢。REGENT則是“實用主義者”——能查資料解決的,就不麻煩自己的“大腦”。

比如機器人要做“開門”動作,傳統模型得把“開木門、開鐵門、開抽屜”的所有情況都學一遍;REGENT則只需要學“怎么判斷當前門和哪類參考案例像”,然后調用參考案例里的動作。這就像你不用背下所有城市的地圖,只要會用導航APP,去哪都能找到路。

2. 上下文學習:看兩眼就會,不用“閉關修煉”

很多AI學新東西要“微調”——相當于你學新軟件時,得花幾小時看教程、做練習。REGENT則是“上下文學習”:給它10個新任務的演示片段(比如玩新游戲的10個操作),它當場就能學會,不用額外訓練。

這就像你看朋友用新咖啡機做了兩杯咖啡,你不用看說明書,也能照著他的動作做一杯。論文里說,REGENT適應新Atari游戲只需要1萬條數據,而傳統模型得要100萬條——差距整整100倍。

3. 平滑插值:既不盲目抄,也不瞎創新

最妙的是REGENT處理“抄作業”和“自己來”的關系的方式——不是非此即彼,而是“看情況調整比例”。

就像你開車:如果在熟悉的高速上(場景和參考案例很像),就多靠定速巡航(R&P);如果到了陌生的小巷(場景差異大),就多靠自己操控(Transformer)。這種“平滑插值”的設計,讓REGENT既不會因為“死抄”而在新場景翻車,也不會因為“瞎創新”而犯低級錯誤。

實驗結果:小個子也能打贏大塊頭

光說不練假把式,REGENT的實驗數據確實讓人眼前一亮:

機器人操控任務(比如抓取、開門)里,REGENT不用微調,直接用50個演示片段,就能比JAT(全量數據訓練的版本)表現好30%;就算JAT用新環境的數據微調,還是打不過REGENT。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

游戲任務(ProcGen游戲套件)里,REGENT的參數只有MTT(另一個能上下文學習的模型)的1/3,預訓練數據少10倍,但在《忍者》《登山者》這些游戲里,分數比MTT高20%-50%。更狠的是,就算給游戲加了“隨機干擾”(比如按鍵盤有20%概率沒反應),REGENT照樣能穩定通關,而傳統模型早就亂套了。

ICLR25賓大提出REGENT:檢索增強通用智能體,看兩眼就會學新技能,1.38億參數打贏百億模型-AI.x社區

最讓我覺得有價值的是:REGENT在“老任務”上也沒拉胯——在它預訓練過的環境里,表現和JAT、MTT差不多,甚至在Metaworld機器人任務里還更好。這說明它不是“偏科生”,而是“全能選手”:既能快速學新東西,又不丟老本事。

未來可期,但還有兩個小遺憾

當然,REGENT也不是完美的。我在論文里看到兩個待解決的問題:

一是長任務有點吃力。比如玩《太空侵略者》這種關卡特別長的游戲,REGENT的表現會下降。這就像你看小說,前面的情節記得清楚,看到后面就忘了前面的伏筆,REGENT對“長期記憶”的處理還需要優化。

二是新“身體”適應難。如果給機器人換個新的“身體”(比如從機械臂換成四足機器人),REGENT的表現會變差。這就像你習慣了用鼠標,突然換成觸控板,得適應半天——AI對“身體結構”的抽象理解還不夠。

但這些都是前進中的問題。REGENT的意義不在于它完美,而在于它提供了一條新路子:AI的“通用性”不一定靠“堆資源”,靠“會檢索、會借鑒”也能實現。這對小團隊、小公司來說太重要了——不用買幾百塊GPU,不用喂上億條數據,也能做出能快速適應新環境的AI。

最后:AI的“學習能力”,可能比“記憶力”更重要

讀完這篇論文,我最大的感受是:我們之前可能把AI的“聰明”想錯了。

不是參數越多、數據越多,AI就越聰明,就像不是書讀得越多、筆記記得越全,人就越厲害。真正的聰明,是“遇到新問題時,知道怎么找參考、怎么舉一反三”——這正是REGENT做到的。

未來,當你的掃地機器人能自己適應新房間的布局,當你的智能家居能看懂你的新需求,當工廠的機器人換個零件就能做新任務時,背后可能就有REGENT這種“檢索增強”技術的影子。

最后問你個問題:如果家里的家電都有REGENT這種“看兩眼就會”的能力,你最想讓哪個家電先升級?評論區聊聊~

參考資料

標題:REGENT: A RETRIEVAL-AUGMENTED GENERALIST AGENT THAT CAN ACT IN-CONTEXT IN NEW ENVIRONMENTS

作者:Kaustubh Sridhar (賓夕法尼亞大學), Souradeep Dutta (賓夕法尼亞大學/英屬哥倫比亞大學), Dinesh Jayaraman (賓夕法尼亞大學), Insup Lee (賓夕法尼亞大學)

鏈接:https://openreview.net/pdf?id=NxyfSW6mLK

本文轉載自??旺知識??,作者:旺知識

已于2025-11-4 10:02:16修改
收藏
回復
舉報
回復
相關推薦
亚洲另类激情图| 一区二区三区国产豹纹内裤在线| 欧美一区中文字幕| 国产一区二区三区小说| 香蕉国产在线视频| 秋霞午夜av一区二区三区| 久久久精品亚洲| 天天插天天射天天干| 在线观看福利电影| 亚洲精品国产a久久久久久| 久久精品一二三区| 国产免费无遮挡| 久久久久久久尹人综合网亚洲| 欧美成人vr18sexvr| 国产成人无码一二三区视频| 2024最新电影免费在线观看| 91在线你懂得| 91精品视频免费观看| 一区二区三区福利视频| 亚洲精品一区二区妖精| 亚洲毛片在线看| 蜜桃色一区二区三区| jvid一区二区三区| 性做久久久久久免费观看| 在线视频不卡一区二区| 狠狠狠综合7777久夜色撩人| 国产成人在线色| 国产免费一区视频观看免费| 免费黄色网址在线| 亚洲精品偷拍| 欧美激情a在线| 天天天天天天天天操| 欧洲grand老妇人| 日韩久久精品成人| 艳妇乳肉豪妇荡乳xxx| 麻豆精品久久| 91麻豆精品久久久久蜜臀| 黑森林精品导航| 这里有精品可以观看| 亚洲成人自拍偷拍| 隔壁人妻偷人bd中字| av免费网站在线| 亚洲天堂久久久久久久| 一区二区在线观看网站| 成a人片在线观看www视频| 久久影院电视剧免费观看| 久久成人资源| 日韩永久免费视频| 99久久综合狠狠综合久久| 国产欧美综合精品一区二区| 亚洲精品一区二区三区不卡| 激情久久五月天| 91久久国产精品91久久性色| 一区二区三区黄| 精品一区二区影视| 国产又爽又黄的激情精品视频| 免费在线观看av网址| 亚洲成av人片乱码色午夜| 精品国内亚洲在观看18黄| 人人艹在线视频| 婷婷综合久久| 操日韩av在线电影| 妺妺窝人体色www聚色窝仙踪| 欧洲在线一区| 精品夜色国产国偷在线| 亚洲 日韩 国产第一区| 666欧美在线视频| 国产精品美女一区二区三区 | 精品无码m3u8在线观看| 91久久夜色精品国产按摩| 精品国产一区av| 三级在线观看免费大全| 亚洲va在线| 久久久日本电影| 欧美在线观看不卡| 日产国产高清一区二区三区| 国产日韩专区在线| www.97av| 91老师片黄在线观看| 日韩电影免费观看高清完整| 在线观看免费高清完整| 亚洲精品视频一区| 国产美女网站在线观看| 亚洲精品一级二级| 欧美高清视频不卡网| 精品无码av一区二区三区不卡| 日韩精品一区二区三区| 欧美日韩久久久久久| 在线成人免费av| 日韩最新在线| 亚洲天堂av在线播放| 日韩欧美国产成人精品免费| 亚洲福利精品| 国产精品久久久久久久天堂 | 欧美午夜影院一区| 欧美视频亚洲图片| 欧美日韩大片免费观看| 最新的欧美黄色| 青青操国产视频| 久久午夜激情| 亚洲综合中文字幕在线观看| 青梅竹马是消防员在线| 亚洲欧美日韩综合aⅴ视频| 国产精品沙发午睡系列| 伦一区二区三区中文字幕v亚洲| 色8久久精品久久久久久蜜| 911福利视频| 日韩啪啪网站| 麻豆一区二区在线观看| 日韩综合在线观看| 成人一区二区三区中文字幕| 天天综合色天天综合色hd| 大香伊人中文字幕精品| 欧美日韩精品三区| 国产交换配乱淫视频免费| 欧美午夜不卡影院在线观看完整版免费| 久久亚洲精品视频| 亚洲欧美精品一区二区三区| 国产suv精品一区二区883| 亚洲看片网站| av资源亚洲| 精品成a人在线观看| 91免费公开视频| 日韩和欧美一区二区| 久久久99国产精品免费| 日本三级韩国三级欧美三级| 欧美日韩视频第一区| 中文字幕av网址| 国产综合久久| 99超碰麻豆| 国产在线激情| 欧美精品日韩精品| 少妇视频在线播放| 久久资源在线| 日本福利一区二区三区| 日本三级一区| 亚洲国内精品视频| 国产无码精品一区二区| 国产成人精品影视| 国产又粗又大又爽的视频| 免费视频观看成人| 在线视频欧美日韩精品| 91丨九色丨海角社区| www欧美成人18+| 日韩少妇内射免费播放18禁裸乳| 国精产品一区二区三区有限公司| 在线精品国精品国产尤物884a| 超碰超碰在线观看| 欧美三级伦理在线| 国产999在线观看| 欧美孕妇孕交xxⅹ孕妇交| 亚洲v日本v欧美v久久精品| 一区二区三区人妻| 欧美不卡视频| 99视频免费观看| freexxx性亚洲精品| 欧美精品一区二区不卡| 日韩特黄一级片| 2021中文字幕一区亚洲| 无码人妻丰满熟妇区96| 婷婷五月色综合香五月| 国产成人极品视频| 福利视频在线导航| 91麻豆精品国产91久久久更新时间| 国产高清成人久久| 亚洲精选国产| 热re99久久精品国产99热| 久久99久久久精品欧美| 欧美成aaa人片免费看| 国产成人a人亚洲精品无码| 亚洲精品国产a| 91黄色免费视频| 日韩精品亚洲一区二区三区免费| 国产91精品入口17c| а√天堂8资源中文在线| 国产视频久久久| 欧美精品九九99久久| 精品麻豆av| 牛牛精品在线视频| 日韩电影第一页| 最新中文字幕免费| 亚洲精品日韩一| 中文字幕在线视频播放| 日韩高清在线一区| 精品一区二区成人免费视频 | 日韩黄色一区二区| 国产日韩一区二区三区在线播放| 99热在线国产| 欧美大片免费| 欧美大片在线看免费观看| 欧美日韩影视| 欧美一区二区三区人| 天天综合网入口| 中文字幕亚洲一区二区av在线| 欧美日韩在线中文| 欧美激情欧美| 久久精品国产一区二区三区不卡| 激情在线视频播放| 伊人激情综合网| 风流老熟女一区二区三区| 欧美性xxxx在线播放| 男人的午夜天堂| 久久免费美女视频| 亚洲欧洲日韩综合| 美腿丝袜亚洲三区| 免费看国产曰批40分钟| 7777久久香蕉成人影院| 久久一区二区三区av| 日韩成人18| 国产精品一二区| 三级中文字幕在线观看| 欧美成人高清视频| 伊人免费在线| 亚洲网址你懂得| 欧美熟女一区二区| 欧美一区二区三区思思人| 日韩国产成人在线| 动漫精品一区二区| 久久久久亚洲av无码专区体验| 国产成a人亚洲精品| 国产九九热视频| 三级不卡在线观看| 欧美一级免费播放| 欧美~级网站不卡| 亚洲综合第一| 日本一区二区免费高清| 欧美视频1区| 希岛爱理av免费一区二区| 粉嫩高清一区二区三区精品视频 | 91久久精品日日躁夜夜躁欧美| 欧美色图亚洲激情| 成人黄色小视频在线观看| 超碰中文字幕在线观看| 日韩不卡一区二区| 97视频在线免费播放| 亚洲欧洲一区二区天堂久久| 久操手机在线视频| 女主播福利一区| 成人在线观看毛片| 国产精品v一区二区三区| 黄色网络在线观看| 婷婷久久国产对白刺激五月99| 欧美日韩一卡| 老司机久久99久久精品播放免费 | 欧美性天天影视| 日韩精品视频在线观看网址| 少妇又色又爽又黄的视频| 欧美变态tickling挠脚心| a天堂视频在线| 欧美成人艳星乳罩| 91麻豆精品成人一区二区| 精品999成人| 男女猛烈激情xx00免费视频| 亚洲二区精品| 人妻熟妇乱又伦精品视频| 国产毛片久久| 麻豆av免费在线| 日韩和欧美一区二区三区| 日韩不卡一二三| 久久精品999| 无人码人妻一区二区三区免费| 最新成人av网站| 91精品国产91久久久久麻豆 主演| 国产一区二区三区站长工具| 日韩精品一区二区三区色偷偷 | 免费看一级黄色| 国产精品午夜在线观看| 在线观看亚洲网站| 亚洲一二三区在线观看| av中文在线播放| 欧美私人免费视频| www.超碰在线.com| 日韩av在线免费| 成人精品一区| 久久精品在线视频| av在线网页| 国产精品电影观看| 激情综合五月| 精品视频免费观看| 日韩理论电影院| 18黄暴禁片在线观看| 久久久久国产精品一区二区| 国产无遮挡猛进猛出免费软件 | 国产精品吴梦梦| 国产午夜久久av| 久久久久久国产精品免费免费| 我要色综合中文字幕| 久久久久久久免费| 欧美视频网址| 日韩xxxx视频| 另类的小说在线视频另类成人小视频在线| 国产一区二区网| 日韩av在线播放中文字幕| 人妻激情偷乱视频一区二区三区| 久久国产欧美日韩精品| 激情小说欧美色图| 国产欧美日韩久久| 国产第一页第二页| 色播五月激情综合网| 精品乱子伦一区二区| 亚洲人成网7777777国产| 97caopor国产在线视频| 国产999精品| 国产伦精品一区二区三区免费优势| 97视频热人人精品| 精品欧美激情在线观看| 草b视频在线观看| 美女高潮久久久| 91视频啊啊啊| 亚洲一区影音先锋| 亚洲不卡在线视频| 亚洲国产精品成人av| 麻豆传媒在线免费| 国产精品6699| 日韩美女精品| 成人一区二区免费视频| 国产一区999| 国产免费嫩草影院| 色综合天天狠狠| 天堂中文在线资源| 欧美多人爱爱视频网站| avtt久久| 中文字幕av日韩精品| 日韩在线卡一卡二| 中文字幕av网址| 欧美三级xxx| 人妻少妇一区二区三区| 久久99热精品| 麻豆视频久久| 好吊色视频988gao在线观看| 蜜臀精品一区二区三区在线观看 | 天天干,天天干| 欧美精品一区二区三区四区 | 国产精品欧美亚洲| 亚洲丝袜一区在线| 吞精囗交69激情欧美| 久久亚洲国产精品日日av夜夜| 亚洲免费福利一区| 久久国产精品视频在线观看| 国产乱一区二区| 欧美极品视频在线观看| 欧美一级二级三级蜜桃| 国产剧情在线| 91九色在线观看| 欧美freesex交免费视频| 少妇欧美激情一区二区三区| 中文字幕一区视频| 在线观看免费视频一区| 中文字幕v亚洲ⅴv天堂| 国产精品亚洲成在人线| 正在播放久久| 精品一区二区三区免费观看| 久久久久久视频| 日韩女优电影在线观看| 久草在线视频福利| 精品视频高清无人区区二区三区| 99综合久久| 黄色小视频大全| 国产凹凸在线观看一区二区| 国产精品6666| 日韩精品在线观看网站| 国产高清不卡| 亚洲视频在线观看日本a| 久久99这里只有精品| 好吊色视频在线观看| 精品国产3级a| av男人的天堂在线观看| 欧美日产一区二区三区在线观看| 999国产精品永久免费视频app| 国产91xxx| 国产日韩av一区二区| 国产精品久久久久久久久久久久久久久久| 亚洲精品成人av| 日韩性xxx| 国产又爽又黄ai换脸| 粉嫩aⅴ一区二区三区四区五区| www成人啪啪18软件| 欧美三区在线视频| 日韩特级毛片| 欧美一区二区三区在线播放| 国模无码大尺度一区二区三区| 激情综合丁香五月| 欧美亚洲国产一区二区三区| 91精品大全| 国模一区二区三区私拍视频| 秋霞电影网一区二区| 免费在线观看国产精品| 日韩精品在线视频| 国产第一亚洲| 黄色一级视频在线播放| 国产精品人成在线观看免费 | 三级影片在线观看欧美日韩一区二区| 污视频在线观看免费网站| 亚洲二区在线观看| 91欧美在线视频| 国产成人女人毛片视频在线| 日韩电影在线观看一区| 18精品爽视频在线观看| 国产婷婷色综合av蜜臀av | 国产精品丝袜久久久久久高清 |