精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

純靠“腦補”圖像,大模型推理準確率狂飆80%丨劍橋谷歌新研究

人工智能 新聞
新框架利用GRPO對大型視覺模型進行后訓練,在多個代表性視覺導航任務中的性能表現都遠超基于文本的推理方法。

不再依賴語言,僅憑圖像就能完成模型推理?

大模型又雙叒叕迎來新SOTA!

當你和大模型一起玩超級瑪麗時,復雜環境下你會根據畫面在腦海里自動規劃步驟,但LLMs還需要先轉成文字攻略一格格按照指令移動,效率又低、信息也可能會丟失,那難道就沒有一個可以跳過“語言中介”的方法嗎?

圖片圖片圖片

于是來自劍橋、倫敦大學學院和谷歌的研究團隊推出了首次純粹依靠圖像進行推理的新范式——基于強化學習的視覺規劃(VPRL)。

圖片

新框架利用GRPO對大型視覺模型進行后訓練,在多個代表性視覺導航任務中的性能表現都遠超基于文本的推理方法。

準確率高達80%,性能超文本推理至少40%,首次驗證了視覺規劃顯著優于文本規劃,為直覺式圖像推理任務開辟了新方向。

目前相關代碼已開源,可點擊文末鏈接獲取。

圖片

以下是有關VPRL的更多細節。

VPRL更準確、更有效

現有的視覺推理基準都是將視覺信息映射到文本領域進行處理,整個推理過程都由語言模型完成。

純視覺規劃則是讓模型直接利用圖像序列,沒有中間商“賺差價”,推理效率直線UP。

由此團隊直接引入一個基于強化學習的視覺規劃訓練框架VPRL,基于群組相對策略優化(GRPO),利用視覺狀態之間的轉換來計算獎勵信號,同時驗證環境約束。

圖片

該框架可以分為兩個階段:

  • 策略初始化

通過環境中的隨機游走軌跡初始化模型,再對每條軌跡提取圖像對,并給定輸入前綴,此外通過最小化監督損失以鼓勵生成連貫的視覺輸出:

圖片

  • 強化學習優化

利用模型在隨機軌跡初始化后已具備的探索能力,通過生成下一視覺狀態模擬潛在動作結果,并引導模型執行有效規劃。

具體來說,就是基于GRPO計算組內相對優勢,每個候選的相對優勢為:

圖片

同時為引導模型生成更高優勢的響應,通過最大化以下目標函數更新策略模型:

圖片

在視覺規劃框架中,核心挑戰始終在于生成的視覺狀態能否正確反映規劃動作的意圖,因此需要通過獎勵函數評估動作有效性(獎勵進展動作、零獎勵非進展動作、懲罰無效動作),進度獎勵函數定義為:

圖片

除了VPRL,研究團隊還選用了幾種系統變體作為基線,分別是基于微調的視覺規劃 (VPFT)和文本中的監督微調 (SFT),以比較基于語言和基于視覺的規劃,同時評估強化學習的作用。

VPFT與VPRL在第一階段訓練架構一致,但用最佳規劃軌跡取代隨機軌跡;而SFT用一個預期動作序列的文本描述取代中間視覺結果。

視覺規劃vs語言規劃

實驗搭建

為了更直觀地比較兩種規劃效果,團隊選取了三個可以完全以視覺方式表達和執行的代表性任務:

  1. FrozenLake智能體需從起點安全導航至終點,過程中需要避開冰洞。
  2. Maze智能體需從起點(綠點)導航至終點(紅旗)
  3. MiniBehavior智能體需拾取打印機并放置到桌上,包含“拾取”和“放置”兩個附加動作。

圖片

在模型的選取上,選擇專門在視覺數據上訓練的模型LVM-3B,確保預訓練期間不接觸任何文本數據。

另外評估比較Qwen 2.5VL-Instruct在僅推理(Direct2和CoT)和訓練后設置(SFT)兩種模式下的文本規劃效果,以及將Gemini 2.0 FlashGemini 2.5 Pro作為多模態推理的參考模型。

圖片

評估指標采用精確匹配率(EM)和進展率(PR),前者衡量模型是否成功生成與最優路徑一致的完整規劃軌跡,后者則測量從開始到最優路徑的連續正確步數與總步數的比率。

實驗結果

圖片

實驗結果表明,視覺規劃顯著優于文本規劃

視覺規劃(VPFT和VPRL)在所有任務上都取得了最高分,如表所示,VPRL在三個任務中平均EM高達80.6%,遠超文本基線(如Gemini 2.5 Pro平均EM為43.7%)。

在強化學習的增益上,VPRL也相比監督基線VPFT提升超20%,尤其是在復雜任務MiniBehavior中EM更是高達75.8%

說明通過獎勵驅動,可以幫助模型自由探索不同行動并從結果中學習,從而有效提高規劃性能。

圖片

與此同時在魯棒性上,隨著網格尺寸增大(如FrozenLake從3×3到6×6),VPRL性能下降平緩(EM從97.6%降至82.4%),而Gemini 2.5 Pro從98.0%驟降至38.8%,充分體現了VPRL更強的穩定性。

與VPFT相比,VPRL也將無效失敗率降低了24%,從而幫助模型保持在有效的動作空間內。

圖片

綜上,實驗結果首次驗證了純視覺推理的可行性,通過研究團隊提出的新范式VPRL框架,可以在視覺導航任務中實現超越文本模型的推理性能,并展現出極強的泛化能力,推動多模態推理在未來朝著更直觀的圖像化方向發展。

值得一提的是,團隊成員長期致力于視覺推理研究,他們也曾研究通過多模態思維可視化(MVoT)生成視覺“思想”,以徹底改變AI推理方式,感興趣的小伙伴們可以持續關注團隊的研究進展~

圖片

論文鏈接:https://arxiv.org/abs/2505.11409

代碼鏈接:https://github.com/yix8/VisualPlanning

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-10-26 08:40:15

模型隱私推理

2023-10-19 08:30:56

模型搜索

2021-12-20 16:17:35

數據模型技術

2023-10-14 13:09:53

谷歌模型

2025-07-04 08:53:00

2020-11-20 17:03:11

AI 數據人工智能

2024-01-05 08:44:52

2023-11-08 08:38:43

2025-02-13 09:40:00

2023-10-23 10:02:00

模型技術

2025-05-26 08:33:00

2018-11-14 10:01:30

谷歌開源機器學習

2020-04-23 13:17:53

腦機接口機器翻譯人工智能

2025-04-18 08:42:52

模型推理AI

2025-09-03 09:05:00

AI模型框架

2020-09-14 14:10:04

開發技能代碼

2023-12-12 13:51:00

AI訓練

2022-04-13 10:31:04

微軟Jigsaw大型語言模型

2025-10-23 12:46:39

2016-01-27 13:37:53

機器學習數據模型算法
點贊
收藏

51CTO技術棧公眾號

午夜成人在线视频| 精品在线播放免费| 国产午夜精品久久久| 日本xxxxxxx免费视频| 福利在线午夜| 国产成人av一区二区三区在线观看| 欧美精品久久久久a| 丰满圆润老女人hd| 国产精久久一区二区| 亚洲成人免费av| 日韩国产高清一区| 99热这里只有精品在线| 99国产精品视频免费观看一公开| 亚洲欧美一区二区三区久久| 黄色小视频免费网站| 大香伊人中文字幕精品| 国产三区在线成人av| 91传媒在线免费观看| 日韩不卡在线播放| 亚洲精品久久| 亚洲欧美资源在线| 中文在线字幕观看| 欧美大片1688网站| 亚洲高清中文字幕| 中文字幕免费在线不卡| 五月婷婷六月丁香| 国产精品自拍av| 国产成人a亚洲精品| 中文字幕av免费在线观看| 免费观看不卡av| 日韩欧美国产一区二区在线播放| 午夜免费精品视频| www成人免费观看| 亚洲精品免费在线观看| 亚洲成人在线视频网站| 午夜视频福利在线| 成人午夜伦理影院| 亚洲iv一区二区三区| 久久精品国产亚洲av麻豆蜜芽| 在线播放日韩| 欧美极品美女电影一区| 国产人妻精品一区二区三区不卡| xxxx日本免费| 国产绿帽刺激高潮对白| 久久成人亚洲| 91国自产精品中文字幕亚洲| 欧美爱爱小视频| 我不卡伦不卡影院| 色婷婷久久一区二区| 久久av无码精品人妻系列试探| 国产成人tv| 欧美一二三四区在线| 日韩在线不卡一区| 日本一区二区中文字幕| 欧美性xxxxx极品少妇| 国产精品乱码久久久久| 欧美1级2级| 日韩欧美中文字幕在线观看| 欧美视频在线播放一区| 在线看的毛片| 色悠悠久久综合| 男人透女人免费视频| 日韩一区二区三区在线免费观看| 欧美性开放视频| 欧美视频第三页| 日韩精品三区| 欧美无乱码久久久免费午夜一区| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 正在播放日韩精品| 色婷婷狠狠综合| 无人在线观看的免费高清视频| 黄色精品视频| 欧美一区日本一区韩国一区| 国产探花在线观看视频| 亚洲综合网站| 亚洲国产毛片完整版| 国产激情在线免费观看| 成人羞羞动漫| 久久中文字幕视频| 国产在线观看99| 美女黄网久久| 久久久久久久国产精品影院| 久久久久久综合网天天| 国产大片中文字幕| 久久国产直播| 成人精品视频在线| 亚洲欧美高清视频| 久久亚洲一区二区三区明星换脸| 日韩精品在在线一区二区中文| 91精品国产91久久久久游泳池 | 天堂网成人在线| 麻豆国产一区| 亚洲男人第一av网站| 久久视频一区二区三区| 亚洲激情中文| 欧洲亚洲在线视频| 91美女精品网站| 成人在线综合网站| 日韩欧美一区二区三区四区| 黄网站免费在线播放| 午夜精品在线视频一区| 最新天堂在线视频| 国产精品一线| 日韩在线观看免费网站 | 你懂的免费在线观看视频网站| 中文字幕成人网| 97超碰国产精品| 成人免费av电影| 精品乱码亚洲一区二区不卡| 日韩视频在线观看免费视频| 欧美国产三级| 国产精品久久久久久一区二区 | 国产综合av| 欧美成人性战久久| 国产激情av在线| 一区二区91| 97se亚洲综合| 午夜老司机在线观看| 欧美香蕉大胸在线视频观看| 久草福利在线观看| 天堂网av成人| 久久久久国产精品www| 中文字幕在线一| 久久亚洲欧美国产精品乐播| 国产一二三区在线播放| 日韩精品第二页| 亚洲人成欧美中文字幕| 日韩 欧美 亚洲| 国产精品一区2区| 日韩视频精品| 中文在线最新版地址| 精品久久久影院| 亚洲日韩中文字幕| 欧美成人黑人猛交| 精品少妇一区| 欧美精品在线观看91| 中文字幕在线播放av| 91日韩一区二区三区| www.国产在线播放| 精品国产亚洲日本| 色黄久久久久久| 波多野结衣视频观看| 99国产精品久| 国产特级淫片高清视频| 91免费精品国偷自产在线在线| 色多多国产成人永久免费网站 | 日本大香伊一区二区三区| 成熟妇人a片免费看网站| 最新精品国产| 51国偷自产一区二区三区| 国产在线高清视频| 3d成人h动漫网站入口| 国产小视频你懂的| 麻豆传媒一区二区三区| 亚洲精品中文字幕乱码三区不卡| 校园春色亚洲色图| 国产午夜精品全部视频播放| 亚洲天堂男人av| 国产亚洲一区二区在线观看| 少妇高清精品毛片在线视频| 欧美热在线视频精品999| 欧美最顶级的aⅴ艳星| 黄色片视频在线观看| 欧美性一级生活| 大胸美女被爆操| 国产一区二区看久久| 少妇久久久久久被弄到高潮| julia中文字幕一区二区99在线| 欧美极品少妇xxxxⅹ喷水| 欧美视频一二区| 都市激情亚洲色图| 欧美人与性囗牲恔配| 捆绑变态av一区二区三区| 国产精品波多野结衣| 一区中文字幕| 9.1国产丝袜在线观看| 国产天堂在线| 欧美一区二区啪啪| 国产精品99无码一区二区| 97久久久精品综合88久久| 成人免费视频久久| 91精品天堂福利在线观看| 成人免费视频网站| 成人性生活av| 久久这里只有精品99| 日本精品一区二区在线观看| 在线免费观看视频一区| 97成人资源站| 91麻豆免费看片| 亚洲精品第三页| 怡红院精品视频在线观看极品| 欧美1o一11sex性hdhd| 欧美成人一二区| 午夜精品久久久久久99热软件| 日本激情一区二区| 欧美人xxxx| 亚洲国产成人精品激情在线| 国产精品三级电影| av天堂一区二区| 日本欧美韩国一区三区| www.在线观看av| 青青草原综合久久大伊人精品| 97超碰资源| 播放一区二区| 97久久国产精品| 久草免费在线观看| 亚洲视频在线观看网站| 成人激情四射网| 在线看不卡av| 国产精品成人网站| 中文字幕色av一区二区三区| 熟妇高潮精品一区二区三区| 精品一区二区在线观看| 无码aⅴ精品一区二区三区浪潮| 99热国内精品| 神马影院我不卡午夜| 成人三级黄色免费网站| 久久先锋影音av鲁色资源| 911福利视频| 亚洲一区久久| 青青在线免费观看| 99久精品视频在线观看视频| 在线观看国产精品入口男同| 樱桃国产成人精品视频| 亚洲精品成人无码熟妇在线| 久久精品色综合| 亚洲欧美精品中文字幕在线| 国产色在线视频| 日韩欧美国产骚| 少妇久久久久久被弄高潮| 国产日产欧产精品推荐色| 国产伦精品一区二区免费| 国产一区欧美二区| 69久久久久久| 黄色av一区二区三区| 99免费精品在线观看| 一级黄色特级片| 销魂美女一区二区三区视频在线| 97激碰免费视频| 日本熟女毛茸茸| 一区2区3区在线看| 美女福利视频网| 国产欧美日韩另类一区| 日本黄色网址大全| 337p粉嫩大胆色噜噜噜噜亚洲| av天堂一区二区| 国产二区国产一区在线观看| 亲爱的老师9免费观看全集电视剧| 国产视频在线看| 精品在线观看国产| 欧美一级性视频| 日韩免费视频线观看| 精品久久久无码中文字幕| 欧美一区二区三区喷汁尤物| 国产免费黄色网址| 91精品蜜臀在线一区尤物| 99在线精品视频免费观看20| 日韩欧美一级在线播放| 亚洲av无码乱码国产精品久久| 69堂精品视频| 国内毛片毛片毛片毛片| 日韩欧美电影一二三| 高潮一区二区三区乱码| 亚洲精品美女在线| 你懂的好爽在线观看| 主播福利视频一区| 黄色片免费在线观看| 欧美日韩ab片| 国产精品69xx| 97香蕉久久超级碰碰高清版 | 久久久久国色av免费看影院| 免费一级做a爰片久久毛片潮| 欧美激情一区在线观看| 中文字幕无码日韩专区免费| 综合久久久久久| 久久久久亚洲av片无码下载蜜桃| 亚洲影视在线播放| 国产黄色免费观看| 欧美日韩免费一区二区三区| 国产成人精品一区二区无码呦| 精品av综合导航| 成人动漫在线免费观看| 久久躁日日躁aaaaxxxx| 国产高潮在线| 国产精品羞羞答答| 97品白浆高清久久久久久| 麻豆一区区三区四区产品精品蜜桃| 免费看av成人| 中文字幕一区二区三区四区五区人 | 男女视频在线| 国产成人高潮免费观看精品| 91久久青草| 精品午夜一区二区三区| 成人在线免费观看网站| bt天堂新版中文在线地址| 久久视频一区| 亚洲精品乱码久久久久久9色| 91影院在线免费观看| 波多野结衣家庭教师在线观看| 亚洲综合视频网| 日批视频免费观看| 亚洲爱爱爱爱爱| 日本福利在线| 欧美亚洲成人精品| 精品91福利视频| 日本一区高清在线视频| 欧美日韩四区| 天堂中文视频在线| av中文字幕在线不卡| 亚洲AV成人无码精电影在线| 色婷婷一区二区| 亚洲成人黄色片| 最近2019中文字幕mv免费看 | 天堂中文字幕在线| 美女啪啪无遮挡免费久久网站| 最新中文字幕在线播放| 91精品天堂| 久久国产小视频| 亚洲人成色77777| 99国产精品久久久久久久久久久 | 午夜精品久久久久久久99水蜜桃| 中文字幕人妻互换av久久| 日韩成人在线观看| 丝袜美女在线观看| 91精品久久久久久久久| 免费电影一区二区三区| 99久久99九九99九九九| 免费一区二区三区| 伊人影院久久| 伊人av在线播放| 亚洲欧洲精品一区二区精品久久久| 国产精品国产三级国产专区52| 91精品国产麻豆| 1024免费在线视频| 国产精品99导航| 竹菊久久久久久久| 亚洲 欧美 日韩 国产综合 在线 | 激情小视频在线| 午夜精品福利电影| 国产精品1luya在线播放| 久久久久久久久久久久久国产| 久久精品久久99精品久久| 手机看片日韩av| 欧美色倩网站大全免费| 国产区视频在线播放| 日本精品免费一区二区三区| 任你弄精品视频免费观看| 久艹视频在线免费观看| 成人一区二区视频| 日干夜干天天干| 日韩国产一区三区| 欧美日韩免费看片| 无遮挡亚洲一区| 免费高清不卡av| 国产欧美小视频| 欧美日本一区二区三区| 秋霞a级毛片在线看| 成人国产精品久久久久久亚洲| 国产精品97| 被黑人猛躁10次高潮视频| 亚洲欧美视频一区| 亚洲成人第一区| 91精品国产91久久久久久吃药| 鲁大师精品99久久久| 男人靠女人免费视频网站| 久久久久久久一区| 精品国产www| 日韩在线观看免费av| 国产精品欧美一区二区三区不卡 | 大又大又粗又硬又爽少妇毛片 | 天堂va欧美ⅴa亚洲va一国产| 国产一级大片免费看| 99riav一区二区三区| 无码人妻精品一区二区| 最近的2019中文字幕免费一页 | 国产视频一区二区| 不卡一区二区三区视频| 亚洲精品孕妇| 国产18无套直看片| 日韩一区二区三区四区| 僵尸再翻生在线观看| 亚洲精品一区二| 国产suv精品一区二区6| 黄色在线观看国产| 上原亚衣av一区二区三区| 精品中文字幕一区二区三区四区 | 久草福利资源在线| 精品国产一区二区三区av性色| 亚洲午夜天堂| 免费看av软件| 91欧美一区二区| 91 中文字幕| 97视频在线观看亚洲| 久久成人综合| 中文字幕天堂网| 欧美日韩激情一区二区| 丁香花在线影院| 亚洲国产激情一区二区三区| 成人激情午夜影院| 依依成人在线视频|