精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

讓視覺語言模型像o3一樣動手搜索、寫代碼!Visual ARFT實現多模態智能體能力

人工智能 新聞
上海交大、上海 AI Lab、港中文、武漢大學的研究團隊最新推出的多模態智能體訓練方法?Visual-ARFT(Visual Agentic Reinforcement Fine-Tuning),專為賦予視覺語言模型(LVLMs)以「工具智能體」能力而設計。

在大型推理模型(例如 OpenAI-o3)中,一個關鍵的發展趨勢是讓模型具備原生的智能體能力。具體來說,就是讓模型能夠調用外部工具(如網頁瀏覽器)進行搜索,或編寫/執行代碼以操控圖像,從而實現「圖像中的思考」。

盡管開源研究社區在純文本的智能體能力方面(比如函數調用和工具集成)已取得顯著進展,但涉及圖像理解與操作的多模態智能體能力及其對應的評估體系仍處于起步階段。

因此,上海交大、上海 AI Lab、港中文、武漢大學的研究團隊最新推出的多模態智能體訓練方法 Visual-ARFT(Visual Agentic Reinforcement Fine-Tuning),專為賦予視覺語言模型(LVLMs)以「工具智能體」能力而設計。

并且,Visual-ARFT 項目已全面開源(包含訓練、評測代碼,數據和模型)。如果你對多模態模型、強化學習、視覺語言理解感興趣,不妨一起來探索更多可能性吧!

圖片

  • 論文標題:Visual Agentic Reinforcement Fine-Tuning
  • arXiv 地址:  https://arxiv.org/pdf/2505.14246
  • 代碼地址: https://github.com/Liuziyu77/Visual-RFT/tree/main/Visual-ARFT

Visual-ARFT 讓模型不僅能看圖、能理解,還能「動腦推理、動手操作」,主要包括以下三個方面的核心能力:

  • 模型能夠自動調用搜索引擎查資料或者編寫并執行 Python 代碼處理圖像;
  • 面對復雜任務,能夠自主拆解問題、規劃步驟、調用合適工具完成任務;
  • 支持多步推理、多模態輸入,具備強大的跨模態泛化能力!

如圖 1 所示,本文的方法編寫并執行 Python 代碼以精準讀取圖像中特定區域的文本(上圖),或者通過互聯網搜索回答多模態多跳問題(下圖)。

圖片

圖 1. 視覺智能體強化微調(Visual Agentic Reinforcement Fine-Tuning,簡稱 Visual-ARFT)在執行復雜的多模態推理任務中展現出顯著優勢,例如:(上圖)編寫并執行 Python 代碼以精準讀取圖像中特定區域的文本,以及(下圖)通過互聯網搜索回答多跳問題。

同時,為了評估模型的工具調用和多模態推理能力,團隊構建了智能體評測基準 MAT-Bench (Multimodal Agentic Tool Bench)。測試結果顯示,Visual-ARFT 在多個子任務中全面超越 GPT-4o,通過調用工具 ——「寫代碼 + 查資料」,展現出了完成復雜多模態視覺任務的強大潛力。

方法概覽

Visual-ARFT 基于強化微調的訓練策略,使用 GRPO 的算法來更新模型權重。團隊針對多模態智能體完成任務的流程,對 LVLM 的多步工具調用和問題回答設計了 rule-based verifiable reward。通過簡單高效的 reward 設計,驅動模型自主探索工具的使用方法和思考模式。

團隊在訓練中使用幾十到最多 1.2k 的訓練數據,通過少量數據實現了對模型的多模態智能體能力的訓練。

圖片

圖 2. Visual-ARFT 框圖。主要針對 Agentic Search 和 Agentic Coding 兩類任務的多步推理和工具調用能力進行優化。

Visual-ARFT 針對以下兩類高難度任務場景進行強化訓練:

  • Agentic Search:模型面對多模態的多跳復雜問題,先對視覺信息進行分析和推理,然后能夠主動進行任務分解、規劃信息檢索路徑,通過調用搜索引擎獲取外部知識并整合作答。
  • Agentic Coding:模型面對模糊、旋轉、曝光過強等復雜圖像,能主動生成 Python 代碼完成圖像修復,或剪裁圖像,提取關鍵區域,并據此完成視覺問答。

在這一過程中,模型并非簡單輸出結果,而是具備完整的推理結構:

每一步都以 <think> 思考引導、<search> 檢索信息、<code> 編寫程序、<answer> 給出結論,真正形成可解釋的多模態認知路徑。

MAT 基準

團隊發布了全新的多模態智能體評測基準:MAT(Multimodal Agentic Tool Bench),專門評估多模態工具調用能力:

  • MAT-Search:包含 150 道多跳視覺問答任務,人工標注 + 搜索推理;
  • MAT-Coding:包含 200 道復雜圖像問答任務。模型可以直接作答或通過調用代碼工具處理圖像,輔助作答。

這一基準填補了當前開源模型在「多模態智能體以及工具調用」方面的評估空白。

圖片

圖 3. MAT 數據標注過程。MAT-Search 采用人工標注方法構建多模態多跳推理 VQA 數據,MAT-Coding 采用自動化流程構造針對 Agentic Coding 任務的 VQA 數據。

Visual-ARFT 實驗結果

團隊基于 Qwen2.5-VL 模型在 MAT 上對本文方法進行了測試。結果顯示,無論在 MAT-Search 還是在 MAT-Coding 上,本文方法都較 baseline 有了顯著的提升,并擊敗了 GPT-4o 模型。

相較于 baseline 模型直接推理的方式,本文方法通過讓 LVLM 學會推理與調用工具,在解決復雜的多模態任務時,更加的得心應手。此外,團隊觀察到 OpenAI-o3 模型在一眾開源閉源中取得了遙遙領先的性能,尤其是在 MAT-Coding 上,憑借其多模態推理和工具調用能力,斷層式超越了 GPT-4o 模型。

圖片

表 1. MAT 測試結果。 Visual-ARFT 相較 baseline 取得了顯著性能提升,擊敗 GPT-4o。開閉源模型距離 OpenAI-o3 模型存在較大性能差距。

為了測試本文方法的泛化能力,團隊選取了 4 個 Out of Domain 的傳統 MultihopQA Benchmark 來測試他們的模型,包括 2wikimlutihopQA,HotpotQA,MuSiQue 和 Bamboogle。

結果顯示基于 Visual-ARFT 的 Qwen2.5-VL 模型雖然僅僅使用幾十條數據進行訓練,但是模型獲得在這些多跳推理數據集上展現出了顯著的性能提升,并擊敗了其他基于強化學習的方法。

圖片

表 2. 傳統 MultihopQA 測試結果。團隊在 Out of Domain 的多個 multihopQA 上測試了本文方法,展現出 Visual-ARFT 的強大泛化能力。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-23 13:59:41

RustPython程序

2022-10-12 08:05:04

PlantUML代碼運行環境

2022-12-21 15:56:23

代碼文檔工具

2021-04-13 22:30:17

SpringBoot日志微服務

2023-02-15 08:17:20

VSCodeTypeScrip

2023-03-06 09:20:53

扁平化管理代碼

2011-10-24 13:07:00

2017-05-22 10:33:14

PythonJuliaCython

2025-08-18 18:19:34

AI視覺模型

2021-04-23 15:13:16

算法模型技術

2025-09-15 14:42:55

o3視覺推理開源

2024-11-13 09:39:13

2024-07-23 10:34:57

2023-09-22 11:56:57

模型駕駛

2009-12-08 14:26:13

大型網絡運維

2009-12-08 18:06:12

戴爾存儲動車組

2025-05-19 08:24:29

圖片加載開發

2022-07-12 14:56:30

AI模型研究

2025-04-23 08:30:05

2025-10-21 09:06:00

點贊
收藏

51CTO技術棧公眾號

国产特级黄色录像| 黄www在线观看| 99久久一区二区| 亚洲免费高清| 色偷偷噜噜噜亚洲男人| 能看毛片的网站| 免费一二一二在线视频| 国产精品嫩草99a| 国产精品免费看一区二区三区| 男女啊啊啊视频| 欧美成人直播| 精品亚洲va在线va天堂资源站| 99re精彩视频| 中文字幕在线直播| 亚洲制服丝袜av| 亚洲欧美日韩精品久久久| 色婷婷av一区二区三区之红樱桃 | 手机看片1024日韩| 日本sm残虐另类| 97免费视频在线| 欧美做爰爽爽爽爽爽爽| 精品国产99| 日韩毛片在线看| 美女伦理水蜜桃4| 亚洲欧洲二区| 欧洲av在线精品| 亚洲熟妇av一区二区三区漫画| 中文字幕在线观看播放| 中文字幕乱码亚洲精品一区 | 日韩精品系列| 粉嫩在线一区二区三区视频| 91精品久久久久久久久久另类 | 伊人久久大香线蕉午夜av| 香港一级纯黄大片| 成人av电影在线| 成人自拍视频网站| 精品人妻无码一区二区三区蜜桃一| 日本最新不卡在线| 国产成人久久久精品一区| 日干夜干天天干| 欧美深夜福利| 欧美成人小视频| 日韩一级片大全| 亚洲精品国产首次亮相| 尤物tv国产一区| 九一在线免费观看| 精品国产一级毛片| 国产一区二区三区在线免费观看| 一级黄色性视频| 国内精品视频在线观看| 亚洲视频一区二区三区| 国产免费看av| 精品福利久久久| 国产一区二区三区视频在线观看| 在线国产视频一区| 日韩av大片| 久久精品国产亚洲精品2020| 国产亚洲精品久久久久久豆腐| 日韩在线观看一区| 久久精品中文字幕电影| 四虎永久免费在线| 欧美三级午夜理伦三级中文幕| 久久久免费av| 成年免费在线观看| 老司机午夜精品视频在线观看| 欧美激情亚洲自拍| 精品免费囯产一区二区三区| 视频在线在亚洲| 成人国产精品av| www精品国产| 99re热这里只有精品免费视频| 国产亚洲精品久久飘花| 免费人成在线观看网站| 中文在线一区二区| 免费国产成人看片在线| 91福利在线免费| 深夜福利国产精品| av黄色在线网站| 天天免费亚洲黑人免费| 欧美特级限制片免费在线观看| 无尽裸体动漫2d在线观看| 国产麻豆精品| 国产丝袜视频一区| 国产三级aaa| 精品电影一区| 国产精品都在这里| 国产chinasex对白videos麻豆| 99久久精品国产精品久久| 日韩精品资源| 久草在线资源站资源站| 91成人免费电影| 亚洲妇女无套内射精| 伊人久久大香线蕉av不卡| www.久久久久| 国产成人在线播放视频| 久久国产欧美日韩精品| 精品国产一区二区三区四区vr| 午夜看片在线免费| 亚洲国产精品精华液网站| 无码少妇一区二区三区芒果| 精品国产乱码一区二区三区| 日韩精品在线视频观看| 亚洲成人生活片| 丝袜脚交一区二区| 国产精品av一区| 91青青在线视频| 大桥未久av一区二区三区| 91小视频在线播放| 国产麻豆精品久久| 欧美激情综合色| 一级特黄aaaaaa大片| 久久综合资源网| 妺妺窝人体色www看人体| 久久精品嫩草影院| 亚洲另类欧美自拍| 国产第一页第二页| 黄网站免费久久| 视频一区三区| 亚洲精品中文字幕| 亚洲第一区中文99精品| 国产高潮流白浆| 蜜桃精品视频在线| 欧美一级片免费观看| 福利在线免费视频| 欧美不卡123| 欧美特级一级片| 久久精品二区亚洲w码| 日本一区二区三区免费看| av免费不卡国产观看| 欧美一级日韩免费不卡| 中文字幕无码日韩专区免费| 日本成人在线一区| 日韩不卡av| 偷拍精品精品一区二区三区| 日韩成人av一区| 亚欧洲精品在线视频| 成人免费视频一区二区| 神马午夜伦理影院| 亚洲精选av| 欧美二区在线播放| 国产夫绿帽单男3p精品视频| 1024国产精品| 污污视频在线免费| 91精品动漫在线观看| 91在线观看免费观看| 免费在线午夜视频| 91麻豆精品国产自产在线 | 国产精品美女久久久久aⅴ | 一本色道久久88精品综合| 久久久久99精品成人片我成大片| 久久婷婷一区二区三区| 国产淫片av片久久久久久| 综合色就爱涩涩涩综合婷婷| 日本亚洲欧洲色| 国产高清av在线| 欧美日韩亚洲综合| 久久国产精品国语对白| 国产精品亚洲午夜一区二区三区| 国产一区二区三区播放| av成人综合| 91超碰caoporn97人人| 午夜在线观看视频18| 在线欧美日韩国产| 亚洲一二三四五六区| 极品尤物av久久免费看| 欧美另类videosbestsex日本| 凹凸成人在线| 国产91热爆ts人妖在线| 婷婷五月在线视频| 日韩一区二区免费在线观看| 日本熟妇毛茸茸丰满| 26uuu亚洲婷婷狠狠天堂| 亚洲网址在线观看| 欧美精品免费在线| 丰满人妻一区二区三区无码av| 亚洲综合在线视频| 最新在线黄色网址| 日本不卡不码高清免费观看| 成年人三级视频| 国产精品qvod| 国产精品高精视频免费| www红色一片_亚洲成a人片在线观看_| 91精品国产福利在线观看| 日本学生初尝黑人巨免费视频| 久久久久久一二三区| 中文字幕资源在线观看| 亚洲成人直播| 午夜欧美性电影| 99久久免费精品国产72精品九九| 国产91色在线|免| 18网站在线观看| 亚洲视频电影图片偷拍一区| 99久久国产热无码精品免费| 黑人巨大精品欧美一区二区免费| 亚洲精品自拍视频在线观看| 99re亚洲国产精品| 性色av浪潮av| 日本特黄久久久高潮| 一本久道高清无码视频| 日韩av在线中文字幕| 好吊妞www.84com只有这里才有精品| 成人在线观看免费视频| 136fldh精品导航福利| 成人video亚洲精品| 亚洲人av在线影院| 人妻精品一区一区三区蜜桃91| 欧美色综合网站| 五月天综合激情网| 亚洲综合一区二区三区| 美女av免费看| 久久亚洲捆绑美女| 中文字幕精品视频在线| 国内欧美视频一区二区| 亚洲色精品三区二区一区| 亚洲日本久久| ijzzijzzij亚洲大全| 国产亚洲一区二区三区不卡| 国产伦视频一区二区三区| 精品一区二区三区免费看| 国产精品观看在线亚洲人成网| av在线最新| 欧美激情视频三区| sm国产在线调教视频| 少妇高潮久久久久久潘金莲| 精品无人乱码| 精品一区二区三区四区| 免费观看黄一级视频| 日韩午夜中文字幕| 国产ts变态重口人妖hd| 欧美放荡的少妇| 中文字幕一区二区三区人妻四季| 黑人极品videos精品欧美裸| 日韩乱码在线观看| 亚洲亚洲人成综合网络| 久久久久久久福利| 夜夜亚洲天天久久| 加勒比av在线播放| 一区二区三区在线观看欧美| 中文字幕av播放| 亚洲欧美日韩国产综合在线| 亚洲少妇xxx| 亚洲欧洲三级电影| 亚洲欧洲综合网| 亚洲免费观看在线视频| 东方av正在进入| 亚洲精品国久久99热| 久草资源在线视频| 一区二区三区精品视频| 久久久久成人精品无码| 亚洲一区二区三区小说| 日本五十熟hd丰满| 色综合天天综合狠狠| 亚洲国产成人精品女人久久| 在线观看精品一区| 在线视频欧美亚洲| 欧美一卡二卡在线观看| 亚洲国产精品视频在线| 亚洲国产又黄又爽女人高潮的| 亚洲人成色777777老人头| 亚洲欧美国产精品久久久久久久 | 男人天堂av在线播放| 在线观看一区不卡| 国产一区二区在线播放视频| 日韩欧美色综合| 三级在线观看网站| 亚洲欧美国产视频| 欧美性天天影视| 欧美国产在线电影| 久草在线中文最新视频| 国产精品高潮粉嫩av| 国产欧美日韩电影| 久久久久久久有限公司| 欧美一区二区麻豆红桃视频| 国产精品久久成人免费观看| 亚洲黄色精品| 国产理论在线播放| 国产精品一区二区不卡| 日本xxxx裸体xxxx| 国产精品久久久久精k8| 久久久久亚洲av成人片| 色婷婷激情久久| a级片在线视频| 亚洲乱码国产乱码精品精| 国产婷婷视频在线| 欧美孕妇性xx| 电影一区中文字幕| 久久资源亚洲| 欧美一区国产在线| av免费中文字幕| 国产精品亚洲一区二区三区在线| 黄色a一级视频| 亚洲欧美日韩在线不卡| 欧美精品韩国精品| 日韩一区和二区| 成人在线视频成人| 欧美精品成人91久久久久久久| 国产综合色区在线观看| 成人激情av| 99久久夜色精品国产亚洲1000部 | 美女免费视频一区二区| 日韩女优在线视频| 18涩涩午夜精品.www| 国产 日韩 欧美 在线| 日韩视频一区二区在线观看| 国产中文字幕在线| 国外成人在线直播| 国产乱码精品一区二区三区亚洲人| 欧美一区免费视频| 在线欧美不卡| 中文字幕第六页| 国产精品久久久久久久蜜臀 | 国产午夜精品久久久久久久久| 欧美日韩激情小视频| www视频在线| 久久精品福利视频| 看片一区二区| 日本一区二区免费看| 99在线精品免费视频九九视| 日本中文字幕有码| 最近中文字幕一区二区三区| 天天爱天天做天天爽| 精品香蕉在线观看视频一| 超碰在线97国产| 444亚洲人体| 亚洲国产精品日韩专区av有中文| 性欧美极品xxxx欧美一区二区| 91热门视频在线观看| 国产午夜福利片| 欧美精品一区二区三区蜜桃视频 | 欧美性猛交xxxx免费看| 丰满人妻av一区二区三区| 久久99精品视频一区97| 成人动漫视频在线观看| 综合一区中文字幕| 精品在线免费视频| 国产传媒免费在线观看| 在线不卡中文字幕| 欧美18hd| 亚洲一区二区三区777| 91精品秘密在线观看| 欧美在线a视频| 亚洲综合视频在线| 亚洲精品人妻无码| 久久久视频在线| 欧美色资源站| 久久美女福利视频| 久久精品亚洲精品国产欧美 | 日韩精品在线网站| 成人福利电影| 欧美12av| 蜜臀久久99精品久久久画质超高清| 美女被到爽高潮视频| 欧美在线综合视频| 乱人伦中文视频在线| av噜噜色噜噜久久| 一区在线播放| 美女洗澡无遮挡| 欧美性受xxxx| 成人video亚洲精品| 国产高清一区视频| 午夜在线一区二区| 亚洲ⅴ国产v天堂a无码二区| 在线播放中文一区| 青青草视频在线免费直播| 国产一区国产精品| 日韩在线一二三区| 性色av无码久久一区二区三区| 亚洲成人av在线播放| 日韩大片欧美大片| 中文字幕日韩精品久久| 成人免费观看av| 欧美超碰在线观看| 另类专区欧美制服同性| 久久久久久毛片免费看| 大香煮伊手机一区| 亚洲欧美另类久久久精品2019 | 中文字幕精品av| 亚洲午夜精品| 人人干人人视频| 一区二区三区免费看视频| 欧美日韩国产中文字幕在线| 国产日韩欧美成人| 亚洲视频大全| 精品亚洲乱码一区二区| 亚洲精品在线观看视频| 日本综合视频| 97超碰人人澡| 国产精品欧美久久久久一区二区| www.日韩高清| 国产精品久久久久久一区二区| 国产精品vip| 99在线视频免费| 亚洲精品av在线| 欧洲亚洲精品| 国产网站免费在线观看| 亚洲免费视频中文字幕| av大片在线观看| 精品日本一区二区三区| 国产伦精一区二区三区| 蜜臀99久久精品久久久久小说|