精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗 原創

發布于 2025-9-11 09:13
瀏覽
0收藏

VLMs已具備調用圖像中心工具的能力,稱為“thinking-with-image”(以圖思考),通過支持細粒度推理提升模型對復雜視覺場景的理解能力。然而,開源VLMs在“需要試錯探索的復雜視覺搜索任務”中存在顯著短板,表現兩大問題:

  1. 復雜任務上準確率極低
    高難度視覺搜索數據集熵(如DeepEyes)的準確率遠低于實際應用需求。
  2. 推理模式單一 + 交互輪次有限
    現有開源模型(如DeepEyes)無法生成靈活的推理策略,僅能進行“單次定位-觀察”的簡單流程,而無法像OpenAI o3(閉源模型)那樣,采用“深度優先搜索”“試錯探索”“自我反思”等多樣化策略。例如,在尋找圖像中隱藏的小目標時,開源模型往往“一次裁剪錯誤即終止”,而o3會“回溯至原始圖像、嘗試其他區域、交叉驗證觀察結果”。在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區
  3. 不同交互回合數下正確軌跡的分布情況。Mini-o3 展現出更深層次的思考路徑和更強的性能表現。盡管在訓練階段上限較小(即 6 回合),其仍表現出測試時回合數的縮放特性:當最大回合數從 4 增加到 32 時,準確率持續上升。

下面看下這份“復現OpenAI o3風格行為”的技術食譜,包括數據集構建、數據收集 pipeline、強化學習優化策略三部分。

方法

Mini-o3 的交互遵循 “Thought(思考)-Action(動作)-Observation(觀察) ” 循環,直到輸出最終答案或達到上下文 / 輪次限制。

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

多輪 Agentic 圖像工具調用框架:在每一輪中,模型基于前一次的觀察(或輸入問題和圖像)迭代生成思考和動作。每一輪的觀察結果是根據相應動作所指示的參數獲取的。

  • Thought(T?) :模型基于歷史交互記錄(含輸入圖像、問題、過往觀察)生成的內部推理過程,用于指導下一步動作。核心目標是鼓勵“試錯探索”“回溯驗證”等多樣化推理模式,而非單一路徑。
  • Action(A?)  : 模型執行的具體操作,分為兩類:

     a.??bbox_2d??:歸一化邊界框(范圍[0,1]2),指定裁剪區域;

     b.??source??:操作對象,可選擇“原始圖像”或“歷史觀察結果”(支持跨輪次回溯)。

(1)Grounding:通過參數化指令調用圖像工具,裁剪特定區域。參數包括:

(2)輸出最終答案:當模型判斷已獲取足夠信息時,直接返回結果。

  • Observation(O?) : 執行Action后得到的環境反饋,即工具裁剪后的圖像 patch。該結果會被追加到交互歷史中,作為下一輪推理的輸入。

因此得出循環邏輯:用戶輸入(圖像+問題)→ 模型生成Thought→ 執行Action→ 獲得Observation→ 基于新歷史再次生成Thought→ …→ 輸出答案/終止。

兩階段訓練范式

為平衡“基礎能力初始化”與“復雜推理優化”,Mini-o3分階段訓練:

  • 階段1:SFT:讓模型掌握“合法的多輪交互軌跡生成能力”,即學會根據問題和圖像,生成符合邏輯的Thought-Action-Observation序列,避免無意義的工具調用或過早終止。
  • 階段2:帶可驗證獎勵的強化學習(RLVR):在SFT基礎上,通過強化學習優化模型的推理策略,提升復雜任務的成功率(如需要10+輪交互的視覺搜索)。

訓練數據構建

為解決現有視覺數據集任務簡單、無法激發復雜推理的痛點,構建兩類數據:“挑戰性任務數據集”與“多樣化交互軌跡數據集”。

設計邏輯:

現有開源模型推理能力薄弱的關鍵原因之一是:訓練數據多為“目標易定位、無需試錯”的簡單任務(如HR-Bench),模型僅需“單次圖像觀察”即可輸出答案,無需發展多輪推理策略。因此,Mini-o3的訓練數據構建圍繞兩大需求展開:

  1. 任務層面:提供“必須通過試錯探索才能完成”的高難度視覺搜索任務,迫使模型主動調用圖像工具進行多輪交互;
  2. 軌跡層面:提供“覆蓋多樣化推理策略”的多輪交互范例,幫助基座模型(Qwen2.5-VL-7B-Instruct)初始化“Thought-Action-Observation”循環能力。
兩類數據集情況
  1. 視覺探針數據集

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

為強化學習RL提供“需要試錯探索的挑戰性任務”,避免模型在簡單任務上形成“shortcut學習”(如直接定位目標,無需多輪推理),強制模型發展深度推理能力。任務形式:每條樣本為“高分辨率圖像+視覺搜索問題+標準答案”,例如:

  • 圖像:包含密集干擾物的集裝箱場景(分辨率7952×5304);
  • 問題:“‘67.200’下方的數字是什么?”;
  • 標準答案:“22G1”。

作用:為后續訓練提供需要復雜推理的任務基礎,確保強化學習階段模型能學到“試錯探索”“回溯驗證”等高級策略,而非簡單的“目標定位”能力。

  1. 多樣化冷啟動數據集

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

冷啟動數據采集pipline

解決基座模型(Qwen2.5-VL-7B-Instruct)的“能力初始化”問題:該模型未接觸過多輪圖像工具交互數據,直接用強化學習訓練會導致“軌跡過短”“推理模式單一”(如平均僅1輪交互)。因此,需通過冷啟動數據教會模型“如何生成合法、多樣的多輪交互軌跡”。

軌跡形式:每條軌跡為“輸入圖像+問題+多輪Thought-Action-Observation序列+最終答案”,例如:

  • 問題:“‘CINKER PICTURES’下方的文本是什么?”;
  • 軌跡:11輪交互,包含“裁剪A區域(未找到)→ 回溯原始圖像→ 裁剪B區域(未找到)→ 重新檢查A區域細節→ 定位目標”等步驟,每輪均附帶推理Thought(如“當前區域未發現目標,需嘗試右側區域”)。

強化學習策略

  1. 降低單圖像最大像素數

基座模型上下文長度固定為32K tokens,而高分辨率圖像(默認12M像素)會占用大量tokens,導致單輪圖像輸入后,剩余tokens僅能支持1-2輪交互,無法滿足復雜任務“多輪試錯”的需求。

將單圖像的最大像素數從12M降至2M。這一調整在不損失關鍵細節的前提下,大幅減少單輪圖像的token占用,使得32K上下文可支持6+輪交互,為試錯探索提供足夠的軌跡長度。

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

VisualProbe-Hard數據集準確率從36.1%(12M像素)提升至48.0%(2M像素),驗證了“更多有效交互輪次”對復雜任務的價值

  1. 翻轉掩碼策略

在標準GRPO中,若模型生成的軌跡“超過訓練輪次上限(6輪)”或“超出上下文長度”(即“超輪次軌跡”),會被標記為“無效軌跡”,獎勵設為0。經過獎勵歸一化后,這類軌跡會產生Negative Advantage,導致模型在訓練中被“懲罰”,進而傾向于“過早終止交互”(如3-4輪就輸出答案),抑制深度推理能力。

通過引入“Completion Mask”,對超輪次軌跡的損失進行“掩碼屏蔽”,避免其產生負向學習信號:

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

翻轉掩碼技術示意圖。不完整響應指的是超出交互輪次或上下文長度最大限制的響應

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

如上圖,引入“Completion Mask”效果:訓練時僅限制6輪,但測試時模型可自然擴展至32輪,且準確率隨輪次增加而提升。

性能

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

參考文獻:Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Search,https://arxiv.org/pdf/2509.07969v1

本文轉載自??大模型自然語言處理??   作者:llmnlp

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-9-11 09:44:36修改
收藏
回復
舉報
回復
相關推薦
欧美二区三区在线| 伦理中文字幕亚洲| 欧美日韩国产精品激情在线播放| 黄色片一区二区| 99精品国产一区二区青青牛奶| 精品国产乱码久久久久久1区2区| 成年人网站国产| 天堂在线免费av| 欧美jizzhd精品欧美巨大免费| 日韩久久久久久| 2018中文字幕第一页| 天堂中文在线视频| 久久99热这里只有精品| 欧美激情视频免费观看| 国产ts丝袜人妖系列视频| 欧美黄色三级| 亚洲欧洲综合另类在线| 97视频中文字幕| 日韩精品在线观看免费| 亚洲性视频大全| 欧美久久免费观看| 人人妻人人做人人爽| 国产又爽又黄网站亚洲视频123| 亚洲性色视频| 中文字幕日韩欧美| 伦理片一区二区| 国产91亚洲精品久久久| 一区二区三区丝袜| 99在线观看视频网站| 中文字幕超碰在线| 99精品全国免费观看视频软件| 日韩欧美久久久| 中文字幕永久视频| 国产精品蜜臀| 中文字幕中文字幕一区| 国产乱码精品一区二区三区日韩精品 | 黑人极品ⅴideos精品欧美棵| 国产传媒欧美日韩成人| 国产成人精品久久二区二区| 丁香花五月激情| 国产日产精品_国产精品毛片| 欧美一区二区三区精品| 88av.com| 不卡专区在线| 亚洲伦在线观看| 天天综合狠狠精品| 午夜视频免费在线| 国产精品一区二区三区99| 国产成人精品免费视频| 日本少妇bbwbbw精品| 婷婷色综合网| 亚洲性视频网址| 久久久午夜精品福利内容| 日韩成人精品| 91精品中文字幕一区二区三区| 欧美视频第一区| 91九色美女在线视频| 亚洲美女视频在线观看| 中文字幕欧美人与畜| jizz日韩| 99视频一区二区| 国产精品福利视频| 精品久久久中文字幕人妻| 久久国产尿小便嘘嘘| 午夜精品免费视频| 四虎精品免费视频| 久久精品播放| 在线成人激情黄色| 欧美黄色激情视频| 九一国产精品| 亚洲午夜小视频| 久久久久久久久久久久| 另类春色校园亚洲| 精品国产123| 一级黄色大片免费看| 精品中文在线| 日韩色视频在线观看| 特黄特黄一级片| 视频一区视频二区欧美| 日韩美女天天操| 日韩va在线观看| 亚洲成人高清| 3d成人动漫网站| 一级黄色免费毛片| 99久久人爽人人添人人澡| 精品少妇一区二区三区视频免付费| 亚洲欧美激情网| 外国成人直播| 欧美日韩中文国产| 亚洲另类第一页| 日韩国产91| 日韩一区二区三| 中国xxxx性xxxx产国| 欧美做受69| 亚洲人线精品午夜| 亚洲综合久久av一区二区三区| 久久久久久久久久久久久久久久久久 | 女人色极品影院| 97人澡人人添人人爽欧美| 欧美日韩美女在线观看| 人人爽人人av| 成人51免费| 亚洲成年网站在线观看| 精品少妇一区二区三区免费观| 日韩啪啪电影网| 久久99久久亚洲国产| 日韩免费视频网站| 石原莉奈一区二区三区在线观看 | 国产精品.xx视频.xxtv| 欧美精品久久久久久久久老牛影院| 无人码人妻一区二区三区免费| 色婷婷成人网| 精品少妇一区二区三区日产乱码| 7788色淫网站小说| 日本成人小视频| 欧美日韩成人在线观看| 无码人妻丰满熟妇精品 | 国产日产欧美一区| av一区二区三区免费观看| 美女搞黄视频在线观看| 欧美又粗又大又爽| 韩国av中国字幕| 不卡在线一区二区| 欧美激情xxxx| 在线免费av网| a级精品国产片在线观看| 婷婷久久伊人| 精品众筹模特私拍视频| 91黄色小视频| 日本人添下边视频免费| 久久综合电影| 日本亚洲精品在线观看| 亚洲第一免费视频| 中文字幕精品一区二区精品绿巨人| 免费看日本黄色| 成人软件在线观看| 欧美变态tickle挠乳网站| xxxxx99| 免费在线播放第一区高清av| 国产在线98福利播放视频| 无码精品在线观看| 亚洲激情图片小说视频| 色综合天天色综合| 九色丨蝌蚪丨成人| 伦理中文字幕亚洲| 在线观看国产成人| 久久精品一二三| 鲁一鲁一鲁一鲁一色| 久久gogo国模啪啪裸体| 在线国产精品视频| 日本高清不卡码| 国产精品一区二区黑丝| 亚洲欧美日韩不卡一区二区三区| 忘忧草在线影院两性视频| 精品久久久久久久久久久久久久久 | 久久中文字幕精品| 国产精品久久久亚洲一区| 91久色国产| 国产原厂视频在线观看| 欧美日韩午夜影院| аⅴ天堂中文在线网| 日日欢夜夜爽一区| 日本精品一区二区三区视频 | 91久久国语露脸精品国产高跟| 久久久国产午夜精品 | 欧美精品午夜| 97se在线视频| 日本中文字幕中出在线| 欧美一区二区三区啪啪| 四虎永久免费地址| 久久99久久99| 亚洲免费视频播放| 另类视频一区二区三区| 免费av一区二区| 97免费观看视频| 综合在线观看色| 日本中文字幕二区| 亚洲中无吗在线| 91传媒视频在线观看| 香蕉成人app免费看片| 日韩精品中文字幕在线一区| 免费一级片视频| av色综合久久天堂av综合| 青青青免费在线| 开心激情综合| 国产成人激情视频| 免费大片在线观看www| 欧美一二三区在线观看| 久艹在线观看视频| 国产一区三区三区| 国产色一区二区三区| 日韩欧美高清一区二区三区| 国内伊人久久久久久网站视频| 天堂在线视频免费| 欧美性欧美巨大黑白大战| 久久久久久成人网| 国产成人av一区二区三区在线| 自拍日韩亚洲一区在线| 久草成人资源| 91免费版网站入口| 国产理论在线| 日韩亚洲精品视频| 蜜桃在线一区二区| 欧美主播一区二区三区| 国产精品视频一区二区三| 国内精品不卡在线| 欧美国产亚洲一区| 四季av在线一区二区三区| 国产精品xxxx| aaaa欧美| 午夜精品一区二区三区在线播放| av在线第一页| 日韩欧美二区三区| 999视频在线| 一区二区在线观看免费视频播放| 成人网站免费观看| 精品一区二区日韩| 日本欧美黄色片| 婷婷亚洲综合| 日本视频一区二区不卡| 日韩免费精品| 国产精品视频永久免费播放| 黄色网在线免费看| 亚洲乱亚洲乱妇无码| 亚洲AV无码精品色毛片浪潮| 91精品91久久久中77777| 日本中文字幕免费观看| 国产午夜精品理论片a级大结局| 超碰在线资源站| 午夜亚洲视频| 无码人妻精品一区二区蜜桃百度| 中文字幕亚洲影视| 国产伦精品一区二区三| 97欧美成人| 57pao国产精品一区| 亚洲小说区图片| 最近2019中文字幕一页二页 | 99蜜桃在线观看免费视频网站| 亚洲欧美se| 欧美精品videosex性欧美| 里番在线观看网站| 亚洲欧美精品在线| 天堂在线资源8| 亚洲成色777777在线观看影院| 97人人爽人人爽人人爽| 在线这里只有精品| 亚洲免费黄色网址| 亚洲电影在线播放| 免费高清在线观看电视| 国产精品视频观看| x88av在线| 国产亚洲精品7777| 伊人五月天婷婷| 加勒比av一区二区| 黄页网站在线看| 成人一区二区视频| 男人网站在线观看| 99久免费精品视频在线观看| 变态另类丨国产精品| 99国产精品99久久久久久| 国产一级二级在线观看| 久久精品在线观看| 妖精视频在线观看免费| 1024亚洲合集| 99热精品免费| 亚洲图片欧美一区| 你懂的国产视频| 色综合久久综合网| 亚洲国产无线乱码在线观看| 欧美日韩成人在线一区| 国产三区在线播放| 欧美一区二区三区四区在线观看| www香蕉视频| 亚洲美女视频网站| 99精品老司机免费视频| 久久福利网址导航| 黄色视屏在线免费观看| 国产精品电影网| 懂色av色香蕉一区二区蜜桃| 国产精品精品软件视频| 国产精品一区二区99| 中文字幕精品一区日韩| 亚洲第一精品影视| 我看黄色一级片| 国产成人午夜高潮毛片| 成年人网站免费看| 中文字幕在线不卡一区| 久久精品久久精品久久| 在线日韩av片| 朝桐光av在线一区二区三区| 亚洲美女在线观看| 黄av在线播放| 日韩av片电影专区| 久久99精品久久久野外观看| 欧美精品二区三区四区免费看视频| 日韩啪啪电影网| 欧美 国产 综合| 激情图区综合网| 三上悠亚影音先锋| 一区二区三区精品| 中文字幕精品无| 亚洲缚视频在线观看| 麻豆av在线免费看| 热久久免费国产视频| 欧美2区3区4区| 日韩成人av网站| 一区二区福利| 美国黄色一级视频| ...中文天堂在线一区| 免费av网站在线| 精品国产sm最大网站免费看| 国产调教视频在线观看| 国产精品国产亚洲伊人久久| 精品资源在线| 久久香蕉视频网站| 麻豆精品视频在线观看免费| 91av在线免费| 亚洲一区二区三区小说| ,亚洲人成毛片在线播放| 亚洲欧美精品伊人久久| 8x8ⅹ拨牐拨牐拨牐在线观看| 91亚洲精品在线| 日韩欧美大片| 精品久久久久久无码国产| 成人动漫一区二区| 欧美日韩在线视频免费播放| 欧美日韩国产综合一区二区三区| 青青草免费在线| 97avcom| 成人h动漫免费观看网站 | 黄色亚洲免费| 成人免费播放视频| 国产精品久久久久久妇女6080| 亚洲精品成人在线视频| 日韩av在线免费| 51精品在线| 国产精品久久久久免费| 午夜久久黄色| www.色.com| 一区二区三区精密机械公司| 国产高清视频免费| 久久久成人精品视频| 在线免费成人| 正在播放亚洲| 精品一区二区三区欧美| 日韩在线一卡二卡| 欧美久久久久久久久| 国产一区久久精品| 91黄色国产视频| 欧美日韩国产免费观看| 波多野结衣电影免费观看| 亚洲自拍偷拍图区| 亚洲精品无码专区| 欧美激情精品久久久久久久变态 | 日本不卡1234视频| 国产午夜精品在线| 亚洲人成毛片在线播放女女| 国产黑丝一区二区| 欧美性猛交xxxx久久久| 国产区在线视频| 国产在线观看一区二区三区| 五月天久久网站| 国产chinesehd精品露脸| 亚洲一区二区五区| 亚欧在线观看视频| 欧洲午夜精品久久久| 成人3d精品动漫精品一二三| 国产成人在线综合| 亚洲一区二区三区中文字幕在线| 天天干天天摸天天操| 日韩av成人在线观看| 999久久久精品国产| 国产又黄又嫩又滑又白| 香港成人在线视频| 国产午夜精品一区理论片| 国产日韩欧美在线播放| 欧美日本一区| 右手影院亚洲欧美| 在线成人小视频| 狼人综合视频| 亚洲人成77777| 成人午夜免费视频| 波多野结衣啪啪| 大量国产精品视频| 天堂资源在线亚洲| 国产成年人视频网站| 亚洲国产精品久久人人爱| 国产h在线观看| 鬼打鬼之黄金道士1992林正英| 新67194成人永久网站| 天天色天天综合| 日韩av最新在线| 99亚洲男女激情在线观看| 免费国产黄色网址| 国产精品国产馆在线真实露脸| 国产自产一区二区| 国产精品视频永久免费播放| 一区二区视频欧美| 国产高清视频免费在线观看| 亚洲精品天天看|