精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Vision-Zero:零數據VLM自我進化!陳怡然團隊提出零監督訓練新范式

人工智能 新聞
研究團隊設計了一套適應VLM特性的自博弈框架Vision-Zero。

本文作者包括來自杜克大學的汪勤思、林閱千、李海教授、陳怡然教授,新加坡國立大學的劉博,馬里蘭大學的周天翼教授,和 Adobe 的研究員施靖、萬錕、趙文天。

  • 開源代碼&模型:https://github.com/wangqinsi1/Vision-Zero
  • 項目主頁:https://huggingface.co/papers/2509.25541
  • 論文鏈接:https://arxiv.org/abs/2509.25541

背景介紹

盡管目前VLM在多模態任務上表現突出,但訓練過度依賴人工標注的數據與精心設計的強化學習獎勵。這種依賴帶來數據稀缺問題:多模態標注成本高昂,限制了訓練數據的規模與多樣性。同時存在知識天花板:模型能力受人類監督邊界限制,難以突破人類已有知識和策略。曾經AlphaGo所使用的自博弈技術通過模型與自身副本競爭交互并自動獲取反饋,把計算轉變為數據的同時消除了對人工監督的依賴,這使得它能夠持續推動模型進步并突破人類能力上限。但是受制于VLM的多模態特性,目前鮮有對自博弈在VLM上應用的系統性研究。為此研究團隊設計了一套適應VLM特性的自博弈框架Vision-Zero,此框架有如下特點:

(1)策略自博弈框架:Vision-Zero在以社交推理類游戲為模板的環境中訓練VLM,使得agent在自博弈過程中自動生成高復雜度推理數據,而無需人工標注。

(2)任意形式的圖片都可作為輸入:和以往有限制條件的游戲化訓練框架不同的是,Vision-Zero可在任意形式的圖片上啟動游戲,這使得模型可以在很多不同的領域里獲得相應的能力提升,并有很好的泛化性能。

(3)持續的性能提升:研究團隊提出了自博弈和可驗證獎勵的強化學習(RLVR)交替優化的自博弈策略優化算法(Iterative-SPO),這一算法解決了傳統自博弈算法中常見的性能瓶頸問題。

盡管沒有用任何標注數據做訓練,Vision-Zero在多個領域如推理,圖表問答和Vision-Centric理解任務上超越了其他有標注的SOTA后訓練方法。

從棋盤到現實:

AlphaGo 自博弈思想的泛化

自博弈作為 OpenAI 早期的重要技術路線之一,也是人工智能發展歷程中多項里程碑事件的關鍵推動力。典型代表包括 2016 年 AlphaGo 戰勝李世石,以及 2019 年 OpenAI Five 在 Dota 2 上擊敗世界冠軍 OG 戰隊。人們在看到自博弈在某些特定領域大幅超越人類智能的同時,往往也會思考我們是否有可能把這種思想應用到更多的開放場景中。然而讓AlphaGo從棋盤走入現實需要解決以下幾個難題:

(1)Agent為贏得博弈所習得的技能,應當與目標任務所需的技能高度一致。

(2)博弈環境應當足夠多樣且復雜,以便廣泛的目標任務都能夠滿足條件 (1)。

(3)技能增長應當具有可擴展性:隨著自博弈的進行,環境應當不斷提高難度,使得越來越強的智能體能夠涌現,而不是讓訓練收斂到一個固定的上限。

受到社交推理游戲,如“誰是臥底”的啟發,研究團隊設計了一套完備的自博弈規則以解決上述難題,具體規則如下:

(1)游戲中有 n 名平民和 1 名臥底。玩家首先被告知自己的角色。

(2)每名玩家會得到一張圖片,臥底的圖片與平民略有不同(如缺失、添加或修改了某個物體)。

(3)線索階段:每位玩家觀察自己的圖片,并給出一個口頭線索,描述圖片內容(可以是物體描述、推斷信息等)。

(4)決策階段:多輪線索給出后,進入決策階段。玩家根據線索結合自己的圖片,投票找出臥底。

此游戲具有高度策略性與挑戰性,臥底需要根據他人線索推斷并偽裝自己,避免暴露。平民需要提供足夠準確但不泄密的線索,同時分析他人線索尋找可疑點。如此一來,Agent在游戲過程中便可生成足夠長且復雜的推理鏈條,并且隨著對手能力的提升,其所面臨的挑戰也會越來越大,并被激發出更強的視覺理解與推理能力。

領域無關的數據輸入

此游戲僅需要兩張有細微差異的圖片對作為輸入即可啟動,得益于目前強大的圖片編輯工具如ChatGPT或nano banana,數據的構建極其簡單并且成本低廉,因此此框架的應用場景非常廣泛。研究團隊使用了三種完全不同的場景圖片輸入作為訓練數據:

(1)CLEVR 合成場景:使用 CLEVR 渲染器自動生成了 2000 對圖像。原圖有 4–6 個隨機排列的物體,修改圖中有兩個物體在顏色和形狀上被改變。

(2)圖表數據:從 ChartQA 訓練集隨機選取了 1000 張圖表作為原始圖像,并使用 Gemini2.5-Flash 隨機交換圖表中的數值屬性生成對應的修改圖像。

(3)真實世界圖片:從 ImgEdit 訓練集中隨機抽取了 1000 對圖像,該數據集包含高質量的真實世界單輪圖像編輯對。

從局部均衡到可持續提升

純自博弈訓練容易陷入局部平衡,難以探索新的推理路徑,而單獨的強化學習方法在掌握現有問題集后也易出現知識飽和。為緩解這些問題,作者團隊提出采用雙階段交替訓練:當決策階段表現顯示線索階段已飽和時轉向線索訓練提高難度,反之則切回決策階段。此方法被命名為Iterative Self-Play Policy Optimization。實驗表明,兩階段交替訓練性能明顯優于單階段訓練,對比如下。

實驗結果

強任務泛化能力。為了評估 Vision-Zero 框架下訓練的VLM是否能泛化到更廣泛的推理與數學任務,作者團隊在六個基準數據集上對模型進行測試(結果見表 1)。實驗表明,即使沒有使用標注數據做訓練,Vision-Zero 在各項基準上一致性得優于其他需要標注的SOTA方法。其中,VisionZero-Qwen-7B(CLEVR、Real-World)較基線提升約 3%,VisionZero-Qwen-7B(Chart)提升約 2.8%,而目前最優的基線方法僅約 1.9%。值得注意的是,基線方法需要大量數學與推理樣本訓練,而Vision-Zero 環境并未顯式包含數學任務,只通過自然語言策略博弈提升邏輯推理,并將所學能力有效遷移到更廣泛的數學與推理任務,甚至超過專門在大規模任務數據上訓練的模型。

跨能力負遷移的緩解。VLM 后訓練的關鍵難題之一是跨能力負遷移,即在特定任務上訓練后,模型在其他任務上反而變差。表 2 顯示,基線模型在推理和數學數據上后訓練后,性能明顯下降,例如MM-Eureka-Qwen-7B 在ChartQA 上下降約10%。相比之下,Vision-Zero訓練的模型能有效緩解負遷移:VisionZero-Qwen-7B(CLEVR)在視覺任務上顯著提升,同時在四個圖表/OCR 任務上平均僅下降 0.2%;VisionZero-Qwen-7B(Chart)在全部圖表/OCR 基準上都有提升,并在視覺任務上平均再漲 1%。這表明 Vision-Zero 的多能力策略訓練顯著減輕了傳統單一任務訓練中的負遷移問題。

啟示

Vision-Zero 證明了自博弈從單一任務走向通用任務的可行性與巨大潛力。通過構建開放、可擴展的博弈環境,它擺脫人工標注依賴,突破數據和知識瓶頸,使模型在無需特定任務訓練的前提下實現可持續的能力進化與跨領域泛化。同時,雙階段交替優化有效避免自博弈常見的局部均衡問題。并且,通過自博弈訓練的VLM有效緩解了傳統的在單一任務上做訓練的跨能力負遷移問題。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-28 09:10:00

2025-03-28 11:59:10

2022-11-28 14:00:24

人工智能

2025-08-14 09:00:00

模型訓練數據

2025-02-10 08:40:00

訓練數據模型

2025-05-12 14:29:16

絕對零外部數據訓練法

2025-09-01 09:09:00

2022-04-12 14:36:58

達摩院訓練模型

2025-09-05 10:11:01

2025-04-10 09:15:03

2024-11-28 10:40:26

零拷貝技術系統

2025-05-21 13:52:39

LLM模型

2025-09-10 09:15:00

AI模型數據

2023-09-19 15:46:05

人工智能數據中心

2023-09-07 15:49:06

人工智能數據中心

2020-10-12 06:33:18

Zero-Copy零拷貝CPU

2023-06-16 14:11:00

研究監督

2011-11-23 13:29:05

2023-09-07 14:47:48

人工智能數據中心
點贊
收藏

51CTO技術棧公眾號

youjizz.com亚洲| 国产精品久久久久久久久| 在线观看免费视频国产| 黄视频网站在线观看| 久久精品男人的天堂| 国产拍精品一二三| 国产在线欧美在线| 国产aⅴ精品一区二区三区久久| 欧美日韩一区二区三区在线| 久久www视频| 久蕉在线视频| 国产a精品视频| 国产精品扒开腿做| 日本少妇做爰全过程毛片| 国产精品欧美三级在线观看| 欧美一级片在线看| 欧美a在线视频| www久久日com| 国产欧美日韩麻豆91| 99久久无色码| 中文字幕在线视频免费| 99国产精品自拍| 久久精彩免费视频| 老司机福利av| 久久99精品国产自在现线| 欧美视频在线一区二区三区| 欧美日韩亚洲一| www视频在线看| 国产精品亲子伦对白| 久久精品aaaaaa毛片| 国产三级第一页| 日本最新不卡在线| 高清欧美性猛交xxxx| 色欲一区二区三区精品a片| 日韩理论电影中文字幕| 欧美变态凌虐bdsm| 992kp免费看片| 99久久婷婷国产综合精品首页| 亚洲一二三区不卡| 2021狠狠干| 亚洲乱亚洲乱妇| 国产偷v国产偷v亚洲高清| 国产在线一区二区三区四区| 成人av一区二区三区在线观看| 麻豆成人av在线| 国产精品久久久久999| 日韩欧美成人一区二区三区| 亚洲黄色精品| 国模私拍一区二区三区| 久久久久久天堂| 综合视频在线| 裸体女人亚洲精品一区| 在线日韩国产网站| 婷婷亚洲最大| 久久精品国产精品亚洲| 国产精品免费在线视频| 99成人在线视频| 日韩资源在线观看| 久久久久久久久久97| 成人午夜国产| 日韩中文av在线| 农村老熟妇乱子伦视频| 99热在线成人| 久久亚洲国产精品| 欧美成人黄色网| 极品av少妇一区二区| 久久人人97超碰精品888| 99热国产在线观看| 午夜亚洲激情| 国产精品日韩欧美大师| 伊人网站在线观看| 国产麻豆精品在线| 99九九电视剧免费观看| 蜜桃视频在线观看www| 99re6这里只有精品视频在线观看| 国产一区免费观看| 精品三级久久久久久久电影聊斋| 国产女人水真多18毛片18精品视频| 日韩欧美第二区在线观看| 91高清在线| 国产精品美女久久久久久久久 | 亚洲欧美国产一区二区| 国产综合视频一区二区三区免费| 久久久久久久久一| 一区二区日本伦理| 1stkiss在线漫画| 精品久久久中文| 成人免费无码av| 国产精品一区二区三区四区在线观看 | 久久av秘一区二区三区| 尤物在线网址| 欧美性猛交xxxx久久久| 超碰超碰在线观看| 97品白浆高清久久久久久 | 午夜小视频在线| 亚洲日本在线天堂| 浮妇高潮喷白浆视频| 91在线亚洲| 精品处破学生在线二十三| 久久久久久久久久久久久久久| 欧美3p视频| 国内精品久久久| 伊人影院中文字幕| 成人小视频免费观看| 午夜一区二区三区| wwwwxxxx在线观看| 欧美日韩亚洲综合| 国产精品第七页| 亚洲大全视频| 日本中文字幕成人| 亚洲国产综合一区| 国产精品视频yy9299一区| av在线播放天堂| 四虎地址8848精品| 日韩h在线观看| 欧美日韩激情在线观看| 三级亚洲高清视频| 官网99热精品| 成人午夜在线影视| 在线精品亚洲一区二区不卡| 亚洲av无码专区在线播放中文| 欧美日韩在线网站| 亚洲18私人小影院| 精品人妻午夜一区二区三区四区| 国产亚洲欧美日韩俺去了| 成人性生活视频免费看| 白嫩亚洲一区二区三区| 亚洲午夜精品久久久久久性色 | 亚洲一区日韩| 操一操视频一区| 免费成人黄色| 欧美中文字幕亚洲一区二区va在线 | 国产超碰精品| 日韩成人在线视频观看| 久久久久久久久久久网| 国产精品一区一区三区| 亚洲永久激情精品| 成人在线免费av| 亚洲人成在线观看| 日韩精品1区2区| 成人免费黄色大片| 日b视频免费观看| 精品国模一区二区三区欧美| 久久精品91久久香蕉加勒比 | 欧美变态tickle挠乳网站| 五月综合色婷婷| 激情六月婷婷久久| 一区二区三区四区不卡| 成人国产一区| 中文国产成人精品| 亚洲视屏在线观看| 欧美国产97人人爽人人喊| www.色就是色| 日韩1区2区| 国产在线久久久| 欧美13一16娇小xxxx| 7777精品伊人久久久大香线蕉 | 香蕉成人伊视频在线观看| 无码国产精品一区二区免费式直播 | 国产福利91精品| www国产免费| ady日本映画久久精品一区二区| 欧美理论片在线观看| 亚洲av无码片一区二区三区 | 日本wwwcom| 久久婷婷国产| 日韩免费观看网站| 国产区av在线| 91精品国产手机| 久久久久久久久久久网| 91最新地址在线播放| 日本精品一区在线观看| 青青草原综合久久大伊人精品| 国产精品久久久久久久久久久新郎| av片在线看| 91精品国产全国免费观看| 免费又黄又爽又色的视频| 99精品国产91久久久久久| 欧美韩国日本在线| 日韩国产一区二区三区| 2014亚洲精品| 在线播放高清视频www| 中文字幕欧美日韩精品| 国产手机精品视频| 欧美视频在线观看免费| 后入内射无码人妻一区| 国产成人免费视频一区| 777米奇影视第四色| 羞羞答答成人影院www| 国产精品污www一区二区三区| 欧美日韩免费看片| 久久精品视频导航| 神马久久高清| 欧美二区三区的天堂| 国产精品7777| 国产精品美女久久久久久久久| 女王人厕视频2ⅴk| 快she精品国产999| 国产 欧美 日本| 精品国产91| 成人av播放| 国产极品久久久久久久久波多结野| 欧美成人久久久| 黄色片在线看| 欧美成人午夜电影| 中文区中文字幕免费看| 亚洲午夜电影网| 欧美a级片免费看| 久久久不卡影院| 欧美大喷水吹潮合集在线观看| 精品亚洲国内自在自线福利| 日韩久久一级片| 91久久亚洲| 毛片在线视频观看| 国产大片一区| 亚洲二区三区四区| 精品在线播放| 久久精品magnetxturnbtih| 亚洲成人影音| 亚洲www永久成人夜色| 成人国产激情| 国产精品扒开腿做爽爽爽视频| √天堂8资源中文在线| 久久综合久久美利坚合众国| av中文在线| 国产视频久久久久| 四虎免费在线观看| 精品国产一区二区亚洲人成毛片 | 福利一区二区三区四区| 亚洲三级在线看| 国产黄色录像片| 国产精品天美传媒| 日日碰狠狠添天天爽| 久久精品欧美日韩| 久久国产柳州莫菁门| 久久美女高清视频| 亚洲精品理论片| 91丝袜高跟美女视频| 无套内谢大学处破女www小说| 北岛玲一区二区三区四区| 天天操狠狠操夜夜操| 国产综合久久| 亚洲成人动漫在线| 精品毛片免费观看| 日本精品国语自产拍在线观看| 国产毛片久久久| 国产精品专区一| 久久久久黄色| 国产精品欧美亚洲777777| 新版的欧美在线视频| 日本成人黄色片| 免费看男女www网站入口在线| 欧美第一淫aaasss性| 丁香影院在线| 欧美精品福利在线| 国产第一页在线| 高清视频欧美一级| 91超碰在线| 97久久精品人搡人人玩| 岛国av在线网站| 91成人精品网站| 午夜激情在线播放| 欧美激情一区二区三区久久久| 日本色护士高潮视频在线观看| 精品少妇v888av| 污视频在线免费观看网站| 久久理论片午夜琪琪电影网| 国产乱码在线| 97精品在线观看| 91超碰碰碰碰久久久久久综合| 国产精品91在线观看| 第四色男人最爱上成人网| 国产欧美一区二区白浆黑人| 日本久久二区| 亚洲专区在线视频| 欧美福利在线播放网址导航| 久久久久一区二区| 国产欧美日韩精品一区二区免费| 欧美一区2区三区4区公司二百 | 日韩啊v在线| 亚洲精品国产首次亮相| 国产视频在线观看网站| 亚洲国产一区二区在线观看| 男人和女人啪啪网站| 亚洲女同同性videoxma| 美女网站视频黄色| 盗摄精品av一区二区三区| 51调教丨国产调教视频| 欧美激情一区二区三区蜜桃视频| 国产免费无码一区二区视频| 亚洲成人免费在线观看| 高潮毛片又色又爽免费 | crdy在线观看欧美| 成人动漫在线视频| 国产欧美一区| 九一免费在线观看| 午夜亚洲性色福利视频| 国产日韩欧美久久| 国产91对白在线观看九色| 黄瓜视频污在线观看| 国产精品乱码一区二三区小蝌蚪| 中文字幕人妻一区二| 亚洲综合色成人| 天堂网av手机版| 欧美剧情电影在线观看完整版免费励志电影 | 香蕉视频黄在线观看| 亚洲色图五月天| 成人女同在线观看| 国产精品热视频| 玖玖玖电影综合影院| 亚洲电影网站| 日韩视频在线一区二区三区 | 福利电影一区二区三区| 国产jk精品白丝av在线观看| 亚洲免费毛片网站| 伊人中文字幕在线观看 | 色偷偷中文字幕| 国产日韩欧美不卡| 国产一级做a爱免费视频| 欧美丝袜丝nylons| 国产黄色片在线播放| 欧美激情视频一区| 国产精品久久久久久妇女| 精品国产乱码久久久久久郑州公司| 色777狠狠狠综合伊人| 国产97在线 | 亚洲| 成人av电影在线播放| 久久噜噜色综合一区二区| 一本色道久久加勒比精品| 日本免费一区视频| 草民午夜欧美限制a级福利片| 在线一区av| 久久99国产精品99久久| 欧美在线播放| 成人黄色一区二区| 久久久不卡网国产精品一区| 亚洲精品www久久久久久| 欧美成人艳星乳罩| a毛片在线观看| 成人黄色av播放免费| 久久中文字幕av| 男人天堂成人在线| 91麻豆国产福利在线观看| 五月婷婷开心网| 亚洲成人黄色网址| 黄色免费在线看| 动漫精品视频| 欧美成人嫩草网站| 韩国av中国字幕| 夜夜嗨av一区二区三区中文字幕| 在线观看国产成人| 久久精品国产亚洲7777| 激情中国色综合| 四虎影视永久免费在线观看一区二区三区| 老司机午夜精品视频在线观看| 精品中文字幕在线播放| 亚洲成a人v欧美综合天堂| 少妇av在线播放| 69av视频在线播放| 国产欧美日韩精品一区二区三区| 韩国一区二区av| 国产色婷婷亚洲99精品小说| 中文字幕乱码视频| 日韩在线激情视频| 欧美日韩激情电影| 免费看啪啪网站| 国产成人免费av在线| 日本五十路女优| 精品视频在线导航| 美女18一级毛片一品久道久久综合| 日本中文不卡| 蜜臀av一级做a爰片久久| 天天色天天综合| 日韩一区和二区| 美足av综合网| 欧美一进一出视频| 久久精品国产精品亚洲红杏| www亚洲色图| 欧美va亚洲va在线观看蝴蝶网| 精精国产xxxx视频在线中文版| 久久综合九九| 久热精品在线| 精品国产国产综合精品| 亚洲国内精品在线| 欧美性suv| 成人一级生活片| 久久亚洲影视婷婷| 一级久久久久久| 欧美激情亚洲视频| 亚洲美女久久| 亚洲AV无码久久精品国产一区| 亚洲综合一区二区精品导航| 欧性猛交ⅹxxx乱大交| 国产精品精品一区二区三区午夜版 | 鲁鲁视频www一区二区| 毛片一区二区三区| 国产精品黄色网| 日韩在线观看精品| 国产精品流白浆在线观看| 日本xxxx黄色|