精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式

發(fā)布于 2025-10-20 07:46
瀏覽
0收藏

背景介紹

盡管目前VLM在多模態(tài)任務上表現(xiàn)突出,但訓練過度依賴人工標注的數(shù)據(jù)與精心設計的強化學習獎勵。這種依賴帶來數(shù)據(jù)稀缺問題:多模態(tài)標注成本高昂,限制了訓練數(shù)據(jù)的規(guī)模與多樣性。同時存在知識天花板:模型能力受人類監(jiān)督邊界限制,難以突破人類已有知識和策略。曾經(jīng)AlphaGo所使用的自博弈技術通過模型與自身副本競爭交互并自動獲取反饋,把計算轉變?yōu)閿?shù)據(jù)的同時消除了對人工監(jiān)督的依賴,這使得它能夠持續(xù)推動模型進步并突破人類能力上限。但是受制于VLM的多模態(tài)特性,目前鮮有對自博弈在VLM上應用的系統(tǒng)性研究。為此研究團隊設計了一套適應VLM特性的自博弈框架Vision-Zero,此框架有如下特點:

(1)策略自博弈框架:Vision-Zero在以社交推理類游戲為模板的環(huán)境中訓練VLM,使得agent在自博弈過程中自動生成高復雜度推理數(shù)據(jù),而無需人工標注。

(2)任意形式的圖片都可作為輸入:和以往有限制條件的游戲化訓練框架不同的是,Vision-Zero可在任意形式的圖片上啟動游戲,這使得模型可以在很多不同的領域里獲得相應的能力提升,并有很好的泛化性能。

(3)持續(xù)的性能提升:研究團隊提出了自博弈和可驗證獎勵的強化學習(RLVR)交替優(yōu)化的自博弈策略優(yōu)化算法(Iterative-SPO),這一算法解決了傳統(tǒng)自博弈算法中常見的性能瓶頸問題。

盡管沒有用任何標注數(shù)據(jù)做訓練,Vision-Zero在多個領域如推理,圖表問答和Vision-Centric理解任務上超越了其他有標注的SOTA后訓練方法。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

從棋盤到現(xiàn)實:AlphaGo 自博弈思想的泛化

自博弈作為 OpenAI 早期的重要技術路線之一,也是人工智能發(fā)展歷程中多項里程碑事件的關鍵推動力。典型代表包括 2016 年 AlphaGo 戰(zhàn)勝李世石,以及 2019 年 OpenAI Five 在 Dota 2 上擊敗世界冠軍 OG 戰(zhàn)隊。人們在看到自博弈在某些特定領域大幅超越人類智能的同時,往往也會思考我們是否有可能把這種思想應用到更多的開放場景中。然而讓AlphaGo從棋盤走入現(xiàn)實需要解決以下幾個難題:

(1)Agent為贏得博弈所習得的技能,應當與目標任務所需的技能高度一致。

(2)博弈環(huán)境應當足夠多樣且復雜,以便廣泛的目標任務都能夠滿足條件 (1)。

(3)技能增長應當具有可擴展性:隨著自博弈的進行,環(huán)境應當不斷提高難度,使得越來越強的智能體能夠涌現(xiàn),而不是讓訓練收斂到一個固定的上限。

受到社交推理游戲,如“誰是臥底”的啟發(fā),研究團隊設計了一套完備的自博弈規(guī)則以解決上述難題,具體規(guī)則如下:

(1)游戲中有 n 名平民和 1 名臥底。玩家首先被告知自己的角色。

(2)每名玩家會得到一張圖片,臥底的圖片與平民略有不同(如缺失、添加或修改了某個物體)。

(3)線索階段:每位玩家觀察自己的圖片,并給出一個口頭線索,描述圖片內容(可以是物體描述、推斷信息等)。

(4)決策階段:多輪線索給出后,進入決策階段。玩家根據(jù)線索結合自己的圖片,投票找出臥底。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

此游戲具有高度策略性與挑戰(zhàn)性,臥底需要根據(jù)他人線索推斷并偽裝自己,避免暴露。平民需要提供足夠準確但不泄密的線索,同時分析他人線索尋找可疑點。如此一來,Agent在游戲過程中便可生成足夠長且復雜的推理鏈條,并且隨著對手能力的提升,其所面臨的挑戰(zhàn)也會越來越大,并被激發(fā)出更強的視覺理解與推理能力。

領域無關的數(shù)據(jù)輸入

此游戲僅需要兩張有細微差異的圖片對作為輸入即可啟動,得益于目前強大的圖片編輯工具如ChatGPT或nano banana,數(shù)據(jù)的構建極其簡單并且成本低廉,因此此框架的應用場景非常廣泛。研究團隊使用了三種完全不同的場景圖片輸入作為訓練數(shù)據(jù):

(1)CLEVR 合成場景:使用 CLEVR 渲染器自動生成了 2000 對圖像。原圖有 4–6 個隨機排列的物體,修改圖中有兩個物體在顏色和形狀上被改變。

(2)圖表數(shù)據(jù):從 ChartQA 訓練集隨機選取了 1000 張圖表作為原始圖像,并使用 Gemini2.5-Flash 隨機交換圖表中的數(shù)值屬性生成對應的修改圖像。

(3)真實世界圖片:從 ImgEdit 訓練集中隨機抽取了 1000 對圖像,該數(shù)據(jù)集包含高質量的真實世界單輪圖像編輯對。

從局部均衡到可持續(xù)提升

純自博弈訓練容易陷入局部平衡,難以探索新的推理路徑,而單獨的強化學習方法在掌握現(xiàn)有問題集后也易出現(xiàn)知識飽和。為緩解這些問題,作者團隊提出采用雙階段交替訓練:當決策階段表現(xiàn)顯示線索階段已飽和時轉向線索訓練提高難度,反之則切回決策階段。此方法被命名為Iterative Self-Play Policy Optimization。實驗表明,兩階段交替訓練性能明顯優(yōu)于單階段訓練,對比如下。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

實驗結果

強任務泛化能力。為了評估 Vision-Zero 框架下訓練的VLM是否能泛化到更廣泛的推理與數(shù)學任務,作者團隊在六個基準數(shù)據(jù)集上對模型進行測試(結果見表 1)。實驗表明,即使沒有使用標注數(shù)據(jù)做訓練,Vision-Zero 在各項基準上一致性得優(yōu)于其他需要標注的SOTA方法。其中,VisionZero-Qwen-7B(CLEVR、Real-World)較基線提升約 3%,VisionZero-Qwen-7B(Chart)提升約 2.8%,而目前最優(yōu)的基線方法僅約 1.9%。值得注意的是,基線方法需要大量數(shù)學與推理樣本訓練,而Vision-Zero 環(huán)境并未顯式包含數(shù)學任務,只通過自然語言策略博弈提升邏輯推理,并將所學能力有效遷移到更廣泛的數(shù)學與推理任務,甚至超過專門在大規(guī)模任務數(shù)據(jù)上訓練的模型。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

跨能力負遷移的緩解。VLM 后訓練的關鍵難題之一是跨能力負遷移,即在特定任務上訓練后,模型在其他任務上反而變差。表 2 顯示,基線模型在推理和數(shù)學數(shù)據(jù)上后訓練后,性能明顯下降,例如MM-Eureka-Qwen-7B 在ChartQA 上下降約10%。相比之下,Vision-Zero訓練的模型能有效緩解負遷移:VisionZero-Qwen-7B(CLEVR)在視覺任務上顯著提升,同時在四個圖表/OCR 任務上平均僅下降 0.2%;VisionZero-Qwen-7B(Chart)在全部圖表/OCR 基準上都有提升,并在視覺任務上平均再漲 1%。這表明 Vision-Zero 的多能力策略訓練顯著減輕了傳統(tǒng)單一任務訓練中的負遷移問題。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

啟示

Vision-Zero 證明了自博弈從單一任務走向通用任務的可行性與巨大潛力。通過構建開放、可擴展的博弈環(huán)境,它擺脫人工標注依賴,突破數(shù)據(jù)和知識瓶頸,使模型在無需特定任務訓練的前提下實現(xiàn)可持續(xù)的能力進化與跨領域泛化。同時,雙階段交替優(yōu)化有效避免自博弈常見的局部均衡問題。并且,通過自博弈訓練的VLM有效緩解了傳統(tǒng)的在單一任務上做訓練的跨能力負遷移問題。

https://github.com/wangqinsi1/Vision-Zero
https://huggingface.co/papers/2509.25541
https://arxiv.org/abs/2509.25541

本文轉載自??PaperAgent??

已于2025-10-20 07:46:51修改
收藏
回復
舉報
回復
相關推薦
亚洲精品中文字幕| 亚洲性生活大片| 美女av一区| 欧美性猛交xxxx偷拍洗澡 | 97视频一区| 福利微拍一区二区| 一区二区三区的久久的视频| www.欧美国产| 久久aⅴ国产紧身牛仔裤| 日韩在线视频二区| 深夜视频在线观看| 福利视频一区| 亚洲成人av在线电影| 一区二区三区欧美成人| 日韩一区二区三区不卡| 青草av.久久免费一区| 欧美黄色免费网站| 久久国产柳州莫菁门| 超碰在线亚洲| 欧美日韩的一区二区| 3d动漫一区二区三区| www.久久ai| 国产欧美一区二区精品仙草咪| www.成人三级视频| 在线观看色网站| 国产一区二区高清| 欧美大秀在线观看| 精品人妻中文无码av在线| 成人免费在线电影网| 欧美丰满一区二区免费视频 | 性欧美videos| 成人免费电影网址| 亚洲欧美在线播放| 精品国产一区在线| 亚洲国产高清在线观看| 欧美色综合网站| 亚洲中文字幕无码不卡电影| 黑人极品ⅴideos精品欧美棵| 亚洲日本在线视频观看| 少妇特黄a一区二区三区| 四虎成人免费在线| 国产中文字幕精品| 琪琪第一精品导航| 国产精品成人网站| 亚洲视频久久| 欧美俄罗斯乱妇| 久久久久久久久久久97| 亚洲天堂avav| 波多野结衣精品| 亚洲精品国产品国语在线app| 香蕉久久夜色| av小片在线| 欧美国产禁国产网站cc| 日韩国产精品一区二区| 欧洲一区av| 国产欧美日韩卡一| 日韩一区二区三区高清| 春暖花开成人亚洲区| 国产欧美日韩不卡| 一区二区三区四区五区视频| 在线观看精品一区二区三区| 国产精品你懂的| 日本欧洲国产一区二区| 成人av毛片| 国产精品久久一卡二卡| 樱空桃在线播放| 青青草原国产在线| 性做久久久久久免费观看| 草草视频在线免费观看| 自拍偷拍亚洲视频| 在线视频国内一区二区| 91欧美视频在线| 精品麻豆剧传媒av国产九九九| 777xxx欧美| wwwxx日本| 日本日本19xxxⅹhd乱影响| a毛片在线看免费观看| 亚洲一区在线视频| 国产美女网站在线观看| a日韩av网址| 欧美亚洲国产bt| 日韩av影视大全| 久久免费视频66| 亚洲欧美中文日韩在线| а天堂中文在线资源| 欧美一区免费| 26uuu国产精品视频| 伊人久久久久久久久久久久| 久草在线在线精品观看| 97久久人人超碰caoprom欧美| 天天操天天干天天舔| 中文字幕欧美日韩一区| 麻豆视频传媒入口| 欧美freesex黑人又粗又大| 日韩欧美精品网址| 波多野结衣国产精品| 少妇被躁爽到高潮无码文| 亚洲精品18| 亚洲老头老太hd| 日韩精品久久久久久久的张开腿让| 亚洲视频电影在线| 日本一区二区不卡| 国产成年妇视频| 国产亚洲一区二区三区| 毛片在线视频观看| 国产精品迅雷| 日韩天堂在线观看| 一区二区精品免费| 国产精品v日韩精品v欧美精品网站| 欧美在线免费观看| 精品人妻一区二区三区浪潮在线| 久久精品欧美一区二区三区不卡 | 久久久久久久久免费视频| 亚洲成人1区2区| 99热手机在线| 欧美三级午夜理伦三级小说| 久久综合九色九九| 日本一二三区视频| 国产综合成人久久大片91| 欧美一区1区三区3区公司| 日本中文字幕中出在线| 欧美日韩国产一级| 无码h肉动漫在线观看| 国模 一区 二区 三区| 国产噜噜噜噜噜久久久久久久久| 亚洲av毛片成人精品| 亚洲制服丝袜在线| www.com污| 最新中文字幕在线观看视频| 午夜影院欧美| 日韩美女在线播放| 日韩国产福利| 亚洲成av人片在线观看无码| 深夜做爰性大片蜜桃| 日韩国产欧美一区二区| 国产精品99久久久久久www| 天天干天天爽天天操| 亚洲一区二区在线视频| 亚洲黄色片免费看| 91综合视频| 国产精品一区二区久久久| 激情小视频在线| 色哟哟精品一区| 色婷婷av777| 一本色道88久久加勒比精品| 精品久久久久久一区二区里番| 免费毛片在线看片免费丝瓜视频| 91精品国产一区二区人妖| 中国一级片在线观看| 久久精品国产一区二区三区免费看| 日韩精品一区二区三区丰满| 亚洲一区站长工具| 亚洲美女黄色片| 日批视频免费在线观看| 美女100%一区| 欧美性猛交xxxx偷拍洗澡| 蜜桃精品成人影片| 亚洲一区二区成人| 欧美亚洲一级二级| jizz欧美| zzijzzij亚洲日本成熟少妇| 国产偷拍一区二区| 亚洲在线免费播放| 玖玖爱在线精品视频| 亚洲在线日韩| 少妇特黄a一区二区三区 | 色94色欧美sute亚洲13| 蜜桃av乱码一区二区三区| 免费成人美女在线观看.| 亚洲制服欧美久久| 精品国产伦一区二区三区观看说明 | 亚洲综合自拍网| 模特精品在线| 亚洲免费在线精品一区| 国产精品中文| 久久久久中文字幕| 日本午夜在线视频| 欧美日韩国产一级片| 日本天堂中文字幕| 91免费版在线| 亚洲精品久久久中文字幕| 午夜国产精品视频| 久久久久久久久久久久久久一区| 亚洲第一会所001| 久久综合九色九九| 香蕉av一区二区三区| 欧洲色大大久久| 黑人巨大精品一区二区在线| 97久久超碰国产精品| 国产aaaaa毛片| 欧美午夜不卡| 欧美一区二区三区精美影视| 欧美经典一区| 国产mv久久久| 四季久久免费一区二区三区四区| 精品夜色国产国偷在线| 91精品视频免费在线观看| 亚洲第一成年网| 久久久久久国产免费a片| 国产99久久久国产精品| 成人免费视频久久| 好吊日精品视频| 亚洲国产一区二区精品视频 | 免费久久久一本精品久久区| 黄色成人小视频| 国内精品一区二区三区| 日本视频不卡| 亚洲欧美激情一区| 亚洲风情第一页| 欧美日韩一区成人| 精品美女久久久久| 一区二区三区在线不卡| 91国模少妇一区二区三区| 成人精品免费视频| 99日在线视频| 免费在线播放第一区高清av| 免费网站永久免费观看| 欧美va久久久噜噜噜久久| 久久免费视频1| 国产伦精品一区二区三区免费优势 | 成人h动漫精品一区二| 久国产精品视频| 日韩经典中文字幕一区| 国产午夜福利100集发布| 欧美福利视频| 久久免费视频2| 国产伦精品一区二区三区视频 | 114国产精品久久免费观看| a级网站在线播放| 中文字幕日韩在线视频| 欧美日韩视频精品二区| 亚洲国产欧美一区二区三区同亚洲| 99热这里只有精品5| 欧美日韩和欧美的一区二区| 午夜视频网站在线观看| 色综合久久久久网| 麻豆成人免费视频| 狠狠躁夜夜躁久久躁别揉| 日本三级黄色大片| 一区二区三区鲁丝不卡| 欧美日韩激情在线观看| 亚洲精品视频在线观看网站| 成人免费视频国产免费观看| 中文字幕日韩一区| 三级黄色免费观看| 中文字幕一区免费在线观看| 很污很黄的网站| 国产精品久久久久四虎| www.com.av| 中文字幕在线不卡| 性欧美videos| 亚洲影院理伦片| 青青操免费在线视频| 天天爽夜夜爽夜夜爽精品视频| 国产乡下妇女做爰| 精品日本美女福利在线观看| 99热在线观看免费精品| 色婷婷精品久久二区二区蜜臂av| 无码人妻av一区二区三区波多野| 色哟哟国产精品| 狠狠躁夜夜躁人人爽视频| 欧美日韩一级二级| 国产精品一级视频| 精品久久久久久久久久久院品网 | 国产999精品在线观看| 91在线国产电影| 成人自拍在线| 久久99久久精品国产| 要久久电视剧全集免费| 日韩免费av电影| 97精品国产| 视色,视色影院,视色影库,视色网 日韩精品福利片午夜免费观看 | 国产真实乱对白精彩久久| 中日韩av在线播放| 国产精品影视在线观看| 色哟哟无码精品一区二区三区| eeuss国产一区二区三区| 国产精品边吃奶边做爽| 国产欧美一区二区三区在线看蜜臀| 成人18视频免费69| 亚洲午夜三级在线| 精人妻无码一区二区三区| 欧美日韩日日摸| 欧美一级视频免费| 国产一区二区日韩| av大大超碰在线| 555www成人网| avtt久久| 欧美国产二区| 综合日韩在线| 看欧美ab黄色大片视频免费| 国产一区二区导航在线播放| 在线免费观看a级片| 国产精品国产三级国产普通话三级 | 国产 日韩 欧美 综合| 国产午夜精品一区二区三区| 色屁屁www国产馆在线观看| 日本一区二区三区在线播放| 日韩一区二区三区精品| 日本精品国语自产拍在线观看| 91精品国产91久久久久久密臀| 久久国产精品网| 精品在线免费视频| 亚洲午夜福利在线观看| 亚洲精品国产精华液| 亚洲精品国产无码| 亚洲白虎美女被爆操| 久草资源在线观看| 国产99久久精品一区二区 夜夜躁日日躁| 亚洲精品午夜| 亚洲精品日韩精品| 六月天综合网| 亚洲图片欧美另类| 亚洲天堂av一区| 这里只有精品免费视频| 亚洲精品ady| 色av手机在线| 91深夜福利视频| 第一会所sis001亚洲| 成人羞羞国产免费网站| 成人久久视频在线观看| 真实国产乱子伦对白在线| 欧美猛男男办公室激情| 国产黄色在线| 日本免费久久高清视频| 天堂99x99es久久精品免费| www.avtt| 高清成人在线观看| 91日韩中文字幕| 7777精品伊人久久久大香线蕉的| 国产九色在线| 国产盗摄xxxx视频xxx69| 日韩人体视频| 欧美女人性生活视频| av日韩在线网站| 欧美一区二区激情视频| 亚洲国产精品成人精品| 国产精品视频免费播放| 一区二区国产精品| 亚洲一级片免费观看| 亚洲欧美日本韩国| 国产伦精品一区二区三区四区| 日韩在线视频网站| 少妇高潮一区二区三区99| 亚洲视频在线二区| 久久国产精品无码网站| 战狼4完整免费观看在线播放版| 欧美日韩中文字幕一区| 日韩av中文| 成人精品久久av网站| 中文在线日韩| 欧美性猛交乱大交| 一区二区免费在线播放| 丰满人妻一区二区三区四区53| 欧美日韩第一页| 成人福利一区| www.99热这里只有精品| 2020国产精品久久精品美国| 国产精品一区无码| 永久免费毛片在线播放不卡| jizz免费一区二区三区| 韩国黄色一级大片| 成人免费视频免费观看| 国产成人一区二区三区影院在线 | 成人午夜在线视频一区| 亚洲自拍偷拍网| 亚洲无人区码一码二码三码| 高跟丝袜一区二区三区| 国产1区2区3区在线| 91精品久久久久久久久久另类 | 欧美大成色www永久网站婷| 一区二区三区四区视频免费观看| 男女猛烈激情xx00免费视频| 久久中文娱乐网| 一级特黄aaaaaa大片| 久久天天躁狠狠躁老女人| jizz性欧美2| 波多野结衣作品集| 亚洲欧洲性图库| 日韩一级免费毛片| 国产精品久久网| 黑丝一区二区三区| 久久久久久久久久久国产精品| 欧美伦理视频网站| 免费在线看污片| 亚洲精品在线免费| 国产suv精品一区二区883| 中文字幕av影院| 欧美精品生活片| 国产毛片一区二区三区| 国产裸体视频网站| 欧美亚洲综合在线| 青青草原国产在线| 亚洲精品中文字幕在线| 成人免费视频一区| 91麻豆一区二区| 青青草精品毛片| 欧美午夜一区| 一级免费黄色录像| 亚洲女人天堂成人av在线|