精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

7B超越GPT!1/20數(shù)據(jù),無需知識蒸餾,馬里蘭等推出全新視覺推理方法

人工智能 新聞
通過蒙特卡洛樹 搜索篩選高難度樣本,ThinkLite-VL僅用少量數(shù)據(jù)就能顯著提升視覺語言模型的推理能力,無需知識蒸餾,為高效訓(xùn)練提供了新思路。

在大模型時代,視覺語言模型(Vision-Language Models, VLMs)正在從感知走向推理。在諸如圖像問答、圖表理解、科學(xué)推理等任務(wù)中,VLM不再只需要「看見」和「描述」,而是要能「看懂」和「想清楚」。

然而,當(dāng)前主流的推理能力提升方法普遍存在兩個問題:

1. 訓(xùn)練樣本質(zhì)量參差不齊:常見的數(shù)據(jù)集雖然體量龐大,但真正「有挑戰(zhàn)性」的樣本比例較低。

2. 過度依賴知識蒸餾:許多模型在訓(xùn)練時依賴大型模型(如GPT-4o)的推理過程作為教師信號,使得訓(xùn)練流程復(fù)雜且難以推廣。

這使得訓(xùn)練一個高性能的VLM成本極高,也限制了模型的自主學(xué)習(xí)能力。

能否通過自我提升,訓(xùn)練出高性能的推理模型?

近日,來自馬里蘭大學(xué),密歇根大學(xué),和微軟的團隊聯(lián)合提出了ThinkLite-VL模型試圖打破這種依賴,探索「數(shù)據(jù)更少、能力更強」的可能性。

圖片

論文鏈接:https://arxiv.org/pdf/2504.07934

GitHub項目:https://github.com/si0wang/ThinkLite-VL

Hugging Face:https://huggingface.co/russwang/ThinkLite-VL-7B

論文主要關(guān)注一個核心問題:如果不給VLM額外的「教師指導(dǎo)」(如知識蒸餾),能否僅通過自身的反饋機制和強化學(xué)習(xí)訓(xùn)練,獲得強大的推理能力?

直覺上,答案是肯定的:人類也可以通過不斷嘗試、失敗和總結(jié)來提升自己的推理能力。但對模型而言,這需要我們解決一個關(guān)鍵挑戰(zhàn)——如何準(zhǔn)確判斷哪些訓(xùn)練樣本是「值得學(xué)」的?

圖片

用MCTS判斷「樣本難度」,篩選高質(zhì)量訓(xùn)練集

ThinkLite-VL的最大創(chuàng)新在于:用蒙特卡洛樹搜索(Monte Carlo Tree Search, MCTS)來重新定義「樣本難度」。

研究人員首先從廣泛使用的開源多模態(tài)訓(xùn)練數(shù)據(jù)集中收集了70k的樣本,涵蓋了三個關(guān)鍵的視覺任務(wù):數(shù)學(xué)推理,自然圖像理解和圖表理解,具體的數(shù)據(jù)分布和來源如下表所示。

圖片

值得注意的是,為了避免大模型在回答過程中因為選擇題選項中提供了正確答案而「蒙對」,研究人員將大部分的樣本從選擇題格式改成了開放問答格式,這樣一來模型就必須依靠自身的推理能力真正理解題目并解決問題,真正的把題做對。

之后,研究人員提出了一種基于蒙特卡洛樹搜索(MCTS)的樣本選擇方式。

具體來說,大模型將問題和圖像作為輸入,讓模型通過蒙特卡洛樹搜索進行一步步推理,然后記錄模型需要通過多少次推理迭代才能得到正確答案。模型所需要的MCTS迭代次數(shù)越多,說明模型需要通過更多的探索和思考才能解決問題,表明該問題對于模型來說更難。

整個過程中,只使用了VLM本身的LLM部分判斷MCTS final answer的正確與否,模型通過解題成功的探索次數(shù)認(rèn)識到哪些題是「難題」,并將其作為學(xué)習(xí)重點。

在對所有的樣本都進行MCTS之后,作者最終篩選出迭代次數(shù)大于5或在50次迭代內(nèi)模型都無法解決的樣本,總共11k,作為最終的訓(xùn)練集。

圖片

強化學(xué)習(xí)訓(xùn)練:少樣本+困難樣本,推理效果更強

研究人員基于Qwen2.5-VL-7B-Instruct,在選出的11k樣本上使用GRPO進行了強化學(xué)習(xí)訓(xùn)練,得到了最終的模型 ThinkLite-VL-7B。相比于其他reasoning model來說,ThinkLite-VL-7B大大減少了訓(xùn)練數(shù)據(jù)量,并且沒有蒸餾任何外部推理模型的知識。

圖片

在八個主流視覺推理任務(wù)上進行測試,包括MathVista, MathVerse, MathVision,MMMU,MMStar, MMVet, MMBench和AI2D, 結(jié)果發(fā)現(xiàn)ThinkLite-VL-7B的平均性能相比base model Qwen2.5-VL-7B-Instruct提升了7%,從59.69 提高到 63.89,并且顯著優(yōu)于使用隨機采樣選擇相同大小數(shù)據(jù)量進行強化學(xué)習(xí)訓(xùn)練的模型。

此外,相比7B級別的其他reasoning VLM,ThinkLite-VL-7B同樣具有明顯優(yōu)勢,包括OpenVLThinker-7B,MM-Eureka-Qwen-7B等。

特別地,在MathVista上ThinkLite-VL-7B達(dá)到了75.1的SoTA準(zhǔn)確率,超過了GPT-4o和o1等閉源模型和Qwen2.5-VL-72B等開源更大參數(shù)量的模型。

圖片

圖片

這意味著,即使在沒有額外監(jiān)督、沒有知識蒸餾、沒有大規(guī)模數(shù)據(jù)的前提下,只需要正確選擇少量對于VLM具有挑戰(zhàn)性的高質(zhì)量樣本,VLM也能通過self-improve顯著提升推理能力。

研究人員進一步對不同難度組合的訓(xùn)練集進行了消融分析,發(fā)現(xiàn):

  1. 僅用最難的樣本(無法解出)可以提升能力,但效果不及中等+困難樣本的組合;

  2. 簡單樣本雖然在訓(xùn)練過程中快速提升reward,但對最終推理能力提升作用有限;

  3. 使用中等難度加上困難樣本的組合才能最大程度提升模型的推理能力,即使模型在訓(xùn)練中無法解決全部的樣本。

這一發(fā)現(xiàn)對未來的模型訓(xùn)練有重要啟示:合理的樣本難度分布比樣本數(shù)量更關(guān)鍵。

論文一作王璽堯是馬里蘭大學(xué)計算機系三年級phd,導(dǎo)師為Furong Huang教授,主要研究方向為強化學(xué)習(xí)在大語言模型和視覺語言模型訓(xùn)練中的應(yīng)用,在ICML, NeurIPS, ICLR, ACL, EMNLP, NAACL, CVPR等會議上發(fā)表過多篇論文。

圖片

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-03-04 13:36:00

模型訓(xùn)練

2023-10-31 12:23:17

GPT-4版本VLM

2025-11-04 08:42:27

2025-04-15 09:00:00

模型推理AI

2025-01-10 11:42:40

2025-01-10 12:58:37

2024-06-11 14:30:18

2024-06-17 13:34:38

2025-04-16 15:28:31

模型AI數(shù)據(jù)

2024-11-11 17:33:35

2025-03-06 09:55:49

2025-08-18 17:20:17

AI大模型數(shù)據(jù)

2025-03-03 09:00:00

2025-06-25 08:54:03

模型訓(xùn)練AI

2025-09-18 09:00:47

2023-10-13 19:58:33

Mistral7B模型

2024-12-20 12:30:00

模型AI數(shù)據(jù)

2025-05-16 09:10:00

2024-09-13 09:14:32

2023-10-17 19:43:03

RACE排序數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

一区二区三区在线| 九九九精品视频| 波多野结衣一区二区三区 | 成黄免费在线| 理论电影国产精品| 欧美另类99xxxxx| www.日本高清| 黄色成人小视频| 亚洲国产成人91porn| 欧美日韩综合网| 国产女18毛片多18精品| 国产精品日本欧美一区二区三区| 中文字幕欧美精品日韩中文字幕| 先锋资源在线视频| 不卡一二三区| 一区二区三区国产| 日韩免费三级| 高潮毛片7777777毛片| 石原莉奈在线亚洲二区| 欧美大片欧美激情性色a∨久久| 3d动漫精品啪啪一区二区下载| 亚洲图片小说区| 91国产免费观看| 免费看毛片的网址| 免费大片黄在线观看视频网站| 成年人网站91| 91中文字幕在线| 日韩不卡高清视频| 99精品热视频只有精品10| 精品国产一区二区三区四区在线观看| 亚洲国产果冻传媒av在线观看| 国产精品白丝久久av网站| 色综合天天做天天爱| 黄色一级片国产| 日本高清视频在线观看| 久久久久久夜精品精品免费| 国产精品视频一区二区三区经| 国产精品久久久久久无人区| 日韩精品成人一区二区在线| 91精品国产高清久久久久久91| 永久久久久久久| 久久国产精品成人免费观看的软件| 亚洲第一区中文99精品| 国产老头和老头xxxx×| 日韩成人在线一区| 欧洲一区二区三区免费视频| 97国产在线播放| 1024在线看片你懂得| 亚洲精品日产精品乱码不卡| 一区二区三区精品国产| av大片在线播放| 久久精品人人做| 久久久久久久久一区二区| 欧美 日韩 国产 在线| 国产成人综合在线| 99视频在线播放| 国产女人18毛片18精品| 国产一二精品视频| 91视频-88av| 99精品在线视频观看| 国产呦萝稀缺另类资源| 成人亚洲欧美一区二区三区| 91丨porny丨在线中文| 精品一区在线看| 成人有码在线视频| 精品久久国产视频| 国产91高潮流白浆在线麻豆| 岛国视频一区| 天天干天天舔天天射| 99热精品一区二区| 鲁鲁狠狠狠7777一区二区| 蜜桃免费在线| 欧美激情一区二区三区蜜桃视频| 日韩女优中文字幕| 毛片激情在线观看| 亚洲一区二区在线免费观看视频| 日本大片免费看| 国产一二三在线| 色综合天天综合给合国产| youjizzxxxx18| 欧美黄色a视频| 日韩一区二区不卡| 中文字幕乱码一区| 欧美色婷婷久久99精品红桃| 色婷婷久久一区二区| 1024手机在线视频| 亚洲一区二区三区四区五区午夜 | 极品美妇后花庭翘臀娇吟小说| 亚洲国产一区二区在线观看| 久久久伊人日本| 亚洲成人第一网站| 狠狠狠色丁香婷婷综合久久五月| 成人欧美一区二区三区视频xxx| 天天摸夜夜添狠狠添婷婷| 久久久久国产精品人| 一区二区三区三区在线| 丁香花电影在线观看完整版| 日韩欧美在线一区| 亚洲一区二区福利视频| 牛牛影视久久网| 一区二区三区黄色| 久久久久久久久久久久国产| 性久久久久久| 91免费在线观看网站| 欧美欧美欧美| 亚洲精品视频一区二区| 日本新janpanese乱熟| 久久国产精品美女| 国产一区二区三区四区福利| 久久久久亚洲av无码专区| 日韩成人av影视| 国产精品一区二区三区观看| 最新电影电视剧在线观看免费观看| 一区二区三区欧美| 亚洲中文字幕久久精品无码喷水| 亚洲精品一二三**| 日韩在线观看免费| 韩国av中文字幕| 国产乱码精品1区2区3区| 欧美一级日本a级v片| 18网站在线观看| 在线免费观看日本欧美| 国产伦精品一区二区免费| 99精品美女| 日本一本a高清免费不卡| www天堂在线| 欧美国产丝袜视频| 日韩精品视频一区二区在线观看| 91成人福利| 日韩亚洲精品电影| av网站中文字幕| 不卡的看片网站| 国产免费一区二区视频| 精品国产三区在线| 久久精彩免费视频| 日韩不卡高清视频| 2021国产精品久久精品| 美脚丝袜脚交一区二区| 亚洲国产一区二区三区网站| 久久亚洲精品视频| 国产又大又长又粗| 国产精品福利一区| 五月婷婷激情久久| 日韩久久久久| 国产精品视频yy9099| 九色视频成人自拍| 91成人免费网站| 日韩一区二区a片免费观看| 99在线|亚洲一区二区| 99国产超薄丝袜足j在线观看| 欧美激情二区| 欧美女孩性生活视频| 操她视频在线观看| 蜜臀久久99精品久久久久久9| 欧洲亚洲一区二区| 素人啪啪色综合| 国产亚洲精品美女久久久久| 天堂网视频在线| 久久久久久久久伊人| 亚洲色欲综合一区二区三区| 亚洲免费专区| 日产精品99久久久久久| 韩国福利在线| 欧美日韩一卡二卡三卡 | 精品国产一级片| 亚洲一区在线电影| 中文字幕 亚洲一区| 国产精品美女| 欧美亚洲丝袜| 国产成人福利夜色影视| 久久久精品一区二区| www.精品视频| 富二代精品短视频| 精品人妻无码一区二区三区换脸| 免费观看日韩av| 中文有码久久| 999在线精品| 欧洲成人免费aa| www.91在线| 91精品国产色综合久久不卡电影 | 国产精品久久久久久中文字| 日本不卡不卡| 亚洲国产精品中文| 国产免费av一区二区| 国产片一区二区三区| 九九九九九伊人| 在线成人h网| 日韩啊v在线| 国产日韩中文在线中文字幕| 久久久久久美女| 国产免费永久在线观看| 欧美一区二区三区电影| 可以在线观看av的网站| 欧美国产综合一区二区| 欧美熟妇精品一区二区| 每日更新成人在线视频| 国产三级中文字幕| 青青草这里只有精品| 91精品国产综合久久香蕉最新版| 成人福利影视| 怡红院精品视频| 国模无码一区二区三区| 日韩欧亚中文在线| 中文字幕av免费在线观看| 久久综合成人精品亚洲另类欧美| 午夜剧场在线免费观看| 亚洲精选91| 一区二区三区视频在线播放| 日韩大胆成人| 91在线免费视频| 韩日成人影院| 欧美黑人一区二区三区| 岛国在线视频免费看| 亚洲第一福利视频| 97国产精品久久久| 色一区在线观看| 国产极品在线播放| 亚洲欧美日韩在线不卡| 国产美女免费无遮挡| 国产成人免费在线观看| 中文字幕第100页| 亚洲在线电影| 成人黄色大片网站| 亚洲欧美综合久久久| 欧美一区视久久| 老牛影视av一区二区在线观看| 国产在线高清精品| 日韩成人高清| 91福利视频网| 欧美黑人猛交的在线视频| www.色综合| 国产高清一区在线观看| 日韩精品视频免费在线观看| 亚洲av无码国产综合专区| 9191久久久久久久久久久| 欧美国产一级片| 日韩人体视频一二区| 久久夜色精品亚洲| 亚洲福利一区二区| 免费一级肉体全黄毛片| 亚洲欧美日韩一区| 欧洲美女女同性互添| 国产精品国产成人国产三级 | 向日葵污视频在线观看| 久久久久99| 97国产精东麻豆人妻电影 | 超碰97久久| 97超碰人人模人人爽人人看| 外国成人毛片| 国产欧美一区二区| 日韩精品第二页| 成人福利视频网| 亚洲欧美在线人成swag| 成人精品一区二区三区电影免费| 高清av一区| 国产精品视频免费在线| 久久精品资源| 成人在线精品视频| 欧美视频二区欧美影视| 亚洲综合中文字幕在线| 人人爱人人干婷婷丁香亚洲| 99在线视频首页| 国产一区调教| 欧美成人dvd在线视频| 欧美**字幕| 天堂精品视频| 婷婷激情综合| 久久男人资源站| 亚洲精选在线| 激情视频综合网| 激情综合色丁香一区二区| 制服下的诱惑暮生| youjizz国产精品| free性中国hd国语露脸| 国产色产综合色产在线视频| 国产欧美一区二区三区在线观看视频| 国产精品久久久久一区二区三区共 | 欧美成人一二区| 99re国产在线播放| 亚洲精品推荐| 国产精品无码乱伦| 韩国欧美一区| 日韩欧美xxxx| 国产一区二区三区久久久| 国产精品扒开腿做爽爽爽a片唱戏| 久久一区二区三区国产精品| 国产馆在线观看| 夜夜亚洲天天久久| 免费av网站在线| 制服丝袜成人动漫| 日本毛片在线观看| 中文字幕一精品亚洲无线一区| 在线中文字幕视频观看| 国产91精品久| **国产精品| 久久96国产精品久久99软件| 日韩久久精品网| 久久久亚洲精品无码| 蜜桃久久久久久久| 女同性恋一区二区三区| 日韩码欧中文字| 在线观看免费av片| 欧美一区二区三区日韩视频| 男男电影完整版在线观看| 久久综合国产精品台湾中文娱乐网| 麻豆免费版在线观看| 成人久久久久爱| 日韩精品免费一区二区三区竹菊| 伊人久久婷婷色综合98网| 亚洲一区二区毛片| 绯色av蜜臀vs少妇| 国产精品毛片高清在线完整版| 日本少妇性高潮| 91精品久久久久久蜜臀| 日韩专区一区二区| 欧美激情一区二区三区成人| 精品久久久网| 日本一区不卡| 国产模特精品视频久久久久| 2018国产精品| 亚洲青青青在线视频| 亚洲精品毛片一区二区三区| 亚洲精品videossex少妇| 国产原厂视频在线观看| 国产精品久久久久久久久男| 欧美性生活一级片| 91免费国产精品| 久久99国内精品| 免费看污片的网站| 狠狠做深爱婷婷久久综合一区 | 国产福利91精品一区| 久久一级免费视频| 日本二三区不卡| 九九在线视频| 国产成人福利视频| 西瓜成人精品人成网站| 国产精品裸体瑜伽视频| 成人高清视频在线| 青青草原免费观看| 日韩午夜在线播放| 97caopor国产在线视频| 成人亚洲激情网| 2023国产精品久久久精品双| the porn av| 欧美国产一区视频在线观看| 自拍偷拍第八页| 色av中文字幕一区| 免费视频成人| 一区精品视频| 黑人精品欧美一区二区蜜桃| fc2ppv在线播放| 91麻豆精品国产91久久久久久| 免费黄色在线观看| 91在线免费视频| 欧美日本不卡| 久久久久亚洲AV成人网人人小说| 樱花草国产18久久久久| 亚洲成人一二三区| 国模精品一区二区三区色天香| 99ri日韩精品视频| www.av中文字幕| 91免费观看视频在线| 国产精品人人人人| 国产亚洲在线播放| 欧美国产视频| 黄色片免费在线观看视频| 成人午夜av电影| 日日夜夜综合网| 国产亚洲精品久久久优势| 亚洲精品成a人ⅴ香蕉片| 91九色国产ts另类人妖| 成人爽a毛片一区二区免费| 中文字幕亚洲精品在线| 亚洲天堂网站在线观看视频| 成人黄色毛片| 黄色录像特级片| www.在线成人| 日本视频www色| 欧美大片va欧美在线播放| 精品欧美午夜寂寞影院| 国产自偷自偷免费一区| 国产精品国产自产拍高清av | 色涩成人影视在线播放| 久久91精品久久久久久秒播| 69av.com| 亚洲男子天堂网| av日韩在线免费观看| 欧洲精品一区二区三区久久| 日本一区二区三区在线不卡| 999免费视频| 欧美在线视频一二三| 97视频热人人精品免费| 亚洲欧美高清在线| 欧洲精品中文字幕| 牛牛电影国产一区二区| 日韩欧美国产二区| 东方欧美亚洲色图在线| www.亚洲激情| 久久男人的天堂| 97精品国产|