精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

顯著超越SFT,o1/DeepSeek-R1背后秘訣也能用于多模態(tài)大模型了

人工智能
他們將DeepSeek-R1背后的基于規(guī)則獎勵的強化學習方法和OpenAI的強化微調(diào)(Reinforcement Fine-Tuning,RFT)范式,成功從純文本大語言模型拓展到了視覺語言大模型(LVLM)。

o1/DeepSeek-R1背后秘訣也能擴展到多模態(tài)了!

舉個例子,提問多模態(tài)大模型:“什么寶可夢可以釋放技能十萬伏特”時,模型通過推理過程準確找出皮卡丘對應的坐標框,展示出模型的泛化能力。

圖片

這是來自上海交大、上海AI Lab、港中文大學的研究人員推出的視覺強化微調(diào)開源項目——Visual-RFT (Visual Reinforcement Fine-Tuning), 只需10~1000條數(shù)據(jù),就能通過思考過程和基于規(guī)則的監(jiān)督提升多模態(tài)大模型的性能。

圖片

具體來說,他們將DeepSeek-R1背后的基于規(guī)則獎勵的強化學習方法和OpenAI的強化微調(diào)(Reinforcement Fine-Tuning,RFT)范式,成功從純文本大語言模型拓展到了視覺語言大模型(LVLM)。

通過針對視覺的細分類、目標檢測等任務設計對應的規(guī)則獎勵,Visual-RFT打破了DeepSeek-R1方法局限于文本、數(shù)學推理、代碼等少數(shù)領域的認知,為視覺語言模型的訓練開辟了全新路徑。

下面具體來看。

從R1到Visual-RFT:強化學習的多模態(tài)突破

OpenAI o1主打的強化微調(diào)能力(Reinforcement Fine-Tuning)能只用少量樣本就將o1遷移到新的任務上。

最近DeepSeek-R1解釋了o1模型背后的強推理能力來自基于可驗證獎勵(Verified Rewards)/規(guī)則獎勵(Rule-based Verifier)的強化學習策略。

不過,目前主流的認知在于這種基于規(guī)則獎勵的方法只適用于數(shù)學推理、代碼等少數(shù)便于驗證的任務。

而在Visual-RFT中,研究人員將這一策略遷移到了視覺語言模型。

通過對細分類、目標檢測等任務建立對應的可驗證規(guī)則獎勵,研究解決了傳統(tǒng)方法在視覺領域中的局限性,只需少量微調(diào)樣本就實現(xiàn)了更高效、泛化性更強的視覺理解與推理能力。

傳統(tǒng)的視覺指令微調(diào)(Visual Instruction Tuning/Supervised Fine-Tuning,SFT)需要海量數(shù)據(jù)對模型微調(diào),在數(shù)據(jù)量有限(例如某些難以收集數(shù)據(jù)的特定學科場景)的情況下帶來的提升有限。

與之不同,新研究提出的視覺強化微調(diào)(Visual Reinforcement Fine-Tuning)具有少樣本學習能力更強的泛化性,在數(shù)據(jù)量有限的場景下相比指令微調(diào)具有很大的優(yōu)勢。

為驗證Visual-RFT(視覺強化微調(diào))的的泛化能力和普適性,力求對視覺領域的全面覆蓋,研究人員在多個視覺感知任務上對Visual-RFT進行驗證,包含Detection,Classification,Grounding等。

其中,Visual-RFT在open vocabulary,few-shot learning等設定下,僅僅通過非常少量的數(shù)據(jù)就取得了顯著的性能提升,輕松實現(xiàn)能力的遷移,且結(jié)果明顯優(yōu)于SFT的微調(diào)方法

在Reasoning Grounding(推理定位)的測試中,Visual-RFT展現(xiàn)出強大的視覺推理能力。

評測結(jié)果如下圖所示:

圖片

為了在視覺多模態(tài)領域驗證可驗證獎勵的作用,研究人員提出了使用基于IoU的verified reward獎勵應用于detection和grounding等任務,使用基于分類正確判斷的cls reward用于classification任務。

圖片

部分推理定位結(jié)果顯示,通過引入思考過程和強化學習策略,Visual-RFT(多模態(tài)強化微調(diào))顯著超越SFT,更加準確地定位物體。

如詢問模型,圖中的運動員在水下依然保持清晰的視野需要帶什么物體時候,通過傳統(tǒng)指令微調(diào)的方法模型直接將整個運動員框出。

而Visual-RFT通過引入推理過程準確地指出防水眼睛及其所在的位置并準確框出。

圖片

部分推理細粒度分類結(jié)果也展示了相同結(jié)論。

圖片

小結(jié)一下,相比于傳統(tǒng)的視覺指令微調(diào)(Visual Instruction/Supervised Fine-Tuning),Visual-RFT(視覺強化微調(diào))通過強化學習方法,對問題進行深入的think分析取得更佳推理性能,相較于傳統(tǒng)的指令微調(diào)(SFT)方法取得顯著提升。

Visual-RFT實驗結(jié)果

Visual-RFT(視覺強化微調(diào))在各大圖文感知任務中均展現(xiàn)出強大的性能。

實驗主要基于視覺語言大模型基座QWen2-VL 2B/7B模型,和傳統(tǒng)的監(jiān)督微調(diào)(Supervised Fine-Tuning)方法進行對比。

在開放目標檢測、少樣本檢測、細粒度分類和推理定位任務上,Visual-RFT相比SFT全面實現(xiàn)了性能提升。

值得一提的是,該研究的測試數(shù)據(jù)既包含COCO、LVIS等通用場景,又包含從互聯(lián)網(wǎng)中收集的卡通人物等開放場景數(shù)據(jù)。只需要幾十條數(shù)據(jù),模型通過Visual-RFT可以學會檢測某動漫中的史萊姆形象。

實驗結(jié)果廣泛驗證了Visual-RFT的卓越性能和魯棒性。

圖片

目前,包含訓練、評測代碼,數(shù)據(jù)在內(nèi),Visual-RFT項目已全面開源。

項目地址:https://github.com/Liuziyu77/Visual-RFT

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-02-03 14:17:27

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-01-24 15:03:27

2025-04-29 09:06:00

2025-02-19 08:00:00

2025-09-08 09:06:16

2025-03-05 03:00:00

DeepSeek大模型調(diào)優(yōu)

2025-11-19 08:56:42

2024-11-19 15:00:00

模型開源

2025-02-13 08:51:23

DeepSeek大模型

2025-02-06 10:18:45

2025-04-22 09:12:00

AI模型數(shù)據(jù)

2024-11-25 17:23:10

2025-03-10 08:10:00

AI研究安全

2025-06-25 08:54:03

模型訓練AI

2025-02-08 14:03:25

2025-02-08 10:42:34

點贊
收藏

51CTO技術棧公眾號

怡红院精品视频在线观看极品| 亚洲二区在线播放视频| 欧美日韩国产综合一区二区三区| 欧美激情第一页在线观看| 五月婷婷激情五月| 这里只有精品在线| 日韩精品中文字幕在线| 日韩欧美亚洲另类| 欧美男人天堂| 亚洲色图视频网站| 久久青青草原| www.国产麻豆| 日韩av中文在线观看| 久色乳综合思思在线视频| 在线观看一区二区三区四区| 国产一区二区主播在线| 亚洲午夜精品在线| 亚洲一区二区精品在线观看| 欧美一区二区在线观看视频| 蜜桃av一区二区三区| 国内精品美女av在线播放| 懂色av粉嫩av蜜臀av一区二区三区| 国产精品一线| 欧美高清视频一二三区 | 亚洲中午字幕| 欧美另类99xxxxx| 91精品国自产在线| 亚洲午夜久久| 精品久久久三级丝袜| 亚洲激情在线看| 亚洲a∨精品一区二区三区导航| 亚洲一区二区三区四区不卡| 新呦u视频一区二区| 无码精品一区二区三区在线| 国产精品一区二区91| 国产精品中文字幕在线| 国产剧情在线视频| 亚洲三级电影在线观看| 欧美大片免费看| 欧美成人777| 久久久久久久久久久久久久| 一区二区三区视频免费在线观看 | 国产区在线观看成人精品| 国产亚洲欧美一区二区三区| 成人av免费播放| 国产精品一区二区x88av| 91手机视频在线观看| 在线免费观看日韩视频| 日韩高清在线观看| 国产精品扒开腿做爽爽爽视频| www.国产com| 国产欧美激情| 欧美一级免费看| 免费看毛片网站| 久久久精品性| 国产精品久久久久久久久久99 | 久久不射2019中文字幕| 欧洲s码亚洲m码精品一区| 国产成人精品a视频一区| 亚洲成人直播| 5252色成人免费视频| 99热在线观看免费精品| 亚洲综合激情| 国产精品扒开腿做爽爽爽男男 | 蜜臀91精品一区二区三区| 国产精品777| 波多野结衣视频在线看| 美女网站色91| 91嫩草在线视频| 精品人妻一区二区三区含羞草 | 欧美区一区二区三区| 日本免费色视频| 麻豆精品在线| 精品久久久久久久久久久院品网 | 国产伦精品一区二区三区视频痴汉| 久久99在线观看| 91精品国产一区二区三区动漫| 亚洲精品911| 26uuu精品一区二区三区四区在线| 牛人盗摄一区二区三区视频| 岛国大片在线观看| 亚洲特级片在线| 久草视频这里只有精品| 中文av在线全新| 欧美日韩一区二区三区免费看| 日韩av福利在线观看| 超碰成人在线观看| 亚洲欧美中文字幕在线一区| 久久久精品少妇| 精品成人一区| 国产精品久久一区| 成人黄色在线观看视频| www激情久久| 自拍偷拍视频在线| 男人久久天堂| 91精品麻豆日日躁夜夜躁| 大尺度做爰床戏呻吟舒畅| 国产一区二区三区探花| 欧美另类xxx| 真实的国产乱xxxx在线91| 成人性色生活片免费看爆迷你毛片| 免费成人深夜夜行视频| 成人在线免费看黄| 欧洲日韩一区二区三区| 精品人妻在线视频| 日韩欧美不卡| 欧美性资源免费| 性一交一乱一乱一视频| 中文字幕巨乱亚洲| 久久成人免费观看| 欧美视频三区| 色香阁99久久精品久久久| 日韩三级视频在线播放| 久久99精品网久久| 欧日韩一区二区三区| 丰满的护士2在线观看高清| 欧美四级电影网| 国产中文字幕一区二区| 伊人久久大香线| 国产精品久久久久av| 日本免费网站在线观看| 亚洲欧美一区二区不卡| 无需播放器的av| 亚洲天堂日韩在线| 亚洲18私人小影院| 国产suv一区二区| 中文字幕乱码一区二区免费| 无码人妻丰满熟妇区毛片18| 成人高潮视频| 色综合久久久久久中文网| 91超薄丝袜肉丝一区二区| 久久久高清一区二区三区| 老太脱裤子让老头玩xxxxx| 天堂精品久久久久| 久热精品视频在线| 6—12呦国产精品| 中文字幕中文字幕一区| 国产又黄又猛又粗| 国产一区99| 国产精品精品视频| 国产福利第一视频在线播放| 狠狠躁18三区二区一区| 97精品人妻一区二区三区蜜桃| 综合久久久久| 97人人干人人| 人人澡人人添人人爽一区二区| 337p亚洲精品色噜噜| 亚洲一二三在线观看| 精品一区二区三区免费毛片爱 | 国语精品一区| av电影成人| www.综合网.com| 亚洲第一黄色网| 国产性猛交╳xxx乱大交| 95精品视频在线| 国产又黄又猛视频| 精品成人影院| 国产日本欧美视频| caoporn免费在线视频| 日韩一区二区影院| 国产亚洲第一页| 不卡影院免费观看| 欧美日韩在线不卡视频| 日韩精品一卡| 亚洲在线免费观看| 国产盗摄精品一区二区酒店| 日韩av最新在线| 久久久久久久久黄色| 欧美激情一区二区| 四虎成人在线播放| 亚洲国产高清一区| 日韩国产高清一区| 亚洲最大的免费视频网站| 欧美国产日本高清在线 | 啪啪激情综合网| 国产精品久久久久77777| 国产视频在线播放| 精品免费国产二区三区| 国产尤物在线视频| 国产精品视频你懂的| 亚洲丝袜在线观看| 国产一区二区三区久久久久久久久 | 久久亚洲精品石原莉奈| 国产精品美女一区二区三区 | 久久精品男人的天堂| www.com黄色片| 韩国久久久久| 日韩色妇久久av| 91成人短视频| 国产成人在线播放| 久久av色综合| 一本色道久久综合亚洲精品小说 | 久久久久久亚洲| 国产污视频在线| 精品久久久久久最新网址| 波多野结衣视频网址| 一区二区三区在线播| 精品国产av无码| 国产盗摄精品一区二区三区在线 | 国内精品久久久久影院一蜜桃| 日韩成人三级视频| 欧美午夜精品一区二区三区电影| av一区和二区| 久久91视频| 欧美一区亚洲一区| 中国av在线播放| 在线免费看av不卡| 天天摸夜夜添狠狠添婷婷| 在线电影国产精品| 日韩少妇高潮抽搐| 一区二区不卡在线播放 | 五月婷婷在线播放| 91精品婷婷国产综合久久性色| 九九热在线免费观看| 亚洲综合视频在线| 一级性生活免费视频| 久久久久免费观看| 91玉足脚交白嫩脚丫| 国产精品一区2区| 中文字幕丰满乱码| 日韩va欧美va亚洲va久久| www在线观看免费| 欧美不卡在线| 99久re热视频精品98| 青青草成人影院| 欧美久久久久久| 日韩美女精品| 国产日韩三区| 丁香婷婷成人| 国产伦精品一区二区三区| 精品国产一区二| 成人黄色在线播放| 青青在线精品| 国产日韩欧美在线播放| 日韩漫画puputoon| 国产精品高清免费在线观看| 欧美大胆a人体大胆做受| 欧美精品18videosex性欧美| 呦呦在线视频| 欧美猛男性生活免费| av毛片在线免费看| 久久97精品久久久久久久不卡| 国产精品刘玥久久一区| 久久九九亚洲综合| 黄色免费网站在线| 欧美成人在线网站| 怡红院av在线| 久久久久久91香蕉国产| a√中文在线观看| 2019精品视频| 二区三区不卡| 国产精品电影在线观看| 成人全视频免费观看在线看| 国产精品美女主播| 亚洲三级在线| 91一区二区三区| 第四色在线一区二区| 精品久久久久久综合日本| 亚洲精华一区二区三区| 欧美一卡2卡3卡4卡无卡免费观看水多多| 亚洲三级精品| 亚洲午夜高清视频| 911久久香蕉国产线看观看| 欧美 国产 精品| 136国产福利精品导航网址| 国产黄视频在线| 青青草97国产精品免费观看 | 4438五月综合| 99国产高清| 日本亚洲不卡| 亚洲国产一区二区精品视频 | 亚洲免费成人av在线| 日本精品一区| 2023国产精品久久久精品双| 成人一区二区av| 亚洲一区二区成人| 超碰在线播放91| 丰满岳乱妇一区二区三区| 成人影视免费观看| 国产精品久久久久久久久免费樱桃| 久久久久久视频| 婷婷综合五月天| 亚洲熟妇av乱码在线观看| 日韩一区二区三区四区| 同心难改在线观看| 色吧影院999| 3344国产永久在线观看视频| 国产激情999| 一本一道久久a久久| 日韩欧美手机在线| 国内自拍一区| 超碰超碰在线观看| 99久久精品国产一区| 长河落日免费高清观看| 亚洲国产一区二区视频| 中文 欧美 日韩| 精品美女在线播放| 男人影院在线观看| 热久久免费视频精品| 日本在线成人| 小说区图片区图片区另类灬| 影音先锋中文字幕一区二区| 日本中文字幕高清| 99热这里都是精品| 中文字幕亚洲欧美日韩| 狠狠躁18三区二区一区| www.黄色一片| 最近2019年好看中文字幕视频 | 色欧美自拍视频| 91九色在线观看视频| 国产精品一区二区三区网站| 制服 丝袜 综合 日韩 欧美| 亚洲国产精品自拍| 国产绿帽一区二区三区| 亚洲区在线播放| 日韩伦理在线| 国产精品露出视频| 欧美在线网址| 不卡中文字幕在线观看| 国产日韩欧美精品一区| 日韩欧美一区二区一幕| 精品日韩99亚洲| 麻豆tv在线| 国产日韩av在线播放| 国产欧美日韩影院| www.亚洲天堂网| 久久亚洲免费视频| av资源免费观看| 亚洲国产欧美在线成人app | 91精品99| 亚洲涩涩在线观看| 国产精品天美传媒沈樵| 久久精品久久久久久久| 亚洲精品自在久久| 偷拍自拍在线看| 久久国产精品久久| 国产日韩亚洲| 中文字幕日韩三级片| 天天操天天干天天综合网| 丰满少妇高潮在线观看| 欧美日韩国产二区| 都市激情亚洲欧美| 精品视频在线观看一区| av电影在线观看一区| 日韩乱码一区二区| 日韩成人在线电影网| 九色porny自拍视频在线观看 | 国产精品青草久久久久福利99| 免费欧美激情| 情侣黄网站免费看| 日本一区二区三区在线观看| 五月天中文字幕| 日韩亚洲精品电影| 国产不卡精品| 国产精品igao激情视频| 国产a精品视频| 天天插天天操天天干| 国产网站欧美日韩免费精品在线观看| 色在线视频观看| 日韩一区二区三区高清| 蜜桃精品视频在线观看| 日本黄色小说视频| 亚洲国产精品va在线看黑人| 麻豆免费在线| 午夜精品一区二区三区四区| 精品一区二区影视| 精品无码久久久久久久| 日韩成人小视频| 国产精品无码久久久久| 免费看日本黄色| 91蝌蚪porny九色| 一本到在线视频| 欧美精品福利视频| 少妇一区二区视频| 午夜xxxxx| 天天综合网天天综合色 | 欧美黑人巨大精品一区二区| 老司机精品视频在线播放| 欧美两根一起进3p做受视频| 国产精品国产三级国产aⅴ入口 | 中文在线不卡视频| 看亚洲a级一级毛片| 日本成年人网址| 一色桃子久久精品亚洲| 刘亦菲久久免费一区二区| 国产精品1区2区在线观看| 欧美99在线视频观看| 女同毛片一区二区三区| 欧美日韩免费观看一区三区| 欧美aaa免费| 亚洲午夜精品久久| 99久久精品99国产精品| 一本一道精品欧美中文字幕| 久久久久亚洲精品成人网小说| 精品一区电影| 国产十八熟妇av成人一区| 在线电影院国产精品| 国产另类xxxxhd高清| 男人添女荫道口图片| 中文字幕一区二区三|