精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MiniMax開源首個視覺RL統(tǒng)一框架,閆俊杰領(lǐng)銜!推理感知兩手抓,性能橫掃M(jìn)EGA-Bench

人工智能 新聞
最新開源V-Triune(視覺三重統(tǒng)一強(qiáng)化學(xué)習(xí)系統(tǒng))框架,使VLM首次能夠在單個后訓(xùn)練流程中,聯(lián)合學(xué)習(xí)和掌握視覺推理和感知任務(wù)。

僅需一個強(qiáng)化學(xué)習(xí)(RL)框架,就能實(shí)現(xiàn)視覺任務(wù)大統(tǒng)一?

現(xiàn)有RL對推理和感知任務(wù)只能二選一,但“大模型六小強(qiáng)”之一MiniMax表示:我全都要!

最新開源V-Triune(視覺三重統(tǒng)一強(qiáng)化學(xué)習(xí)系統(tǒng))框架,使VLM首次能夠在單個后訓(xùn)練流程中,聯(lián)合學(xué)習(xí)和掌握視覺推理和感知任務(wù)。

通過三層組件設(shè)計基于動態(tài)交并比(IoU)的獎勵機(jī)制,彌補(bǔ)了傳統(tǒng)RL方法無法兼顧多重任務(wù)的空白。

圖片

甚至基于V-Triune,MiniMax還一步到位,貼心地給大家開發(fā)了全新的Orsta(One RL to See Them All)模型系列(7B至32B),在MEGA-Bench Core基準(zhǔn)測試中從+2.1%顯著提升至+14.1%。

圖片

值得注意的是,在論文的作者一欄,MiniMax創(chuàng)始人兼CEO閆俊杰也參與了這項(xiàng)研究。

圖片

目前V-Triune框架和Orsta模型都在GitHub上實(shí)現(xiàn)全面開源,點(diǎn)擊文末鏈接即可跳轉(zhuǎn)一鍵獲取。

那話不多說,咱們直接上細(xì)節(jié)。

推理感知“兩手抓”

視覺任務(wù)可以分為推理感知兩類,在當(dāng)前,RL研究主要集中于數(shù)學(xué)QA和科學(xué)QA等視覺推理任務(wù)。

而目標(biāo)檢測和定位等視覺感知任務(wù),因亟需獨(dú)特的獎勵設(shè)計和訓(xùn)練穩(wěn)定性保障,還沒有得到一個很好的解決方案……

圖片

針對上述問題,MiniMax針對性地提出了新框架V-Triune,作為首個面向VLM后訓(xùn)練的統(tǒng)一RL系統(tǒng),通過三個互補(bǔ)組件核心巧妙實(shí)現(xiàn)二者的平衡。

樣本級數(shù)據(jù)格式化

讓每個樣本自定義其獎勵設(shè)置和驗(yàn)證器,支持動態(tài)路由和權(quán)重調(diào)整,以處理多種任務(wù)需求。

數(shù)據(jù)模式基于HuggingFace數(shù)據(jù)集實(shí)現(xiàn),包含以下三個字段:

  1. reward_model:樣本級定義獎勵類型、權(quán)重。
  2. verifier:指定驗(yàn)證器及其參數(shù)。
  3. data_source:標(biāo)識樣本來源。

最終實(shí)現(xiàn)了多樣化數(shù)據(jù)集的無縫集成,同時支持高度靈活的獎勵控制。

驗(yàn)證器級獎勵計算

采用異步客戶端-服務(wù)器架構(gòu),將獎勵計算與主訓(xùn)練循環(huán)解耦。

圖片

客戶端通過代理工作器異步發(fā)送請求,而服務(wù)器則根據(jù)”verifier”字段路由至專用驗(yàn)證器。

主要使用兩類驗(yàn)證器:

  1. MathVerifyVerifierr:處理推理、OCR和計數(shù)任務(wù)。
  2. DetectionVerifier:處理檢測和定位任務(wù),應(yīng)用動態(tài)IoU獎勵。

從而實(shí)現(xiàn)在無需修改核心訓(xùn)練流程的情況下,靈活擴(kuò)展新任務(wù)或更新獎勵邏輯。

數(shù)據(jù)源級指標(biāo)監(jiān)控

在多任務(wù)多源訓(xùn)練中,按數(shù)據(jù)源記錄以下指標(biāo):

  1. 獎勵值:追蹤數(shù)據(jù)集特定穩(wěn)定性。
  2. IoU和mAP(感知任務(wù)):記錄不同閾值下的IoU和mAP。
  3. 響應(yīng)長度和反思率:跟蹤響應(yīng)長度分布、截斷率,以及15個預(yù)定義反思詞(如“re-check”)的出現(xiàn)比例。

該監(jiān)控機(jī)制幫助診斷模型行為(如過度思考或膚淺響應(yīng)),并確保學(xué)習(xí)的穩(wěn)定性。

圖片

動態(tài)IoU獎勵

此外針對監(jiān)測和定位任務(wù),團(tuán)隊(duì)還創(chuàng)新性地提出了動態(tài)IoU獎勵,分階段調(diào)整閾值,以緩解冷啟動問題,同時引導(dǎo)模型逐步提升定位精度:

  • 初始10%訓(xùn)練步驟:
  • 10%-25%訓(xùn)練步驟:
  • 剩余訓(xùn)練步驟:

圖片

雖然V-Triune提供了可擴(kuò)展的數(shù)據(jù)、任務(wù)和指標(biāo)框架,但早期實(shí)驗(yàn)顯示,聯(lián)合訓(xùn)練可能會導(dǎo)致評估性能下降梯度范數(shù)突增等不穩(wěn)定現(xiàn)象,于是團(tuán)隊(duì)又通過以下調(diào)整逐步解決:

  1. 凍結(jié)ViT參數(shù),防止梯度爆炸。
  2. 過濾偽圖像特殊詞元,確保輸入特征對齊,提升訓(xùn)練穩(wěn)定性。
  3. 構(gòu)建隨機(jī)化CoT提示池,降低提示依賴性。
  4. 由于V-Triune基于Verl框架實(shí)現(xiàn),主節(jié)點(diǎn)內(nèi)存壓力較大,需解耦測試階段與主訓(xùn)練循環(huán)以管理內(nèi)存。

Orsta模型

另外值得一提的是,基于開源的Qwen2.5-VL模型,團(tuán)隊(duì)還訓(xùn)練出7B和32B的Orsta模型

圖片

依據(jù)4類推理任務(wù)(數(shù)學(xué)、謎題、科學(xué)、圖表分析)和4類感知任務(wù)(物體檢測、目標(biāo)定位、計數(shù)、OCR)的訓(xùn)練數(shù)據(jù),進(jìn)行規(guī)則和難度的兩階段過濾和訓(xùn)練優(yōu)化。

最終實(shí)現(xiàn)在MEGA-Bench Core基準(zhǔn)測試中,Orsta相比原始模型提升至+14.1%,尤其是在感知任務(wù)中,mAP指標(biāo)顯著提高,證明了該統(tǒng)一方法的有效性和可擴(kuò)展性。

圖片

MiniMax布局多模態(tài)領(lǐng)域

MiniMax作為商湯背景出身的AI六小龍之一,近期在多模態(tài)領(lǐng)域可謂動作頻頻,模型橫跨語言、音頻、視頻。

圖片

例如MiniMax的S2V-01視頻模型、MiniMax-VL-01視覺多模態(tài)模型以及MiniMax-T2A-01系列語言模型等。

尤其是廣受好評的MiniMax-01系列,包含基礎(chǔ)語言模型和視覺多模態(tài)模型兩種,性能上比肩DeepSeek-V3、GPT-4o等國內(nèi)外頂尖模型的同時,還首次創(chuàng)新性實(shí)現(xiàn)了對新型Lightning Attention架構(gòu)的大規(guī)模擴(kuò)展。

最新發(fā)布的Speech-02,在AI語言生成上也是一騎絕塵,直接刷新全球權(quán)威語音基準(zhǔn)測試榜單第一,一舉打破OpenAI、ElevenLabs的行業(yè)壟斷。

圖片

同時,據(jù)MiniMax高級研究總監(jiān)鐘怡然同量子位訪談時所說:

MiniMax將會進(jìn)一步探索多模態(tài)架構(gòu)創(chuàng)新,即原生的生成理解統(tǒng)一大模型的架構(gòu)。

而今天這個統(tǒng)一視覺任務(wù)的RL架構(gòu)也許僅僅是一個開始。

論文鏈接:https://arxiv.org/abs/2505.18129代碼鏈接:https://github.com/MiniMax-AI/One-RL-to-See-Them-All

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2009-05-19 15:06:33

TD-SCDMA3G建設(shè)

2011-08-10 16:21:40

網(wǎng)康ITM網(wǎng)絡(luò)擁塞

2023-10-07 00:11:22

CIO

2010-03-15 15:02:54

2017-11-01 10:11:00

CIO創(chuàng)新房地產(chǎn)

2023-05-08 15:14:38

技術(shù)AI

2021-04-26 08:24:41

DDoS攻擊黑客

2009-02-16 09:58:00

無線路由自動斷線故障

2015-04-15 13:04:45

AMDLisa Su策略

2022-09-05 11:39:38

瑞數(shù)信息動態(tài)安全

2015-04-15 13:49:31

公共Wi-Fi避害兩手抓

2021-07-26 08:01:35

數(shù)據(jù)資產(chǎn)智能化安全性

2013-12-20 09:08:40

智慧城市

2018-07-10 17:48:22

百度云

2024-11-15 15:38:00

模型測評

2017-01-16 13:13:34

H3C關(guān)鍵業(yè)務(wù)

2025-05-15 09:04:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

一区二区三区影视| 国产精品宾馆在线精品酒店| 国产精选久久久| 国产精品大片免费观看| 日韩精品中文字幕有码专区| 成人亚洲精品777777大片| 激情视频在线观看| a级片在线免费观看| 国产精品白丝久久av网站| 亚洲一区二区三区爽爽爽爽爽| 精品久久久久久一区二区里番| 国产精品51麻豆cm传媒| 亚洲性色视频| xxxx性欧美| 成人影视免费观看| 国产在线一区不卡| 黑人与娇小精品av专区| 少妇高潮流白浆| 内衣办公室在线| 国产精品一卡二卡在线观看| 日本一欧美一欧美一亚洲视频| 精品无码一区二区三区蜜臀| 日韩三级毛片| 日韩美女在线视频| 国产女同无遮挡互慰高潮91| 日本乱码一区二区三区不卡| 一区二区三区在线播放| 亚洲精品成人三区| 久久经典视频| av中文字幕在线不卡| 91色中文字幕| 夜夜躁很很躁日日躁麻豆| 国产精品毛片| 国内偷自视频区视频综合 | av欧美精品.com| 97se亚洲综合在线| 91午夜交换视频| 免费在线观看视频一区| 911精品美国片911久久久| 大桥未久av一区二区三区| 久久久久久久香蕉| caopen在线视频| 中文字幕一区二区三区av| 日韩欧美在线一区二区| 久蕉依人在线视频| 国产欧美日韩中文久久| 日本10禁啪啪无遮挡免费一区二区| 刘亦菲久久免费一区二区| 国产精一区二区三区| 91精品久久久久久久久| 中文字幕在线视频免费| 久久亚洲视频| 日本一区二区在线播放| www.国产一区二区| 蜜桃视频一区| 国产精品第2页| 69av视频在线观看| 热久久一区二区| 国产女人18毛片水18精品| 中文字幕久久网| 人人超碰91尤物精品国产| 国产精品高精视频免费| 中文字幕欧美在线观看| 毛片av一区二区| 91久久国产精品| 国产jzjzjz丝袜老师水多| 激情深爱一区二区| wwwxx欧美| 天天操天天干天天爽| 91麻豆免费看| 日韩电影大全在线观看| av福利在线播放| 亚洲欧美一区二区不卡| 韩国无码av片在线观看网站| 99爱在线视频| 91福利社在线观看| 中文字幕日韩久久| eeuss鲁片一区二区三区| 亚洲精品成人久久电影| 九九热最新视频//这里只有精品 | 2020国产精品| 日韩一区不卡| av网站在线免费看推荐| 亚洲国产精品麻豆| av无码精品一区二区三区| 欧美成人福利| 精品日韩一区二区三区| 91精品人妻一区二区| 日韩一区欧美| 午夜精品福利视频| 亚洲天堂777| 粉嫩av一区二区三区| 欧美不卡1区2区3区| 在线观看黄色av| 亚洲va天堂va国产va久| 免费在线观看的毛片| 韩国三级成人在线| 亚洲精品中文字幕女同| 国产盗摄x88av| 亚洲专区一区| 亚洲尤物视频网| 能在线看的av| 亚洲一区二区三区在线播放| 性生交免费视频| 嗯用力啊快一点好舒服小柔久久| 一区二区欧美激情| 国产精品成人网站| 国产在线一区观看| 久久99精品久久久久久三级| 亚洲免费精品视频| 蜜桃视频污在线观看| 国产欧美一区二区精品性| 日韩欧美视频免费在线观看| 欧美影视资讯| 精品亚洲精品福利线在观看| 国产97免费视频| 青椒成人免费视频| 久久国产精品久久精品国产| 在线观看a级片| 欧美色综合网站| 成年人在线观看av| 精品电影一区| 亚洲精品免费网站| 婷婷视频在线| 欧美日韩专区在线| 久久国产精品影院| 亚洲精品一二| 成人片在线免费看| 91精选在线| 欧美久久久久久久久久| 国产一二三四区在线| 亚洲一区二区三区高清不卡| 国产精品一区视频| 黑人另类精品××××性爽| 日韩一二三区视频| 少妇人妻丰满做爰xxx| 久久99精品国产麻豆不卡| 视频一区二区在线| 欧美日韩美女| 日韩精品在线免费播放| 日韩三级一区二区三区| www.欧美日韩| 极品粉嫩国产18尤物| 北条麻妃在线一区二区免费播放| 亚洲综合久久av| 国产精品久久久久久久av电影| 搡老岳熟女国产熟妇| 亚洲高清不卡在线| 亚洲av人人澡人人爽人人夜夜| 欧美日韩国产在线一区| a级国产乱理论片在线观看99| av片在线观看永久免费| 91精品国产综合久久福利| 国产在线免费看| 国产一区二区三区在线看麻豆| 亚洲自拍偷拍一区二区三区| 亚洲精品一区av| www.国产精品一二区| 国产乱人乱偷精品视频| 亚洲精品视频免费看| 特种兵之深入敌后| 精品动漫3d一区二区三区免费| 国内一区二区在线视频观看| 三妻四妾的电影电视剧在线观看| 亚洲国产欧美一区二区三区同亚洲| 国产无码精品一区二区| 99视频在线观看一区三区| 人妻有码中文字幕| av资源久久| 91欧美精品成人综合在线观看| 影院在线观看全集免费观看| 亚洲а∨天堂久久精品9966| 免费黄色网址在线| 中文在线资源观看网站视频免费不卡| wwwwwxxxx日本| 欧美另类亚洲| 91麻豆国产福利在线观看| 日韩精品av一区二区三区| 欧美大片1688网站| 美女国内精品自产拍在线播放| 男人天堂一区二区| 色婷婷综合中文久久一本| 国产精品69久久久久孕妇欧美| 国产精品一级黄| 成人免费毛片网| 婷婷亚洲综合| 精品国产一区二区三区麻豆免费观看完整版| 在线天堂中文资源最新版| 日韩在线观看网站| 好吊色在线观看| 欧美视频一区二区三区| 国产一级在线视频| 国产欧美日韩卡一| 高清中文字幕mv的电影| 日精品一区二区三区| 激情成人开心网| 国产精品一区二区三区av麻 | 97se亚洲国产综合自在线不卡| 欧美日韩怡红院| 国产精品magnet| 日韩欧美精品一区二区三区经典| 视频精品一区二区三区| 国产精品观看在线亚洲人成网 | 日本久久久久久久久| 理论片午午伦夜理片在线播放| 亚洲国产97在线精品一区| 中文字幕在线播放av| 欧州一区二区三区| 日韩在线播放一区| 免费一级在线观看| 精品噜噜噜噜久久久久久久久试看 | 教室别恋欧美无删减版| 国产麻豆日韩| 国产不卡精品| 国产精品色午夜在线观看| 国产99在线观看| 欧美成人亚洲成人| 青青影院在线观看| 亚洲天堂av在线播放| 人妻与黑人一区二区三区| 88在线观看91蜜桃国自产| 国产情侣免费视频| 日韩欧美a级成人黄色| 久久午夜无码鲁丝片午夜精品| 国产精品乱码久久久久久| 插吧插吧综合网| 99视频在线精品| 中文字幕人妻一区| 国产一区二区伦理片| 免费看涩涩视频| 日本不卡视频在线| 日韩免费高清在线| 亚洲免费网址| 精品无码一区二区三区在线| 欧美午夜电影在线观看 | 18videosex性欧美麻豆| 精品国产欧美成人夜夜嗨| 91在线品视觉盛宴免费| 一区二区成人精品| 亚洲性生活网站| 久久不见久久见中文字幕免费| 国产精品免费视频一区二区| 日韩区欧美区| 97人人模人人爽人人少妇| 国产精品国产亚洲精品| 亚洲999一在线观看www| 欧美午夜网站| 99久热re在线精品视频| 国产精品流白浆在线观看| 国产精品免费一区二区| 丝袜久久网站| 欧美久久电影| av伊人久久| 中文字幕日韩精品一区二区| 99久久www免费| 一区二区三区四区久久| **女人18毛片一区二区| 欧美日韩中文字幕在线播放 | 久久国产精品视频在线观看| 亚洲精品美女| 男人操女人免费| 日韩国产欧美在线播放| 亚洲高清免费在线观看| 二人午夜免费观看在线视频| 久久久久国产精品麻豆| 欧美三级视频网站| 亚洲欧美在线aaa| 私库av在线播放| 亚洲a一区二区| 伊人手机在线视频| 欧美日韩精品欧美日韩精品| 国产男女猛烈无遮挡| 亚洲国产成人精品久久| 你懂的在线观看| 久久影院资源网| yellow在线观看网址| 国产精品v片在线观看不卡| 欧美成人福利| 国产九区一区在线| heyzo久久| 97碰在线视频| 日韩精彩视频在线观看| 尤物网站在线看| av电影在线观看一区| 毛片aaaaaa| 亚洲午夜在线观看视频在线| 久久精品无码av| 欧美一级高清大全免费观看| 日本一二三区在线视频| 久久影视电视剧免费网站| 丝袜老师在线| 91日本在线观看| 免费欧美一区| 国产专区在线视频| 久久精品毛片| 韩国三级在线看| 中文久久乱码一区二区| 日韩免费观看一区二区| 欧美日韩视频在线第一区 | 精品亚洲男同gayvideo网站 | 天天躁日日躁狠狠躁欧美巨大小说| 亚洲国产精品一区在线观看不卡| 精品99视频| 6080国产精品| 国产日韩欧美a| 日韩aaaaaa| 欧美一区二区三区四区高清| 你懂得在线网址| 亚洲3p在线观看| 久久天堂久久| 亚洲福利av| 亚洲欧美久久久| 亚洲天堂2024| 亚洲精品日韩综合观看成人91| 精品视频一二三区| 日韩电影大片中文字幕| a毛片在线观看| 国产精品成人国产乱一区 | 日韩欧美激情| 日本一区二区三区www| 99国产一区| yjizz视频| 夜夜精品视频一区二区| 国产农村妇女毛片精品久久| 综合欧美国产视频二区| 欧美xx视频| 久久精品第九区免费观看| 国产字幕视频一区二区| 日本精品一区在线| 国产精品美女久久福利网站| 国产情侣免费视频| 国产亚洲精品日韩| 日韩免费va| 免费国产一区二区| 国产亚洲激情| 国产精品无码一区二区三区免费| 亚洲成av人**亚洲成av**| 蜜桃久久一区二区三区| 欧美黄色www| 成人资源在线播放| 中文字幕无码精品亚洲资源网久久| 国产麻豆成人精品| 欧美成人一区二区三区高清| 日韩一级高清毛片| 免费在线看电影| 国产精品成人观看视频免费| 黄色av一区| 国产激情视频网站| 精品久久久久久中文字幕一区奶水 | 精品国产自在久精品国产| 1024在线播放| 国产传媒一区| 一区二区久久| 日本二区在线观看| 欧美日韩午夜精品| av香蕉成人| 国产精品毛片va一区二区三区| 国产一区欧美| 青青草福利视频| 欧美午夜精品久久久| 久久77777| 成人羞羞视频免费| 性感少妇一区| 日本少妇aaa| 日韩一级二级三级| 国内激情视频在线观看| 日韩高清国产精品| 久久爱另类一区二区小说| 久久艹精品视频| 日韩av在线天堂网| jizz欧美| 无码熟妇人妻av在线电影| 91在线观看高清| 又骚又黄的视频| 久久99精品视频一区97| 特黄特色欧美大片| 中文字幕第38页| 亚洲一本大道在线| 国产在线观看网站| 99国产超薄肉色丝袜交足的后果| 中文一区在线| 国产又色又爽又高潮免费| 精品久久人人做人人爰| 国产日韩另类视频一区| 日本老太婆做爰视频| 91影院在线免费观看| 国产精品国产一区二区三区四区| 久久频这里精品99香蕉| japanese国产精品| 亚洲美女精品视频| 欧美在线看片a免费观看| 91在线中文| 五月天丁香综合久久国产| 高清在线成人网| 中文字幕第2页| 性色av一区二区三区免费| 青青草国产免费一区二区下载| 无码国产精品一区二区免费式直播| 欧美伊人久久大香线蕉综合69| 黄色免费在线观看|