精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計 原創(chuàng)

發(fā)布于 2025-9-19 09:36
瀏覽
0收藏

VLMs 性能的持續(xù)提升,視覺 token 的消耗呈指數(shù)級增長。例如,一張 2048× 1024 的圖片在 LLaVA 1.5中需要 576 個視覺 token,而在 Qwen2.5-VL中則需2678 個視覺 token。因此,避免過度使用視覺 token 顯得尤為重要。

大多數(shù)方法使用預(yù)定的Threshold 來修剪或合并固定數(shù)量的視覺 Token。然而,不同問題和圖像中的冗余程度各不相同。因此,是否真的應(yīng)該在所有場景中應(yīng)用統(tǒng)一的 Token 壓縮比例?下圖探討了簡單地降低了圖像分辨率以減少視覺 token 的數(shù)量,并評估了 Qwen2.5-VL 的在幾個基準上的性能。

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

結(jié)論:

  • 左圖:在大多數(shù)一般場景中,即使將視覺 token 減少四倍,性能下降也微乎其微。然而,在OCR 相關(guān)基準上,token 壓縮會導(dǎo)致顯著的性能下降。
  • 右圖:VisionThink 在性能和效率上均顯著優(yōu)于之前的工作。

因此,如何讓模型自主選擇何時進行圖像token壓縮?VisionThink是一種新的視 覺 token 壓縮范式。從下采樣圖像開始,智能判斷其是否足以解決問題。否則,模型可以輸出一個特殊 token 以請求更高分辨率的圖像。與現(xiàn)有采用固定剪枝比例或閾值壓縮 token 的高效 VLM 方法相比,VisionThink 自主決定是否按情況壓縮 token。

本文看看VisionThink相關(guān)思路,僅供參考。

方法

目標:使VLMs能夠自主判斷給定圖像中的信息是否足以準確回答問題。如下圖,pipline首先處理低分辨率圖像以最小化計算成本。當降采樣圖像中的信息不足以回答問題時,它會智能地請求原始高分辨率輸入。

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

VisionThink 的框架: (a) 左圖 VisionThink 處理分辨率降低4倍的圖像,其中 VLM 直接提供答案。(b) 右圖展示了模型檢測到信息不足并請求高分辨率圖像以回答問題的情況。

從上述可知,強化學(xué)習的設(shè)計目標變?yōu)椋?strong>使模型能夠判斷何時需要高分辨率。模型必須學(xué)會評估下采樣圖像是否包含足夠的信息來回答問題,或者是否需要原始高分辨率圖像。

RL設(shè)計

LLM作為評判評估器

傳統(tǒng)問題無法解決:rule-base的方法可以通過規(guī)則或精確匹配輕松定義和驗證真實答案。然而,這種方法在通用 VQA 情景中失效,因為有效答案的多樣性和分歧使得基于規(guī)則的驗證變得不可行。

因此,通過一個LLM作為評判評估器,僅評估模型響應(yīng)的純文本準確率。通過比較模型的答案與真實答案來實現(xiàn)

獎勵提示詞如下:可以看到,獎勵值是離散值0或1.

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

多輪GRPO算法

前面提到,pipline會首先將問題和下采樣圖像輸入到 VLM 中。如果信息不足以回答當前問題,模型將自主請求更高分辨率的圖像并生成新的響應(yīng)。這一過程本質(zhì)上是一種多輪交互。因此,將原始的 GRPO擴展為多輪 GRPO:

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

那么新問題來了,如何觸發(fā)高分辨率圖像進行輸入?樸素的方法:改提示詞,指示模型輸出特定的特殊 token。 提示必須確保模型能夠在 zero-shot 情景下的多輪展開中輸出所需的特殊 token。

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

獎勵函數(shù)設(shè)計

總體獎勵函數(shù)如下,由三部分組成:

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

  • 準確率獎勵:LLM-as-Judge 方法,其中 0 表示錯誤答案,1 表示正確答案。
  • 格式獎勵:推理過程需包含在“< think>< /think>” 標簽內(nèi),最終答案置于 “< answer>< /answer>” 標簽中,且函數(shù)調(diào)用需符合規(guī)定的 JSON 格式。若其中任一格式有誤,則格式化得分為 0。只有當所有格式均正確時,模型才能獲得滿分的格式化得分 0.5。
  • 懲罰控制:由于使用高分辨率圖像通常能提升性能,若沒有任何懲罰,模型傾向于始終請求高分辨率圖像。為防止這種情況,最初遵循 Search-R1對依賴高分辨率圖像的正確回答施加了 0.1 的懲罰。然而,這種方法導(dǎo)致模型偏好直接回答,引發(fā)模型僅依賴直接回答的崩潰現(xiàn)象,如下圖中的紫色線所示。原因在于,即使是模糊的低分辨率圖像有時也能讓模型猜出正確答案,而 0.1 的懲罰無意中強化了這種直接回答的偏好。引入一個閾值來控制這種現(xiàn)象。當使用低分辨率圖像正確回答的概率較低時,對直接答案施加 0.1 的懲罰,以鼓勵高分辨率請求;反之,當概率較高時,對高分辨率請求施加 0.1 的懲罰。通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

實驗性能

  • 推理模型推理時間成本與基準性能對比。Qwen-RL 和 Qwen-RL (1/4) 分別表示在Qwen2.5-VL-Instruct 模型上利用 LLM-as-Judge 進行全分辨率圖像和 1/4 分辨率圖像的推理。通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)
  • 與傳統(tǒng)高效 VLM 方法的比較通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)
  • VisionThink 智能地確定高分辨率圖像的比率。應(yīng)用調(diào)整大小表示模型自主請求查看原始高分辨率圖像,而直接回答則表示模型僅使用 1/4 大小的圖像即可回答問題。通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

參考文獻:VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning,https://arxiv.org/pdf/2507.13348repo:https://github.com/dvlab-research/VisionThink

本文轉(zhuǎn)載自???大模型自然語言處理??   作者:余俊輝

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
国产精品视频1区| 亚洲精品有码在线| 神马午夜伦理影院| 免费成人在线看| 手机精品视频在线观看| www.日韩系列| 日本免费福利视频| 日韩免费在线电影| 午夜精品成人在线| 亚洲一区二区三区午夜| 天堂av2024| 另类综合日韩欧美亚洲| 久久免费视频网站| 又嫩又硬又黄又爽的视频| 国产厕拍一区| 欧美日韩一区二区在线观看视频| 国产一级做a爰片久久毛片男| 玖玖综合伊人| 成人ar影院免费观看视频| 国产精品美女免费视频| 日韩精品一区二区在线播放| 久久在线电影| 亚洲欧洲在线视频| 美女扒开腿免费视频| 伊人亚洲精品| 色先锋资源久久综合| 国产一二三区在线播放| 黄色av电影在线观看| 国产婷婷精品av在线| 久久99精品久久久水蜜桃| 99精品久久久久久中文字幕| 日本视频中文字幕一区二区三区| 欧美激情视频一区二区| 美国精品一区二区| 欧美日韩伦理| 亚洲精品一区久久久久久| 妖精视频一区二区| 亚洲日本一区二区三区在线| 777a∨成人精品桃花网| 国产成人手机视频| 欧美韩国亚洲| 一本色道久久综合亚洲精品按摩| 国产不卡一区二区视频| 牛牛精品视频在线| 一卡二卡欧美日韩| 精品一区二区三区毛片| a级片国产精品自在拍在线播放| 国产精品美女久久久久久2018| 欧美日本韩国在线| 青青免费在线视频| 91看片淫黄大片一级在线观看| 国产欧美一区二区三区不卡高清| www.黄色国产| 国产成人午夜精品影院观看视频 | caoporn-草棚在线视频最| 日韩美女视频19| 艳母动漫在线免费观看| 麻豆视频在线| 亚洲色图视频网| 国产精品亚洲天堂| 青青在线视频| 亚洲国产成人av网| 波多野结衣之无限发射| 性欧美freesex顶级少妇| 欧美日韩中文字幕在线视频| 欧美激情国产精品日韩| 成人做爰视频www| 在线影视一区二区三区| 色天使在线观看| 精品国产乱码一区二区三区| 精品少妇一区二区三区视频免付费| 久久久精品人妻一区二区三区| www.神马久久| 精品无码久久久久久国产| brazzers精品成人一区| 色喇叭免费久久综合| 精品国产一区二区三区久久狼黑人| 欧美爱爱免费视频| 亚洲黄页一区| 国产精品久久久久91| 一级黄色a视频| 国产成人啪免费观看软件| 国产一区二区精品免费| 激情小视频在线| 中文字幕亚洲欧美在线不卡| www.夜夜爱| 快播电影网址老女人久久| 91麻豆精品91久久久久同性| 国产免费a级片| 国产成人三级| 欧美理论片在线观看| 天天操天天操天天操天天| 美国欧美日韩国产在线播放| 成人在线免费观看一区| 国产香蕉视频在线看| 亚洲色图.com| 黄色片视频在线免费观看| 国产91在线播放精品| 精品国产网站在线观看| mm131丰满少妇人体欣赏图| 我不卡手机影院| 97视频在线免费观看| 中文字幕二区三区| 99久久久无码国产精品| 亚洲一区二区三区加勒比| 国产精品国精产品一二| 欧美色视频在线观看| 国产午夜在线一区二区三区| 欧美a级成人淫片免费看| 午夜精品福利在线观看| 国产又大又黄的视频| 久久夜色精品国产噜噜av | 亚洲人成毛片在线播放女女| 国产精品视频区1| 午夜成人鲁丝片午夜精品| 综合久久久久综合| 动漫av免费观看| 久久a爱视频| 蜜臀久久99精品久久久无需会员| 国产精品第5页| 成人做爰69片免费看网站| 亚洲三区四区| 日韩免费va| 日韩av中文字幕在线| 欧美极品aaaaabbbbb| 免费av成人在线| 欧美国产视频在线观看| 国产www视频在线观看| 欧美日韩大陆在线| 日本人亚洲人jjzzjjz| 国产一级久久| 激情小说综合区| 爱情岛亚洲播放路线| 日韩亚洲欧美中文三级| 波多野结衣在线网址| 精品制服美女久久| 亚洲精品在线免费看| 欧美momandson| 亚洲欧美另类人妖| 国产在线一二区| 国产成人午夜精品5599| 日本美女爱爱视频| 精品国产不卡一区二区| 欧美精品一本久久男人的天堂| 亚洲资源在线播放| 国产精品免费久久| 少妇一级淫免费播放| 欧美一区电影| 国产美女精品免费电影| 中文字幕日本在线| 欧美日韩免费视频| 三级黄色录像视频| 国模大尺度一区二区三区| 亚洲午夜精品一区二区三区| 亚洲成人精品综合在线| 久久精品国产99国产精品澳门| 在线免费观看视频网站| 成人免费在线播放视频| 国产又粗又猛又爽又黄| 欧美激情aⅴ一区二区三区| 91久久偷偷做嫩草影院| 国模雨婷捆绑高清在线| 亚洲精品国产suv| 综合网在线观看| 国产蜜臀97一区二区三区| 色乱码一区二区三区在线| 国产精品久久观看| 亚洲iv一区二区三区| 国模私拍视频在线播放| 日韩电影在线观看中文字幕| 日日夜夜狠狠操| 国产精品成人一区二区三区夜夜夜 | 欧美视频你懂的| 久久嫩草捆绑紧缚| 高清在线成人网| 可以在线看的黄色网址| 日韩成人精品一区| 成人av影视在线| 91精品论坛| xx视频.9999.com| 农村少妇久久久久久久| 色婷婷av久久久久久久| 色噜噜噜噜噜噜| 国产福利精品导航| 精品一区二区中文字幕| 欧美电影免费| 国产精品久久久久久久久久直播| www.成人影院| 久久精品夜夜夜夜夜久久| 成人久久久精品国产乱码一区二区| 欧美日韩国产在线看| 貂蝉被到爽流白浆在线观看| 成人精品免费看| xx欧美撒尿嘘撒尿xx| 亚洲人体偷拍| 亚洲一区二区三区精品动漫| 欧美成人基地| 成人免费看片视频| 丝袜美腿一区| 欧美精品videossex性护士| 国产黄色在线播放| 亚洲国产91色在线| 91久久精品无码一区二区| 激情懂色av一区av二区av| 大吊一区二区三区| 91香蕉视频在线| 手机看片国产精品| 免费高清视频精品| 欧美亚洲一二三区| 国产一区二区三区四区老人| 一区二区免费在线观看| 妖精一区二区三区精品视频| 亚洲综合国产精品| av在线播放一区| 欧美一区视频在线| 国产乱妇乱子在线播视频播放网站| 少妇高潮 亚洲精品| 三级黄视频在线观看| 欧美成人福利视频| 国产片在线播放| 欧美色图12p| 欧美性受xxx黑人xyx性爽| 欧美日韩亚洲精品内裤| 国产在线视频99| 亚洲综合一二三区| 午夜免费激情视频| 日韩理论片网站| 国产成人一区二区在线观看| 91麻豆成人久久精品二区三区| 男人女人拔萝卜视频| 黑人精品欧美一区二区蜜桃| 91女神在线观看| 日韩不卡一区二区| 国产一区视频免费观看| 国产伦理一区| 成人一级片网站| 性色一区二区三区| 九色在线视频观看| 亚洲作爱视频| 国产91在线免费| 亚洲精品影院在线观看| 91免费黄视频| 亚洲精品系列| 日本三级免费观看| 免播放器亚洲| 日韩中文字幕二区| 天堂成人免费av电影一区| caopor在线视频| 日韩avvvv在线播放| 久久久久免费精品| 日本不卡123| 在线观看高清免费视频| 久久精品久久综合| 欧美日韩久久婷婷| 大桥未久av一区二区三区中文| 亚洲精品激情视频| 不卡的电视剧免费网站有什么| 国产精品扒开腿做爽爽爽a片唱戏 亚洲av成人精品一区二区三区 | 色先锋久久影院av| 蜜桃视频成人| 国产精品99视频| 亚洲一二三区在线| 国产精品7m凸凹视频分类| 国产系列第一页| 中文字幕日韩欧美精品高清在线| 国产精品一区在线免费观看| 欧美极品一区二区三区| 国产不卡一区二区视频| 久久久精品网| 91欧美视频在线| 国产一区二区影院| 在线观看亚洲免费视频| 久久蜜桃av一区二区天堂| 亚洲一级片在线播放| 亚洲日本电影在线| 国产无套内射又大又猛又粗又爽| 疯狂做受xxxx高潮欧美日本 | 在线观看一区不卡| 亚洲特级黄色片| 日韩女优制服丝袜电影| 五月婷婷免费视频| 色香阁99久久精品久久久| 超碰电影在线播放| 2019日本中文字幕| 日韩黄色三级在线观看| 国产一区二区自拍| 精品理论电影| 欧妇女乱妇女乱视频| 久久国产88| 中文字幕avav| 久久―日本道色综合久久| 成人涩涩小片视频日本| 午夜久久久久久久久久一区二区| 中国一区二区视频| 欧美精品一区二区精品网| 天天影视久久综合| 91av在线精品| 精品视频一区二区三区| 久久精品丝袜高跟鞋| 亚洲国产精品成人| 国产91对白刺激露脸在线观看| 国产在线播放一区| 国产三级视频网站| 一区二区三区日韩| 正在播放木下凛凛xv99| 亚洲大胆人体av| 黄色网在线播放| 日产日韩在线亚洲欧美 | 欧美日韩国产高清视频| 欧美日韩岛国| 一道本视频在线观看| 99在线精品免费| 久久久国产精品黄毛片| 欧美日韩精品一区二区三区 | 18岁网站在线观看| 国产99精品视频| 国产成人免费在线观看视频| 日韩欧美黄色动漫| 亚洲精品综合网| 理论片在线不卡免费观看| 色猫猫成人app| 欧美精品成人一区二区在线观看 | 亚洲第一成肉网| 欧美激情一区二区三区全黄| 成人精品免费在线观看| 精品日韩一区二区| 大地资源网3页在线观看| 国产精品美女www爽爽爽视频| 伊人春色精品| 青青草国产精品视频| 国产精品综合网| 亚洲伦理一区二区三区| 欧美日韩午夜在线视频| 男人的天堂在线| 青青草一区二区| 丝袜av一区| 欧美变态另类刺激| 成人的网站免费观看| 久久一级黄色片| 日韩一级黄色片| 婷婷色在线资源| 成人毛片网站| 国内精品福利| av av在线| 婷婷激情综合网| 无码精品一区二区三区在线| 91高清免费视频| 亚洲欧美tv| 免费日韩视频在线观看| 国产日韩欧美高清| 国产天堂第一区| 久久久精品一区| 国产一区二区av在线| www国产无套内射com| 国产.欧美.日韩| 日韩欧美a级片| 日韩高清不卡av| 在线观看精品| 日韩中文字幕一区| 狠狠色狠狠色综合日日91app| 国精品无码一区二区三区| 日韩色视频在线观看| www555久久| 蜜桃欧美视频| 久色婷婷小香蕉久久| 一区视频免费观看| 亚洲国产91色在线| 国产综合色区在线观看| 亚洲一区免费看| 成人自拍视频在线观看| 一级做a爰片久久毛片| 色妞欧美日韩在线| 亚洲**毛片| 97国产精东麻豆人妻电影| 日本一区二区综合亚洲| 国产免费高清视频| 久久久爽爽爽美女图片| 竹菊久久久久久久| 91小视频在线播放| 亚洲一区二区三区四区在线免费观看| 香蕉视频黄在线观看| 国产精品草莓在线免费观看| 永久亚洲成a人片777777| 日韩av手机在线播放| 欧美亚洲国产一区二区三区va| www红色一片_亚洲成a人片在线观看_| 国产v亚洲v天堂无码| 日韩中文字幕av电影| 欧美三根一起进三p| 国产午夜精品久久久 | 日韩制服丝袜先锋影音| 久草综合在线视频| 精品网站999www| 国模大尺度视频一区二区| 久久久999免费视频| 亚洲日本va在线观看| 久久手机免费观看| av免费精品一区二区三区| 日韩中文字幕一区二区三区| 538精品在线视频|