精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容

發(fā)布于 2025-2-27 12:41
瀏覽
0收藏

OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference

2025-02-25|SJTU, Shanghai AI Lab, NJU, FDU, ZJU|??54

???http://arxiv.org/abs/2502.18411v1????
????https://huggingface.co/papers/2502.18411????
????https://github.com/PhoenixZ810/OmniAlign-V???

研究背景與意義

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

隨著多模態(tài)大語言模型(MLLMs)的快速發(fā)展,現(xiàn)有的研究主要集中在提升模型的基礎能力,如物體識別、OCR等,而在與人類偏好對齊方面存在顯著差距。這種對齊的缺失直接影響了多模態(tài)對話交互中的用戶體驗。本文提出的OmniAlign-V數(shù)據(jù)集,旨在通過提供高質(zhì)量、多樣化的訓練樣本,顯著提升MLLMs與人類偏好的對齊能力。此外,本文還引入了MM-AlignBench,一個專門設計用于評估MLLMs與人類價值觀對齊能力的高質(zhì)量基準。

研究方法與創(chuàng)新

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

OmniAlign-V數(shù)據(jù)集的核心創(chuàng)新在于其多樣化的任務設計和高質(zhì)量的數(shù)據(jù)生成流程。首先,數(shù)據(jù)集將圖像分為自然圖像和信息圖表兩大類,并為每類圖像設計了不同的任務類型,如知識問答、推理任務和創(chuàng)造性任務。其次,通過圖像篩選策略,確保所選圖像具有豐富的語義信息,從而生成更具挑戰(zhàn)性和多樣性的問答對。

在數(shù)據(jù)生成過程中,OmniAlign-V采用了多階段的生成和優(yōu)化流程。對于自然圖像,使用GPT-4生成多樣化的問答對,并通過后處理步驟進一步優(yōu)化答案的質(zhì)量。對于信息圖表,設計了專門的提示詞,確保生成的問答對能夠深入挖掘圖像中的信息。此外,OmniAlign-V還引入了指令增強的知識問答,通過將復雜指令融入問題中,進一步提升模型的對齊能力。

實驗設計與結(jié)果分析

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

實驗結(jié)果表明,使用OmniAlign-V進行微調(diào)的MLLMs在多個基準測試中表現(xiàn)顯著提升。特別是在MM-AlignBench和WildVision等人類偏好對齊基準上,模型的性能得到了大幅改善。此外,OmniAlign-V在保持模型基礎能力的同時,進一步提升了其在復雜問答任務中的表現(xiàn)。

通過對比實驗,OmniAlign-V在多個任務類型上的表現(xiàn)均優(yōu)于現(xiàn)有的數(shù)據(jù)集。例如,在知識問答任務中,OmniAlign-V生成的問答對不僅涵蓋了廣泛的主題,還通過指令增強的方式提升了模型的指令遵循能力。在創(chuàng)造性任務中,OmniAlign-V通過多樣化的任務設計,顯著提升了模型在生成創(chuàng)意內(nèi)容方面的表現(xiàn)。

結(jié)論與展望

OmniAlign-V的引入為提升MLLMs與人類偏好的對齊能力提供了新的解決方案。通過多樣化的任務設計和高質(zhì)量的數(shù)據(jù)生成流程,OmniAlign-V顯著提升了模型在復雜問答任務中的表現(xiàn)。未來的研究可以進一步探索如何將OmniAlign-V與其他多模態(tài)數(shù)據(jù)集結(jié)合,以進一步提升模型的泛化能力和對齊效果。

此外,MM-AlignBench的引入為評估MLLMs的對齊能力提供了新的基準。通過精心設計的圖像和問題,MM-AlignBench能夠更全面地評估模型在真實世界場景中的表現(xiàn)。未來的工作可以進一步擴展MM-AlignBench的規(guī)模和多樣性,以覆蓋更多的應用場景和任務類型。

Introducing Visual Perception Token into Multimodal Large Language Model

2025-02-24|NUS|??5

???http://arxiv.org/abs/2502.17425v1????
????https://huggingface.co/papers/2502.17425????
????https://github.com/yu-rp/VisualPerceptionToken???

研究背景與意義

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

在當今的多模態(tài)大語言模型(MLLM)領(lǐng)域,視覺信息的處理能力直接影響模型在空間推理、細粒度理解等任務中的表現(xiàn)。然而,現(xiàn)有的MLLM系統(tǒng)缺乏自主控制其視覺感知過程的能力,例如無法選擇性地審查圖像的特定區(qū)域或聚焦于與特定對象類別相關(guān)的信息。這種局限性導致模型在處理復雜視覺任務時,往往依賴于手動設計的流程,限制了其在實際應用中的靈活性和效率。

本文提出的“視覺感知標記”(Visual Perception Token)概念,旨在賦予MLLM一種機制,使其能夠自主控制視覺感知過程。通過設計兩種類型的視覺感知標記——區(qū)域選擇標記(Region Selection Token)和視覺重編碼標記(Vision Re-Encoding Token),MLLM可以像生成文本一樣生成這些標記,并利用它們觸發(fā)額外的視覺感知動作。這一創(chuàng)新不僅提升了模型在空間推理和細粒度理解任務中的表現(xiàn),還為MLLM在視覺信息處理中的自主性開辟了新的研究方向。

研究方法與創(chuàng)新

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

本文的核心創(chuàng)新在于引入了視覺感知標記,使MLLM能夠自主控制其視覺感知過程。具體來說,區(qū)域選擇標記能夠明確識別圖像中需要進一步感知的特定區(qū)域,而視覺重編碼標記則利用其隱藏狀態(tài)作為控制信號,引導額外的視覺感知過程。這兩種標記的引入,使得MLLM在處理視覺信息時,能夠更加靈活和精準。

區(qū)域選擇標記區(qū)域選擇標記通過將圖像劃分為若干單元格,并使用這些單元格的索引來描述需要進一步感知的區(qū)域。這種方法避免了直接使用像素坐標的復雜性,簡化了模型的訓練過程。具體來說,模型生成一組區(qū)域選擇標記,指示圖像中需要裁剪的區(qū)域,然后將裁剪后的圖像重新輸入模型進行進一步處理。這種方法在處理文檔理解、OCR相關(guān)任務時尤為有效,因為它能夠直接提高圖像的分辨率,從而提升任務表現(xiàn)。

視覺重編碼標記視覺重編碼標記則通過觸發(fā)額外的視覺編碼器(如DINO或SAM模型)來重新編碼原始圖像,并將生成的視覺特征與原始視覺特征結(jié)合,輸入到MLLM中。視覺重編碼標記的隱藏狀態(tài)作為控制信號,能夠精細地控制最終輸入到語言模型的嵌入序列。這種方法在處理需要多次視覺感知的任務時,表現(xiàn)出顯著的優(yōu)勢。

訓練數(shù)據(jù)與模型架構(gòu)為了訓練MLLM使用視覺感知標記,本文構(gòu)建了一個包含829k樣本的訓練數(shù)據(jù)集,涵蓋了通用視覺問答(General VQA)、細粒度視覺問答(Fine-Grained VQA)、空間推理(Spatial Reasoning)和文本/OCR相關(guān)視覺問答(Text/OCR-Related VQA)等任務。模型架構(gòu)方面,本文在標準的MLLM基礎上,增加了額外的視覺編碼器和投影器,使得模型能夠處理視覺重編碼標記生成的額外視覺特征。

實驗設計與結(jié)果分析

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

本文通過一系列實驗驗證了視覺感知標記的有效性。實驗結(jié)果表明,引入視覺感知標記后,2B參數(shù)的模型在多個任務中的表現(xiàn)顯著提升,甚至超過了7B參數(shù)的基線模型。具體來說,在空間推理和細粒度視覺問答任務中,2B+VPT模型的性能分別提升了34.6%和32.7%。此外,視覺感知標記在零樣本設置下也表現(xiàn)出色,進一步證明了其泛化能力。

實驗結(jié)果在通用視覺問答任務中,2B+VPT模型的表現(xiàn)與7B模型相當,但在空間推理和細粒度視覺問答任務中,2B+VPT模型顯著優(yōu)于7B模型。例如,在CUB-200-2011數(shù)據(jù)集上,2B+VPT模型的性能提升了20.7%。此外,在處理低分辨率圖像時,2B+VPT模型的表現(xiàn)也優(yōu)于7B模型,證明了視覺感知標記在不同分辨率下的有效性。

案例分析通過具體案例的分析,本文展示了視覺感知標記在處理復雜視覺任務時的優(yōu)勢。例如,在處理文檔理解任務時,區(qū)域選擇標記能夠精確定位圖像中的小區(qū)域(如簽名、頁腳等),從而顯著提升OCR任務的準確性。在處理空間推理任務時,視覺重編碼標記能夠通過多次視覺感知,增強模型對空間關(guān)系的理解。

結(jié)論與展望

本文提出的視覺感知標記為MLLM在視覺信息處理中的自主性提供了新的解決方案。通過區(qū)域選擇標記和視覺重編碼標記,MLLM能夠更加靈活和精準地處理視覺信息,顯著提升了其在空間推理、細粒度理解等任務中的表現(xiàn)。未來的研究方向可以進一步探索視覺感知標記在其他多模態(tài)任務中的應用,以及如何通過更復雜的控制機制,進一步提升MLLM的視覺感知能力。

此外,本文的實驗結(jié)果表明,視覺感知標記在處理低分辨率圖像時也表現(xiàn)出色,這為在資源受限環(huán)境下的應用提供了新的可能性。未來的工作可以進一步優(yōu)化視覺感知標記的訓練過程,探索如何在不增加模型參數(shù)的情況下,進一步提升其性能。

總之,視覺感知標記的引入為MLLM在視覺信息處理中的自主性開辟了新的研究方向,具有廣泛的應用前景。

本文轉(zhuǎn)載自 ??AI研究前瞻??,作者: 胡耀淇

收藏
回復
舉報
回復
相關(guān)推薦
日韩av手机在线免费观看| 免费在线观看污网站| 婷婷五月综合激情| 日韩中文字幕1| 日韩在线观看免费| 少妇搡bbbb搡bbb搡打电话| 筱崎爱全乳无删减在线观看| 亚洲国产精品国自产拍av| 亚洲自拍偷拍视频| wwwxxx亚洲| 99国产**精品****| 亚洲精品美女视频| 中文字幕久久av| 国产免费拔擦拔擦8x高清在线人| 国产亚洲一区二区三区四区 | 69堂免费精品视频在线播放| 亚洲天堂av一区| 精品综合在线| 国产一区二区三区三州| 亚洲黑丝一区二区| 精品国内产的精品视频在线观看| 亚州av综合色区无码一区| 成人在线观看免费视频| 精品久久久久久久久久| 成年人免费观看的视频| 免费福利在线视频| 成人午夜视频网站| 成人国产精品免费视频| 中文字幕xxxx| 99成人免费视频| 久久国产精品视频| 综合 欧美 亚洲日本| 精品伊人久久久| 日韩一区二区三区精品视频| 无需播放器的av| 国产在线美女| 亚洲国产精品自拍| 中国黄色录像片| porn视频在线观看| 久久先锋影音av| 国产一区二区三区奇米久涩| 国产不卡av在线播放| 久久精品国产99久久6| 国产成人精品视频在线| 日本最新中文字幕| 国产一区久久| 欧美另类极品videosbestfree| 免费黄色在线网址| 精品午夜久久| 一区三区二区视频| 中文字幕网站在线观看| 欧美女优在线视频| 亚洲精品中文字幕女同| 人妻少妇精品视频一区二区三区| 9999久久久久| 亚洲高清一二三区| 99re这里只有| 色愁久久久久久| 日韩成人av网| 黄色短视频在线观看| 欧美色资源站| 日韩麻豆第一页| www.中文字幕av| 成人3d精品动漫精品一二三| 亚洲天堂视频在线观看| 熟女少妇内射日韩亚洲| 成人黄色av| 日韩一区二区三区国产| 青青操在线视频观看| 亚洲电影在线一区二区三区| 欧美大成色www永久网站婷| 黄页网站免费观看| 亚洲激情亚洲| 欧洲亚洲免费视频| 五月婷婷丁香在线| 蜜桃av一区二区| 成人一区二区电影| 亚洲女人18毛片水真多| 成人av在线播放网站| 国产女人水真多18毛片18精品| 国产91免费看| 久久婷婷国产综合国色天香| 先锋在线资源一区二区三区| 国产原创在线观看| 亚洲成人综合网站| www.四虎成人| 成人在线分类| 亚洲黄色片网站| 久久精品—区二区三区舞蹈| 911精品美国片911久久久 | a天堂资源在线| 狠狠色狠色综合曰曰| 久久久久久久片| 激情久久免费视频| 日韩精品高清视频| 免费看一级黄色| 在线精品一区二区| 国产精品白丝jk喷水视频一区| 一级做a爱片久久毛片| 成人丝袜18视频在线观看| 日本不卡在线播放| a天堂中文在线官网在线| 疯狂做受xxxx高潮欧美日本 | 日韩中文视频| 日韩欧美一级二级三级| 免费在线观看你懂的| 久久精品亚洲欧美日韩精品中文字幕| 久久频这里精品99香蕉| 中文字幕丰满人伦在线| 成人av电影在线| 中文字幕一区二区三区有限公司| 成年人视频免费在线播放| 欧美系列一区二区| 日本不卡视频一区| 久久亚洲精品中文字幕蜜潮电影| 97精品一区二区三区| 亚洲图片小说视频| 久久久久久久久免费| 激情五月婷婷六月| 色成人综合网| 亚洲欧美激情一区| 精品无码人妻一区二区三区| 美国毛片一区二区| 欧美一区二区福利| 白白色在线观看| 欧美丰满嫩嫩电影| 亚洲精品色午夜无码专区日韩| 国产一区日韩一区| 91精品视频网站| 精品乱码一区二区三四区视频| 亚洲精品高清视频在线观看| 青青青国产在线视频| 网红女主播少妇精品视频| 欧美韩国理论所午夜片917电影| 伊人久久亚洲综合| ww亚洲ww在线观看国产| 一二三四视频社区在线| 色播一区二区| 久久精品视频va| 在线播放一级片| 欧美激情一区在线观看| 白嫩少妇丰满一区二区| 最新国产一区| 欧美中文在线字幕| 亚洲欧美日本在线观看| 亚洲福利国产精品| 少妇献身老头系列| 欧美在线二区| 96sao精品视频在线观看| 香港伦理在线| 7777精品伊人久久久大香线蕉超级流畅 | 久久一区二区三| 国产一区啦啦啦在线观看| 午夜精品一区二区在线观看| 最新日韩一区| 自拍偷拍亚洲在线| 亚洲性生活大片| 国产精品成人在线观看 | 高清在线成人网| 日韩人妻一区二区三区蜜桃视频| www久久久| 操91在线视频| 亚洲欧美激情另类| 无码av免费一区二区三区试看 | 亚洲图片欧美在线| 亚洲色图一区二区| av在线网站免费观看| 欧美久久视频| 精品视频在线观看| 新片速递亚洲合集欧美合集| 一二美女精品欧洲| 国产又粗又长又大视频| 亚洲三级小视频| youjizz.com日本| 性伦欧美刺激片在线观看| 欧美一区免费视频| 成人精品动漫| 欧美福利视频在线观看| 香港一级纯黄大片| 欧美亚洲一区二区在线| 在线免费看av网站| 99久久er热在这里只有精品15| 无码人妻丰满熟妇区毛片18| 日韩一区二区三区免费播放| 91蜜桃网站免费观看| 九色porny视频在线观看| 亚洲天堂一区二区三区| 国产极品久久久| 精品欧美激情精品一区| 成人在线手机视频| 国产精品456| 国产成人精品视频免费看| 色综合久久网| 精品国产一区二区三区麻豆小说| 在线国产成人影院| 精品中文字幕视频| 欧美成人免费| 日韩欧美自拍偷拍| 国产精品视频一区在线观看| 国产精品美女久久久久av爽李琼| 能看毛片的网站| 日韩精品亚洲一区二区三区免费| www.亚洲一区二区| 免费av一区二区三区四区| 成人观看高清在线观看免费| 亚洲综合电影| 欧美高清第一页| www视频在线观看免费| 日韩视频免费观看高清完整版| 五月婷婷激情视频| 亚洲一区二区欧美激情| 四虎成人免费影院| 99视频精品在线| 小明看看成人免费视频| 蘑菇福利视频一区播放| 久久这里只有精品18| 天天久久综合| 日韩欧美亚洲v片| 国产精品99久久免费观看| 国产精品私拍pans大尺度在线| 日韩激情电影免费看| 免费av一区二区| 一区二区三区视频网站| 日韩久久午夜影院| 日本美女一级片| 欧美一级片免费看| 一区二区乱子伦在线播放| 狠狠色噜噜狠狠狠狠97| 国产精品suv一区二区69| 亚洲视频一区在线| 香蕉久久久久久久| 国产三级精品在线| 国产精品jizz| 99久久精品一区| 久久久久久久穴| 国产精品一区二区黑丝| 亚洲一区二区在线视频观看| 免费高清不卡av| 欧美精品aaaa| 男男视频亚洲欧美| 99免费视频观看| 天堂成人免费av电影一区| 欧美亚洲另类色图| 国产女优一区| 欧美精品99久久| 国产精品视区| 日本在线观看a| 国产精品毛片| 国产91在线视频观看| 亚洲欧美日韩国产综合精品二区 | 天堂av网手机版| 国产精品美女视频| 久久精品亚洲a| 亚洲视频精选在线| 精品欧美一区二区久久久久| 亚洲欧美色一区| 欧美日韩成人免费观看| 亚洲国产精品一区二区www在线| 久久精品www| 亚洲国产成人porn| 毛片在线免费视频| 色天使色偷偷av一区二区| 一级黄色av片| 欧美日韩高清不卡| 国产美女自慰在线观看| 日韩免费看网站| 黄色av中文字幕| 日韩久久午夜影院| jizz在线免费观看| 久久伊人91精品综合网站| 182tv在线播放| 97免费中文视频在线观看| 一区二区电影免费观看| 国产精品久久网| 久久伦理中文字幕| 国产亚洲一区在线播放| 国产欧美日韩影院| 久久久一二三四| 伊人蜜桃色噜噜激情综合| 欧美精品一区二区三区免费播放| 蜜臀久久99精品久久久画质超高清 | 日韩欧美激情在线| 欧美一区二区在线观看视频| 亚洲欧美日韩精品久久奇米色影视| 成全电影播放在线观看国语| 久久综合久久八八| 美女高潮视频在线看| 国产精品爽爽爽| 第四色在线一区二区| 欧美性天天影院| 在线国产一区| aⅴ在线免费观看| 国产一区二区三区美女| 51调教丨国产调教视频| 亚洲图片你懂的| 国产美女激情视频| 91精品国产综合久久福利软件 | 国产香蕉一区二区三区| 国产精品毛片| 中文字幕55页| 国产亚洲一本大道中文在线| 黄页网站免费观看| 欧美日精品一区视频| 欧美一级免费片| 日韩视频精品在线| 乡村艳史在线观看| 999在线观看免费大全电视剧| 国产精品一区二区av日韩在线| 糖心vlog在线免费观看| 蜜桃伊人久久| 四虎永久免费观看| 最新久久zyz资源站| 最新中文字幕一区| 精品免费日韩av| 三区四区在线视频| 17婷婷久久www| 日韩成人一区| 欧美激情视频一区二区三区| 欧美三区不卡| 五月激情婷婷在线| 久久婷婷国产综合精品青草| 国产一级淫片免费| 337p亚洲精品色噜噜狠狠| 免费国产在线视频| 97在线视频观看| 亚洲三级av| 经典三级在线视频| 久久精品理论片| 久久久久亚洲av无码a片| 精品人伦一区二区三区蜜桃网站 | 日韩男人的天堂| 欧美成人午夜电影| a视频在线免费看| 成人国产精品一区| 日本道不卡免费一区| 少妇高清精品毛片在线视频| 97久久精品人人爽人人爽蜜臀| 欧美精品一区二区成人| 337p亚洲精品色噜噜噜| 久操视频在线观看| 成人a视频在线观看| 欧美一级精品片在线看| 国产福利影院在线观看| 久久精品亚洲精品国产欧美| 国产三级精品三级在线观看| 日韩电影网在线| 伊人网在线播放| 蜜桃精品久久久久久久免费影院| 99精品热6080yy久久| 亚洲一区二区三区综合| 午夜精品久久久久久| 日本黄视频在线观看| 午夜精品在线观看| 日韩av系列| 成年网站在线免费观看| 久久久久久久久久久黄色| 无码人妻精品一区二区三区不卡 | 在线观看国产日韩| 国产毛片av在线| 国产精品色婷婷视频| 日本欧美肥老太交大片| www.国产视频.com| 亚洲色图欧美偷拍| jizz国产视频| 久久久久久久久爱| 日韩成人一级| 免费黄色一级网站| 中文字幕亚洲一区二区va在线| 国产又大又粗又硬| 欧美激情中文字幕在线| 欧美wwwsss9999| jizz欧美激情18| 亚洲男女毛片无遮挡| 亚洲成熟女性毛茸茸| 91精品国产电影| 日韩www.| 精品人妻一区二区三| 精品久久久久国产| 国产在线一二三区| 91精品综合视频| 亚洲国产激情| 亚欧洲乱码视频| 欧美精品少妇一区二区三区| www.综合网.com| 日韩中文字幕一区| 国产激情视频一区二区三区欧美| 日韩欧美高清在线观看| 怡红院精品视频| 日韩高清在线观看一区二区| 精品这里只有精品| 国产精品人成在线观看免费 | 亚洲乱码国产乱码精品精天堂 | 在线精品视频一区二区三四| 二区在线播放| 久久久久综合一区二区三区| 久久99这里只有精品| 国产无套内射又大又猛又粗又爽| 国产一区二区三区日韩欧美| 在线日韩成人| 国产精品久久a|