精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態訓練后模型能力雪崩,上海AI Lab全面探索MLLM偏好對齊與模態融合

人工智能 新聞
MLLM的回復質量下降可能是因為經過了多模態數據訓練之后,LLM本身的能力退化。

在實際應用過程中,閉源模型(GPT-4o)等在回復的全面性、完備性、美觀性等方面展示出了不俗的表現。

與之相反的是,在General VQA任務上表現最好的開源模型(如InternVL2-78B)在面對開放式、需要知識儲備的問題時,表現不盡人意:

圖片InternVL2-78B和GPT-4o在回復的完備性和美觀性上有較大差距

上述現象引發了上海交大、上海AI Lab等聯合團隊的思考。

他們首先猜測:MLLM的回復質量下降可能是因為經過了多模態數據訓練之后,LLM本身的能力退化

因此分別測試了多個主流開源模型在主流的純語言對齊Benchmark(AlignBench/AlpacaEval2/ArenaHard)上的性能:

圖片得分由Qwen2.5-72B進行judge

結果顯示,經過多模態訓練的大語言模型在語言主觀基準上的性能簡直可以用雪崩來形容。

既然如此,那是不是說,在多模態數據中加入更多更好的語言數據就可以了呢?團隊又進一步做了如下實驗:

采用LLaVA框架,使用最新的語言模型Internlm2.5-7B作為base,用LLaVANext-780k高質量多模態數據作為Baseline。已知在LLaVANext-780k中,包含40k左右的來自ShareGPT的數據。

由于ShareGPT年代較為久遠,所以選擇了最新的兩個開源語言sft數據集,Magpie-LLaMA3.3以及Condor。將原始的ShareGPT數據分別更換為Magpie以及Condor進行了實驗,并在語言對齊基準、多模態對齊基準(WildVison)、General VQA基準(MMVet/MMBench/AI2D/OCRBench)上進行了全面評測:

圖片為了展示性能差異,此處AlpacaEval2和Arenahard的結果均與GPT3.5進行對比

加入了高質量的語言數據之后,模型在語言基準上的能力確實提升了;但是,無論是多模態主觀對齊還是普通VQA任務,都出現了性能下降的情況。

因此推測:語言數據對多模態對齊能力的影響是十分有限的,在General VQA任務以外,仍然需要帶有開放式問題以及完備回答的多模態訓練數據。

Dataset Construction

基于以上觀察,當前的多模態數據過于看重VQA任務的能力,因此數據面臨答案過于簡短、單一,缺少對預訓練知識的運用與理解的問題。基于以上觀點以及從純語言數據組成中吸取的經驗,團隊提出多模態數據還應包含以下特點:

  1. 開放式,創造性,需要預訓練知識的問題。
  2. 全面,完備,美觀,符合指令跟隨的回答。

基于以上兩點提出了OmniAlign-V數據構建Pipeline:

圖片Pipeline of OmniAlign-V

根據圖片場景,首先將圖片分為自然圖片(Natural)以及信息圖片(Infographic)。鑒于希望得到包含豐富信息的數據,因此首先對自然圖片進行了圖像復雜度以及物體種類數目的兩輪篩選,確保篩選出的圖片具有豐富的語義信息。

其次,將Natural圖片分為Knowledge/Creation/Inferential三類任務,將信息圖片分為Chart/Diagram/Poster/Art四類任務,對不同任務分別應用對應的精心設計的Pipeline以及GPT-4o生成對話數據。而后,對Knowledge/Inferential/Chart分別應用不同的后處理優化,增強了Inferencial和Chart數據的完備性和準確性,在Knowledge基礎上額外添加了Instruction-Following指令,將其作為Instruction-Following任務。最終,OmniAlign-V-SFT包含了205k高質量的多模態數據。

團隊發現OmniAlign-V-SFT中的回復質量較高,很適合作為DPO數據中的positive sample。因此通過對LLaVANext-Internlm2.5-7B模型的輸出應用reject sampling,得到了對應的negative sample,并由此生成了OmniAlign-V-DPO數據集。

此外還發現當前缺少高質量的多模態主觀對齊基準。當前的基準當中面臨圖像質量差,問題模糊/多樣性差等問題。因此構建了MM-AlignBench多模態對齊基準。從經過預篩選的3000+張圖片中人工挑選了252張分布多樣且高質量的圖片,每張圖片以及對應的問題都經過人工審查,確保圖片和任務問題的多樣性以及準確性,合理性。

圖片

實驗結果

在LLaVA/LLaVA-Next上分別采用Internlm2.5-7B/Qwen2.5-32B進行了實驗,并在三個多模態對齊基準以及五個主流VQA基準上進行了評測,結果如下:

圖片SFT多模態評測結果

可以看出,在添加了OmniAlign-V-SFT數據集后,MLLM在三個多模態對齊基準上的表現均有大幅提升;并且在多個General VQA Benchmark上均有不同程度的漲點,尤其是在MMVet和MMMU上漲點十分顯著;LLaVANext-Qwen2.5-32B甚至在MMVet和MMMU上分別增加了+9.2和+5.5。這有力驗證了OmniAlign-V數據集的有效性。

此外還發現,經過OmniAlign-V-SFT訓練后,模型在語言對齊基準上也有一定程度的上漲:

圖片

△SFT語言評測結果

這也驗證了,當添加部分高質量的多模態對齊數據后,能夠有效減少LLM在多模態訓練當中面臨的語言能力退化問題。

此外,采用OmniAlign-V-DPO進行DPO訓練后,模型的對齊能力進一步增強:

圖片DPO實驗結果

實驗結果顯示,當模型完全沒有接受長上下文類似的數據訓練時,在DPO階段應用OmniAlign-V-DPO并不能顯著地提升模型的對齊;而對于經過高質量長上下文訓練的模型而言,OmniAlign-V-DPO可以進一步顯著激發模型的對齊能力。尤其是在經過大規模訓練的開源模型(InternVL2-8B)上,模型的性能提升尤其明顯。

MM-AlignBench已經支持到VLMEvalkit,用于在多個MLLM上進行快捷評測。團隊測試了當前主流MLLM在MM-AlignBench上的結果:

圖片

MM-AlignBench Leaderboard

經過SFT+DPO數據后,LLaVANext-OA-32B-DPO的對齊性能提升明顯,在MMAlignBench上的性能已經超越了QwenVL2-72B。

與此同時也可以看出,即使是QwenVL2-72B和InternVL2-78B,在MMAlignBench上的表現距離閉源模型(GPT/Gemini/Claude Series)也有較大的差距

進一步對MM-AlignBench和其他General VQA Benchmark計算相關度,SRCC score如下所示:

圖片

MM-AlignBench與其他基準的相關性統計

可以發現,MM-AlignBench 與現有的多模態評測基準(如 MMBench、OCRBench 等 VQA Benchmark)之間的相關性極低,但卻與 MMMU 表現出極高的相關性。作為一項涵蓋大量跨學科任務的評測基準,MMMU 對模型的知識先驗深度和廣度提出了極高的要求。盡管 MMMU 采用選擇題形式,答案具有唯一正確解,而 MM-AlignBench 則以開放式問答為主,兩者的題型設計存在顯著差異,但它們所考察的核心能力卻高度相似。這一現象表明,MM-AlignBench 不僅覆蓋了廣泛的任務領域,還深入挖掘了模型在知識先驗上的表現,進一步驗證了其評測維度的全面性與挑戰性。

Future Work

上述研究不僅深入探討了多模態大語言模型的對齊能力,更引發了作者團隊對一個核心問題的全新思考:

究竟什么才是通向真正模態融合的正確路徑?在多模態微調過程中,大語言模型往往會面臨一個棘手的問題——語言能力的“災難性遺忘”。然而,像GPT-4o等閉源模型卻能夠成功實現文本與圖像模態的深度融合,充分釋放其龐大的預訓練語言知識潛能。這背后的技術路線究竟是如何設計的?又是怎樣做到如此高效且精準的模態融合的?

這些問題無疑為我們指明了未來探索的重要方向。

Paper: https://arxiv.org/abs/2502.18411
Github: https://github.com/PhoenixZ810/OmniAlign-V

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-07 00:00:00

多模態大模型

2024-11-04 13:30:00

模型AI

2024-10-25 14:30:00

模型AI

2025-10-20 09:02:00

2025-01-08 08:21:16

2024-11-13 09:39:13

2024-05-21 07:54:30

視頻多模態語義檢索算法

2025-09-16 10:28:57

2025-06-03 08:22:00

模型評估視頻

2025-05-21 08:47:00

2025-09-16 09:35:52

2024-12-09 08:15:43

2024-12-30 00:01:00

多模態大模型Python

2022-09-01 16:58:52

DTW算法鴻蒙

2025-07-29 08:40:00

模型AILLM

2024-05-10 06:59:06

2023-06-08 11:32:00

模型論文

2024-08-30 12:58:43

AI多模態技術

2024-12-12 00:25:09

點贊
收藏

51CTO技術棧公眾號

悠悠色在线精品| 91精品论坛| 国产九九视频一区二区三区| 久久99久久99精品中文字幕| 影音先锋人妻啪啪av资源网站| 人狥杂交一区欧美二区| 中文字幕欧美区| 91国产在线播放| 成人毛片在线播放| 亚洲五月综合| 亚洲欧美日韩久久久久久| 在线观看免费不卡av| 888av在线视频| 亚洲国产精品传媒在线观看| 国产高清在线一区| 中文字幕在线观看免费高清 | 国产精品嫩草影院com| 91在线中文字幕| 玖草视频在线观看| 97色婷婷成人综合在线观看| 丁香五六月婷婷久久激情| 一区二区三区四区国产| 无码人妻精品一区二区三区9厂| 日韩一区自拍| 亚洲欧美成人在线| av在线天堂网| 日韩一区二区三免费高清在线观看| 久久影院视频免费| 3d动漫啪啪精品一区二区免费| 无码人妻精品一区二区三区9厂 | 欧美日韩在线二区| 亚洲成色777777女色窝| 91亚洲一区二区| 一广人看www在线观看免费视频| 国产成人av一区二区三区在线观看| 国产高清在线不卡| 波多野吉衣中文字幕| 日韩欧美中文字幕在线视频 | 精品久久久久久久久久久aⅴ| 欧美成人精品高清在线播放| 日日干日日操日日射| 超碰国产在线观看| av电影天堂一区二区在线观看| 亚洲一区二区三区香蕉 | 欧美mv日韩mv国产网站app| 一区二区xxx| 久久亚洲精品爱爱| 色久优优欧美色久优优| 久久精品视频16| av在线理伦电影| 亚洲午夜在线视频| 亚洲 欧美 综合 另类 中字| 蜜桃成人365av| 亚洲精品久久久久久国产精华液| 二级片在线观看| 麻豆网站视频在线观看| 综合色中文字幕| 99亚洲精品视频| 黄色一级片在线观看| 亚洲同性同志一二三专区| 亚洲成色www久久网站| 国产精品二线| 国产精品久线观看视频| 制服国产精品| 宅男在线观看免费高清网站| 亚洲影院理伦片| 给我免费播放片在线观看| 大桥未久在线视频| 欧美小视频在线| 九热视频在线观看| 久久av影院| 日韩一级黄色大片| 国产无限制自拍| 91豆花视频在线播放| 疯狂做受xxxx高潮欧美日本| 99999精品视频| 欧美精品资源| 欧美一区二区三区四区五区| aaa黄色大片| 欧美人妖视频| 在线视频欧美日韩精品| 日本精品在线免费观看| 在线日韩av| 中文字幕日韩欧美在线视频| 看黄色录像一级片| 欧美aaaaa级| 亚洲人成在线观看| 久久久久久久久久久影视| 一区二区亚洲视频| 亚洲跨种族黑人xxx| 免费观看特级毛片| 狠狠爱成人网| 国产精品久久久久久久久男| 国产女人高潮时对白| 顶级嫩模精品视频在线看| 欧美日韩大片一区二区三区| 日本在线天堂| 精品久久久久久久久久久| 一级在线免费视频| jizz18欧美18| 欧美久久久久久久久中文字幕| 波多野结衣免费观看| 亚洲动漫在线观看| 久久香蕉国产线看观看av| 少妇一级淫片免费放中国| 欧美在线免费| 青青草一区二区| 99国产精品99| 国产欧美精品一区二区三区四区 | 欧美jizz18性欧美| 欧美日韩国产中文字幕 | 久久久国产影院| av图片在线观看| 国产精品99久久久久久宅男| 日本在线一区| 97久久人人超碰caoprom| 欧美日韩成人综合| 国产精品密蕾丝袜| 一区二区三区国产在线| 亚洲最大福利网| av每日在线更新| 日韩欧美国产视频| 特黄特色免费视频| 91精品秘密在线观看| 国产99视频精品免视看7| 乱精品一区字幕二区| 国产精品你懂的在线| 久草综合在线观看| 午夜精品影视国产一区在线麻豆| 欧美成人精品一区二区| 亚洲一区中文字幕在线| 久久精品免费在线观看| 凹凸国产熟女精品视频| 黄色免费大全亚洲| 久久99视频免费| 国产女18毛片多18精品| 国产精品福利一区二区| 手机视频在线观看| 精品国产aⅴ| 欧美一区二区三区艳史| 手机av在线免费观看| 亚洲自拍另类综合| 真实乱偷全部视频| 欧美日韩视频| aa成人免费视频| 中文字幕伦理免费在线视频| 制服丝袜亚洲色图| 天天天天天天天天操| 国产在线视频不卡二| 免费久久久久久| 久久久久久久久久久久电影| 不卡av在线网站| 国产绿帽一区二区三区| √…a在线天堂一区| 国产高清av片| 欧美视频不卡| 精品国产乱码一区二区三区四区 | 日韩另类视频| 国产亚洲美女久久| 无码人妻av一区二区三区波多野| 久久精品欧美一区二区三区麻豆 | 国产 欧美 日韩 在线| 91在线精品一区二区| 欧美日韩中文在线视频| 亚洲男人都懂第一日本| 国产成人97精品免费看片| h视频在线观看免费| 欧美日韩另类一区| 欧美三级小视频| 不卡一区二区三区四区| 日韩毛片在线免费看| 男人天堂久久| 久久九九免费视频| 韩国av在线免费观看| 天天色 色综合| 五月天精品视频| 久久99久久精品欧美| 国产人妻人伦精品| 国产综合色在线观看| 久久精品99久久久久久久久| 亚洲精品一区二区口爆| 欧美性猛交xxxx| 91视频最新网址| 成人激情综合网站| 91色国产在线| 欧美.日韩.国产.一区.二区| 精品一区久久久| 日本亚洲欧洲无免费码在线| 欧美激情手机在线视频| 国产大片在线免费观看| 日韩视频123| 亚洲 日本 欧美 中文幕| 亚洲欧美在线观看| 天天躁日日躁狠狠躁av麻豆男男| 日韩高清一级片| 国产 欧美 日本| 亚洲区小说区图片区qvod| 91亚洲精品一区| 欧洲一级精品| 久久久久久国产精品| av在线首页| 亚洲激情视频在线播放| 精品无码av在线| 国产日产亚洲精品系列| 在线观看免费视频国产| 麻豆国产精品一区二区三区 | 亚洲视频重口味| 91免费国产在线| 中文字幕欧美视频| 美腿丝袜亚洲三区| 日韩av在线综合| 国产一区二区三区自拍| 中文字幕中文字幕在线中一区高清| 久久国产精品色av免费看| 91久久精品www人人做人人爽| 成人日韩精品| 欧美专区中文字幕| 高h视频在线播放| 久久av资源网站| 午夜在线视频播放| 亚洲视频在线看| 亚洲av成人精品毛片| 欧美zozo另类异族| av男人天堂网| 日韩一区二区三区四区五区六区| 天堂网一区二区| 欧美特级www| 日韩少妇裸体做爰视频| 亚洲精品久久久蜜桃| 欧美特级一级片| 亚洲视频在线观看一区| 大胸美女被爆操| 国产清纯在线一区二区www| 一二三不卡视频| 99在线热播精品免费| 国产精品99精品无码视亚| 国产精品一区三区| 五月天婷婷在线观看视频| 久久国产剧场电影| 无需播放器的av| 男人的j进女人的j一区| www.99在线| 日韩电影一区二区三区| 不卡av免费在线| 奇米在线7777在线精品| 狠狠热免费视频| 久久精品国产在热久久| 日韩欧美国产片| 精品一区二区综合| 亚洲天堂网站在线| 国产成人午夜精品影院观看视频 | 久久免费视频在线观看| 7777kkk亚洲综合欧美网站| 国语自产精品视频在线看抢先版图片 | 成人毛片老司机大片| 久久免费精品国产| a级高清视频欧美日韩| 欧美高清性xxxx| 久久精品视频网| 日本视频在线免费| 亚洲精品中文字幕在线观看| 人妻互换一二三区激情视频| 国产成人自拍网| 中文字幕免费在线播放| 久久久综合视频| 91麻豆制片厂| 怡红院av一区二区三区| 国产一级淫片a| 色先锋aa成人| 国产wwwxxx| 亚洲国产精品一区二区三区| 黄色av网址在线免费观看| 自拍偷拍亚洲欧美| 99自拍视频在线观看| 97视频在线观看亚洲| 亚洲天堂一区二区| 91久久精品视频| 久久aimee| 亚洲永久激情精品| 黄色一区二区三区四区| 成年人视频在线免费| 国产主播一区二区三区| 影音先锋黄色资源| 中文乱码免费一区二区| 免费三片在线播放| 色视频一区二区| 国产不卡av在线播放| 亚洲欧美精品一区二区| 成人看av片| 日本高清视频一区| 国内精品视频| 欧美婷婷久久| 欧美激情视频一区二区三区在线播放 | 日本不卡视频一二三区| 丰满人妻一区二区三区大胸| 91网址在线看| 妺妺窝人体色www婷婷| 色就色 综合激情| 少妇人妻偷人精品一区二区| 一区二区欧美亚洲| heyzo一区| 国产综合色香蕉精品| 亚洲妇女av| 国产一区二区三区在线免费| 日韩电影免费在线观看网站| 免费黄色三级网站| 一区二区中文视频| 成人av网站在线播放| 精品国产污网站| 麻豆视频在线免费观看| 国产精品91视频| 三级精品视频| 日本黄色片一级片| 日韩精品首页| 成熟丰满熟妇高潮xxxxx视频| 久久99国产精品久久99果冻传媒| 9.1成人看片| 亚洲国产一二三| 国产xxxx孕妇| 久久这里只有精品视频首页| 97精品国产99久久久久久免费| 国产一区再线| 亚洲视频中文| 中国特级黄色片| 亚洲精品免费一二三区| 国产精品久久久久久久一区二区| 777午夜精品免费视频| 久久av少妇| 日本成人免费在线| 日韩在线麻豆| 日韩网址在线观看| 99久久99久久免费精品蜜臀| 久久久一区二区三区四区| 6080日韩午夜伦伦午夜伦| 超碰免费97在线观看| 国产精品国产自产拍高清av水多 | 成人免费a级片| 国产麻豆精品在线| 欧美日韩一级大片| 欧美一级日韩免费不卡| 国产原创在线观看| 亚洲va久久久噜噜噜久久天堂| 国产精品久久观看| 精品综合久久久久| 最新热久久免费视频| 国产精品久久久久久久久久久久久久久久久久 | 国产第一页在线视频| 国产不卡一区二区在线观看| 欧美视频四区| 中文视频在线观看| 欧美色播在线播放| 国产视频精品久久| 国产精品视频1区| 久久在线播放| 毛片毛片毛片毛片毛| 一区二区免费在线播放| 日韩性xxxx| 清纯唯美亚洲激情| 欧美一区二区三区激情视频| www.se五月| 亚洲精品免费在线播放| 婷婷色在线视频| 国产成人激情小视频| 日韩精品欧美| av影片在线播放| 婷婷夜色潮精品综合在线| 青青草视频免费在线观看| 国产精品视频xxxx| 欧美在线91| 四虎永久免费影院| 欧美综合视频在线观看| www免费在线观看| 国产免费一区二区| 日韩福利电影在线| 放荡的美妇在线播放| 亚洲精品福利视频| 成人国产精品入口免费视频| 免费成人进口网站| 91丨九色丨蝌蚪丨老版| 亚洲av综合一区| 欧美日韩国产成人| 国产伦精品一区二区三区视频 | 欧美区视频在线观看| 国内高清免费在线视频| 青青草原成人| 成人综合在线观看| 成人黄色免费网| 欧美精品第一页在线播放| 国产成人精品999在线观看| 三日本三级少妇三级99| 日韩欧美在线字幕| 午夜av在线免费观看| 欧美影视一区二区| 国产91对白在线观看九色| 少妇无套内谢久久久久| 久久久久国产一区二区三区| 欧美日韩国产在线观看网站| 中国免费黄色片| 69堂精品视频| 欧美日韩成人影院|