精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實

發布于 2024-7-1 09:41
瀏覽
0收藏

大模型對話能更接近現實了!


不僅可以最多輸入20張圖像,還能支持多達27輪對話。可處理文本+圖像tokens最多18k。

這就是最新開源的超長多圖多輪對話理解數據集MMDU(Multi-Turn Multi-Image Dialog Understanding)。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實-AI.x社區

大型視覺語言模型(LVLMs)的核心能力之一是生成自然且有意義的回答,從而能夠與人類進行流暢的圖文對話。


盡管目前開源的LVLMs在如單輪單圖輸入等簡化場景中展示出了不錯的潛力,但在具有長上下文長度,且需要多輪對話和多圖輸入的真實對話場景中,表現則相對不足。


此外,現有的LVLM Benchmarks主要采用單項選擇題或簡短回答的形式,難以全面評估LVLMs在真實世界人機互動應用中的表現。


為此,研究團隊在論文A Multi-Turn Multi-Image Dialog Understanding Benchmark and Instruction-Tuning Dataset for LVLMs中提出了全新多圖多輪評測基準MMDU及大規模指令微調數據集MMDU-45k,旨在評估和提升LVLMs在多輪及多圖像對話中的性能。


目前,該研究在HuggingFace的6月18日Daily Papers中位居榜首,VQA dataset trending榜排名Top3,得到了國內外的廣泛關注。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實-AI.x社區

可縮小開閉源模型差距

MMDU基準測試具有以下優勢:


(1)多輪對話與多圖像輸入:MMDU基準測試最多包括20幅圖像和27輪問答對話,從而超越了先前的多種benchmark,并真實地復制了復現了現實世界中的聊天互動情景。

(2)長上下文:MMDU基準測試通過最多18k文本+圖像tokens,評估LVLMs處理和理解帶有長上下文歷史的情況下理解上下文信息的能力。

(3)開放式評估:MMDU擺脫傳統基準測試依賴的close-ended問題和短輸出(例如,多項選擇題或簡短的答案),采用了更貼合現實和精細評估的方法,通過自由形式的多輪輸出評估LVLM的性能,強調了評估結果的可擴展性和可解釋性。


在構建MMDU的過程中,研究者們從開源的維基百科中選取具有較高相關程度的圖像及文本信息,并在GPT-4o模型的輔助下,由人工標注員構建問題和答案對。


具體而言,研究者將wikipedia詞條通過聚類的方法進行合并,劃分為多個不同的類別,并在同一個類別中使用不同的詞條(包含圖文)進行組合。經過InternLM-Chat-20B清洗并去除無用信息之后,交給GPT-4o進行對話生成。生成的基于單詞條和多詞條的對話進行組合,從而構建具有長上下文的多圖多輪對話。


生成的對話以的格式標記圖像位置,使用者可以將不同的多圖多輪對話進一步組合,從而構建所需長度的對話。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實-AI.x社區

△MMDU和MMDU-45k數據生成pipeline

MMDU Benchmark包含的問答最長擁有18k的圖像+文本tokens、20幅圖像及27輪對話,其規模是以往同類型benchmark的至少五倍,為當前的LVLMs提出了新的挑戰。MMDU-45k包含的最長對話數據擁有超17k的圖像+文本tokens。


45k的多輪對話共包含超過410k的問答,能夠顯著提升LVLMs在長上下文理解,多圖多輪對話等方面的能力。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實-AI.x社區

受到利用強大的LLMs作為評判的NLP研究的啟發,MMDU的研究員們開發了一個使用GPT-4o進行模型性能評估的評估流程。


具體來說,模型在MMDU Benchmark上生成輸出后,GPT-4o將根據多個維度評估這些輸出結果,并將它們與參考答案進行比較。


為確保全面和細致的評估,MMDU確定了六個評估維度:創造力、豐富度、視覺感知、邏輯連貫性、答案準確性和圖像關系理解。為了引導GPT-4o提供平衡和公正的評估,每個維度都有精心制定的評估提示。


每個維度的評分范圍為10分,分為五個區間(0-2、2-4…8-10),每個區間都設定了相應的評判標準。GPT-4o遵循這些標準進行評判過程,并為每個維度提供最終分數。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實-AI.x社區

MMDU的評估流程中,使用GPT-4o作為評判,根據參考答案給出總體分數。在每次評估中,GPT-4o將同時參考模型的答案和參考答案。它將為每個評估標準(用藍色表示)提供相應的分數(用綠色表示),并最終以淺橙色總結結果。


通過對15個具有代表性的開源和閉源LVLMs進行深入分析,研究人員發現開源LVLMs(如LLaVa)由于缺乏足夠的對話指令微調數據,相比閉源系統(如GPT-4V)存在較大差距。研究表明,通過對開源LVLMs在MMDU-45k數據集上進行finetune,則可以顯著縮小這一差距,finetune后的模型能夠生成更長、更精確的對話,同時對于圖文交錯的多圖理解能力有了顯著的提升。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實-AI.x社區

△評估不同LVLMs在MMDU上的表現

團隊報告了以下指標:創造力(C)、豐富度(R)、視覺感知(VP)、邏輯連貫性(LC)、答案準確性(AA)、圖像關系理解(IRU),以及平均(Avg.)結果。


此外,經過MMDU-45k微調之后的模型,在現有基準測試上表現也有所提升(MMStar: +1.1%,MathVista: +1.5%,ChartQA: +1.2%)。這一結果說明,MMDU-45k能夠在各種圖像文本相關的任務上提升LVLMs的能力。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實-AI.x社區

△在LVLM監督微調(SFT)階段添加MMDU-45k數據的優勢。

表中報告了LLaVa和InternLM-XC2在MMDU和現有的代表性基準測試上的表現,包括M?MB(MMBench-Dev-EN)、MMMU(MMMU-Val)、MMStar 、MathVista、AI2D、HallBench(HallusionBench)、MMVet 以及ChartQA。每個部分中的最佳和次佳結果分別用綠色和紅色標記。


在多圖多輪問答及普通單圖問答情境下,經過MMDU-45k微調的模型都有顯著的性能提升。這一性能提升首先表現在對圖像內容的識別上,相比微調前的LVLMs,微調之后的模型能夠更加準確的同時理解多張圖像的主要內容,圖像的順序,以及圖像之間的關系。此外,微調之后的模型能夠生成更為詳實和豐富的輸出,并能夠輕松應對具有超長上下文長度的圖文對話情景。

一次可輸入多張圖像,還能多輪對話!最新開源數據集,讓AI聊天更接近現實-AI.x社區

InternLM-Xcomposer2在MMDU-45k數據集上finetune前后的表現。錯誤或幻覺描述在展示中用紅色標記,詳細且準確的描述則用綠色標記。


本文轉自 量子位 ,作者:量子位


原文鏈接:??https://mp.weixin.qq.com/s/bFKBvKNEYYu_yNqPGH0ZwA??

收藏
回復
舉報
回復
相關推薦
国产www免费观看| 欧美日韩色视频| 欧美日韩女优| 18欧美亚洲精品| 国产精品视频入口| 可以在线观看av的网站| 不卡在线一区| 精品国产乱码久久| 精品久久久久久中文字幕2017| 777电影在线观看| 国产风韵犹存在线视精品| 2019最新中文字幕| 四季av中文字幕| 91在线一区| 在线观看免费亚洲| 欧洲精品在线播放| 在线观看a视频| 成人99免费视频| 国产日韩欧美影视| yjizz国产| 欧美88av| 中文综合在线观看| 91av在线免费| 视频二区欧美| 欧美在线观看你懂的| 久久手机在线视频| 黄网站在线免费看| 国产亚洲欧洲一区高清在线观看| 97久久夜色精品国产九色| 欧美激情一区二区三区免费观看| 亚洲高清不卡| 久久这里有精品| www.日本高清视频| 日韩在线你懂的| 欧美精品一区视频| 成人在线短视频| 羞羞视频在线观看一区二区| 色哟哟一区二区| 少妇av一区二区三区无码| 国产原创精品视频| 国产精品污网站| 日本不卡在线播放| 日本福利午夜视频在线| a在线播放不卡| 成人av电影免费| 国产伦精品一区二区三区免.费| 久久久久在线| 啪一啪鲁一鲁2019在线视频| 日本少妇激情舌吻| 精品白丝av| 欧美人交a欧美精品| 国产在线观看免费视频软件| 日本久久综合| 日韩一区三区| 日韩高清在线观看| 午夜精品99久久免费| 国产女人被狂躁到高潮小说| 五月开心六月丁香综合色啪 | 成人免费电影网址| 亚洲日本aⅴ片在线观看香蕉| 人妻在线日韩免费视频| 欧美福利在线播放网址导航| 亚洲精品一区二区三区影院 | 久久天天做天天爱综合色| 久久99精品久久久久久三级| 欧美熟妇交换久久久久久分类| 国产成人午夜精品影院观看视频| 97久久夜色精品国产九色| www.色亚洲| 成人国产精品免费| 久久国产日韩欧美| 成人高清免费观看mv| 中文字幕第一区第二区| 自拍偷拍一区二区三区| 中国av在线播放| 亚洲自拍欧美精品| 国产91在线视频观看| 全亚洲第一av番号网站| 欧美剧情片在线观看| 亚洲精品中文字幕乱码无线| 亚洲乱码一区| 日韩精品在线免费观看| youjizz亚洲女人| 99视频精品全部免费在线视频| 另类专区欧美制服同性| 日韩经典在线观看| 久久综合九色| 成人有码在线播放| 成人爽a毛片一区二区| 91在线视频观看| 亚洲欧美国产精品桃花| 色在线视频网| 色综合久久久久久久| 五月天av在线播放| 国内自拍欧美| 色悠悠久久久久| 久草视频在线免费看| 久热精品视频| 91丨九色丨国产| 国内在线精品| 亚洲一区二区三区爽爽爽爽爽| 亚洲午夜无码av毛片久久| 开心久久婷婷综合中文字幕| 欧美精品一区二区高清在线观看| 日本一道本视频| 欧美精品日韩| 国产精品成人播放| 日韩一级中文字幕| 亚洲丝袜另类动漫二区| 日韩精品视频一区二区在线观看| 日韩福利影视 | 大乳在线免费观看| 亚洲一区二区综合| 性生活免费在线观看| 欧美大胆视频| 欧美久久久精品| 久久久999久久久| 成人99免费视频| 国产人妻互换一区二区| 亚洲成人人体| 亚洲国产精品字幕| 免费在线视频一区二区| 久久超碰97中文字幕| 久久久久久九九| 岛国片av在线| 欧美一区二区精美| 三级黄色片在线观看| 美女精品在线观看| 国产女主播一区二区| h视频在线免费观看| 欧美中文字幕一区二区三区| 魔女鞋交玉足榨精调教| 亚洲一级特黄| 99久久伊人精品影院| 欧美高清视频| 欧美色视频一区| 自拍偷拍视频亚洲| 国产美女一区| 久久超碰亚洲| 蜜桃视频动漫在线播放| 亚洲大尺度美女在线| 欧美日韩在线国产| 国精产品一区一区三区mba视频| 欧美成人一区二区在线| 黄色软件视频在线观看| 亚洲风情亚aⅴ在线发布| 国产乱国产乱老熟300| 国产一区二区三区免费看| 伊人久久大香线蕉午夜av| 国产精品美女午夜爽爽| 亚洲天堂av电影| 欧美特级黄色片| 国产亚洲美州欧州综合国| 日本888xxxx| 日本一区二区在线看| 国产欧美亚洲精品| 欧美日韩xx| 欧美日韩aaaaaa| 国产美女福利视频| 国产精品1区二区.| 青草视频在线观看视频| 老牛影视av一区二区在线观看 | 九九热线视频只有这里最精品| 日韩激情视频在线| 成人公开免费视频| 国产精品天天看| 亚洲色图欧美自拍| 影音先锋久久资源网| 蜜桃视频在线观看91| 日本在线精品| 美女少妇精品视频| 风流老熟女一区二区三区| 五月天亚洲精品| 美女爆乳18禁www久久久久久| 三级亚洲高清视频| 中文字幕人成一区| 成人另类视频| 国产成人黄色av| 91麻豆一二三四在线| 精品av综合导航| 日本久久综合网| 亚洲天堂av老司机| 麻豆国产精品一区| 蜜臂av日日欢夜夜爽一区| 免费在线精品视频| 日本在线中文字幕一区| 国产精品青青在线观看爽香蕉| 国产精品扒开做爽爽爽的视频| 精品日产卡一卡二卡麻豆| 亚洲不卡在线视频| 亚洲欧美一区二区三区孕妇| 黄色网址在线视频| 久久成人免费日本黄色| 日韩av高清在线看片| 大片网站久久| 国产一区免费在线观看| 欧美91在线|欧美| 久久欧美在线电影| 在线国产91| 亚洲第一在线视频| 一本大道伊人av久久综合| 亚洲成av人影院在线观看网| 波多野结衣家庭教师在线观看 | 欧美日韩免费高清一区色橹橹| 久久久精品99| 国产精品视频九色porn| 第四色在线视频| 国产米奇在线777精品观看| 免费日韩视频在线观看| 国内精品福利| 一本—道久久a久久精品蜜桃| 日韩a级大片| 97超级在线观看免费高清完整版电视剧| 色香欲www7777综合网| 久久99久久久久久久噜噜| 国产在线播放av| 亚洲国产成人在线播放| av在线资源观看| 欧美丝袜丝交足nylons图片| 国产无码精品久久久| 亚洲人成网站精品片在线观看| 永久免费av无码网站性色av| 99久久久精品| 男人添女人荫蒂国产| 美女任你摸久久| www日韩视频| 亚洲一区二区动漫| 国产玉足脚交久久欧美| 女生裸体视频一区二区三区| 视频一区在线免费观看| 神马影视一区二区| 欧美一区二区三区电影在线观看| 精品欠久久久中文字幕加勒比| 91超碰在线电影| 99热这里有精品| 91精品国产自产在线观看永久| 91大神在线观看线路一区| 欧美尤物巨大精品爽| 色吧亚洲日本| 7777免费精品视频| 僵尸再翻生在线观看免费国语| 欧美激情一级欧美精品| 手机电影在线观看| 欧美—级a级欧美特级ar全黄| 人妖欧美1区| 欧美高清自拍一区| 九色91在线| 国内免费久久久久久久久久久| 成人在线高清免费| 久久免费少妇高潮久久精品99| 久久久久黄久久免费漫画| 欧美大奶子在线| 天堂av中文在线| 欧美多人乱p欧美4p久久| 神马午夜伦理不卡| 久久久亚洲网站| 欧美巨大丰满猛性社交| 亲子乱一区二区三区电影| 中文字幕影音在线| 日韩av电影在线播放| 69堂免费精品视频在线播放| 国产精品91在线| 91成人app| 999国内精品视频在线| 精品成人自拍视频| 日本不卡一二三区| 国产精品久久久久蜜臀| 97中文字幕在线| 亚洲欧美日韩国产| 欧美三级理论片| 激情综合网最新| 亚洲天堂2024| 欧美国产日本韩| 欧美成欧美va| 欧美日韩国产在线播放| 五月天中文字幕| 日韩一二三区视频| 亚洲av毛片成人精品| 一区二区福利视频| 日本性爱视频在线观看| 国产91精品青草社区| 播放一区二区| 7777精品伊久久久大香线蕉语言 | 国产福利视频一区二区三区| 欧洲一级黄色片| 国产精品理论片在线观看| 久久久久久久久久久久久久免费看 | 久久久久久久伊人| 日本高清不卡视频| 国产乱淫a∨片免费视频| 亚洲精品美女在线| 色综合久久影院| 午夜精品久久久久久久久久久久| 国产 日韩 欧美一区| av资源一区二区| 精品视频亚洲| 精品视频在线观看一区| 久久狠狠亚洲综合| 亚洲第九十七页| 亚洲色图清纯唯美| 无码人妻丰满熟妇精品区| 欧美一级电影网站| 北岛玲一区二区三区| 久久人人爽人人| 亚洲伦理一区二区| 欧美日韩天天操| 亚洲夜间福利| 亚洲一区二区三区四区精品| 久久久久久电影| 国产精品7777777| 91精品在线免费观看| 久草在线网址| 久久免费国产视频| 欧美日韩中出| 亚洲国产精品视频一区| 国产精品呻吟| www.美色吧.com| 自拍视频在线观看一区二区| 99精品在线播放| 亚洲国产成人在线播放| fc2ppv国产精品久久| 国产精品网站视频| 国产成人久久| 国产第一页视频| 99久久99久久免费精品蜜臀| 久久99久久98精品免观看软件| 欧美美女一区二区在线观看| 黄色片视频在线观看| 国产91精品高潮白浆喷水| 亚洲一二三区视频| 热久久最新地址| 国产综合色精品一区二区三区| 先锋影音av在线| 色美美综合视频| 精品欧美不卡一区二区在线观看 | 国产成+人+综合+亚洲欧美| 欧美日韩喷水| 日韩精品福利网| 99久久精品免费视频 | 国产精品综合在线| www.xxxx精品| 亚洲资源在线| 亚洲成人动漫在线| 国产精品亚洲综合一区在线观看| 国产成人自拍网站| 欧美一级xxx| 四虎影院观看视频在线观看| 91久久精品www人人做人人爽| 1024精品久久久久久久久| 久久6免费视频| 一区二区三区四区在线免费观看| 99免费在线视频| 欧美激情视频播放| 加勒比中文字幕精品| 日韩欧美视频网站| 91丝袜国产在线播放| 中文字幕在线观看视频网站| 国产视频精品在线| 亚洲伦理影院| 三级三级久久三级久久18| 蜜臀av性久久久久蜜臀av麻豆| a天堂中文字幕| 欧美色老头old∨ideo| 色视频在线免费观看| 国产在线日韩在线| 欧美日韩免费| 艳妇乳肉亭妇荡乳av| 色哟哟国产精品| 在线观看免费黄视频| 91久久伊人青青碰碰婷婷| 亚洲国产精品一区| 能免费看av的网站| 欧美男女性生活在线直播观看| 麻豆视频网站在线观看| 亚洲综合中文字幕在线| 亚洲性图久久| 国产又爽又黄无码无遮挡在线观看| 欧美日韩亚洲一区二区三区| 国产精品免费观看| 91嫩草视频在线观看| 国产精品久久777777毛茸茸| 亚洲成人黄色av| 欧美日韩成人在线| 超碰97免费在线| 性刺激综合网| 国产成人在线看| 在线永久看片免费的视频| 久久久久99精品久久久久| 亚洲综合久久av一区二区三区| 日韩成人一级大片| 欧美特黄一级片| 欧美精品一区二区三| 亚洲承认视频| 激情五月六月婷婷| 久久精品网站免费观看| 国产三区在线播放| 日本成人激情视频| 欧美涩涩视频| 亚洲精品乱码久久久久久久久久久久| 欧美理论电影在线|