精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

8.3K Stars!《多模態大語言模型綜述》重大升級

發布于 2024-4-16 10:05
瀏覽
0收藏

去年 6 月底,我們在 arXiv 上發布了業內首篇多模態大語言模型領域的綜述《A Survey on Multimodal Large Language Models》,系統性梳理了多模態大語言模型的進展和發展方向,目前論文引用 120+,開源 GitHub 項目獲得 8.3K Stars。自論文發布以來,我們收到了很多讀者非常寶貴的意見,感謝大家的支持!


  • 論文鏈接:https://arxiv.org/pdf/2306.13549.pdf
  • 項目鏈接(每日更新最新論文):https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models


去年以來,我們見證了以 GPT-4V 為代表的多模態大語言模型(Multimodal Large Language Model,MLLM)的飛速發展。為此我們對綜述進行了重大升級,幫助大家全面了解該領域的發展現狀以及潛在的發展方向。

8.3K Stars!《多模態大語言模型綜述》重大升級-AI.x社區

MLLM 發展脈絡圖


MLLM 脫胎于近年來廣受關注的大語言模型(Large Language Model , LLM),在其原有的強大泛化和推理能力基礎上,進一步引入了多模態信息處理能力。相比于以往的多模態方法,例如以 CLIP 為代表的判別式,或以 OFA 為代表的生成式,新興的 MLLM 展現出一些典型的特質:


(1)模型大。MLLM 通常具有數十億的參數量,更多的參數量帶來更多的潛力;

(2)新的訓練范式。為了激活巨大參數量的潛力,MLLM 采用了多模態預訓練、多模態指令微調等新的訓練范式,與之匹配的是相應的數據集構造方式和評測方法等。


在這兩種特質的加持下,MLLM 涌現出一些以往多模態模型所不具備的能力,例如給定圖片進行 OCR?Free 的數學推理、給定圖片進行故事創作和理解表情包的深層含義等。

8.3K Stars!《多模態大語言模型綜述》重大升級-AI.x社區

本綜述主要圍繞 MLLM 的基礎形式、拓展延伸以及相關研究課題進行展開,具體包括:

  • MLLM 的基礎構成與相關概念,包括架構、訓練策略、數據和評測;
  • MLLM 的拓展延伸,包括輸入輸出粒度、模態、語言和場景的支持;
  • MLLM 的相關研究課題,包括多模態幻覺、多模態上下文學習(Multimodal In-Context Learning,M-ICL)、多模態思維鏈(Multimodal Chain of Thought,M-CoT)、LLM 輔助的視覺推理(LLM-Aided Visual Reasoning,LAVR)。

架構

對于多模態輸入-文本輸出的典型 MLLM,其架構一般包括編碼器連接器以及 LLM。如要支持更多模態的輸出(如圖片、音頻、視頻),一般需要額外接入生成器,如下圖所示:

8.3K Stars!《多模態大語言模型綜述》重大升級-AI.x社區

MLLM 架構圖


其中,模態編碼器負責將原始的信息(如圖片)編碼成特征,連接器則進一步將特征處理成LLM 易于理解的形式,即視覺 Token。LLM 則作為“大腦”綜合這些信息進行理解和推理,生成回答。目前,三者的參數量并不等同,以 Qwen-VL[1]為例,LLM 作為“大腦”參數量為 7.7B,約占總參數量的 80.2%,視覺編碼器次之(1.9B,約占 19.7%),而連接器參數量僅有 0.08B。


對于視覺編碼器而言,增大輸入圖片的分辨率是提升性能的有效方法。一種方式是直接提升分辨率,這種情況下需要放開視覺編碼器進行訓練以適應更高的分辨率,如 Qwen-VL[1]等。另一種方式是將大分辨率圖片切分成多個子圖,每個子圖以低分辨率送入視覺編碼器中,這樣可以間接提升輸入的分辨率,如 Monkey[2]等工作。


對于預訓練的 LLM,常用的包括 LLaMA[3]系列、Qwen[4]系列和 InternLM[5]系列等,前者主要支持英文,而后兩者中英雙語支持得更好。就性能影響而言,加大 LLM 的參數量可以帶來顯著的性能增益,如 LLaVA-NeXT[6]等工作在 7B/13B/34B 的 LLM 上進行實驗,發現提升LLM 大小可以帶來各 benchmark 上的顯著提升,在 34B 的模型上更涌現出 zero-shot 的中文能力。除了直接增大 LLM 參數量,近期火熱的 MoE 架構則提供了更高效實現的可能性,即通過稀疏計算的方式,在不增大實際計算參數量的前提下提高總的模型參數量。


相對前兩者來說,連接器的重要性略低。例如,MM1[7]通過實驗發現,連接器的類型不如視覺 token 數量(決定之后 LLM 可用的視覺信息)及圖片的分辨率(決定視覺編碼器的輸入信息量)重要。

數據與訓練

MLLM 的訓練大致可以劃分為預訓練階段指令微調階段對齊微調階段。預訓練階段主要通過大量配對數據將圖片信息對齊到 LLM 的表征空間,即讓 LLM 讀懂視覺 Token。指令微調階段則通過多樣化的各種類型的任務數據提升模型在下游任務上的性能,以及模型理解和服從指令的能力。對齊微調階段一般使用強化學習技術使模型對齊人類價值觀或某些特定需求(如更少幻覺)。


早期工作在第一階段主要使用粗粒度的圖文對數據,如 LAION-5B,這些數據主要來源于互聯網上的圖片及其附帶的文字說明,因此具有規模大(數 10 億規模)但噪聲多、文本短的特點,容易影響對齊的效果。后來的工作則探索使用更干凈、文本內容更豐富的數據做對齊。如 ShareGPT4V[8]使用 GPT-4V 生成的詳細描述來做更細粒度的對齊,在一定程度上緩解了對齊不充分的問題,獲得了更好的性能。但由于 GPT-4V 是收費的,這種類型的數據規模通常較小(數百萬規模)。此外,由于數據規模受限,其包含的世界知識也是有限的,比如是否能夠識別出圖像中的建筑為廣州塔。此類世界知識通常儲備于大規模的粗粒度圖文對中。


第二階段的微調數據一方面可以來源于各種任務的數據,如 VQA 數據、OCR 數據等,也可以來源于 GPT-4V 生成的數據,如問答對。雖然后者一般能夠生成更復雜、更多樣化的指令數據,但這種方式也顯著地增加了成本。值得一提的是,第二階段的訓練中一般還會混合部分純文本的對話數據,這類數據可以視為正則化的手段,保留 LLM 原有的能力與內嵌知識。


第三階段的數據主要是針對于回答的偏好數據。這類數據通常由人工標注收集,因而成本較高。近期出現一些工作使用自動化的方法對來自不同模型的回復進行偏好排序,如 Silkie[9]通過調用 GPT-4V 來收集偏好數據。

其他技術方向

除了提升模型的基礎能力(如支持的輸入/輸出形式、性能指標)外,還有一些有意思的問題以及待探索的方向。本綜述中主要介紹了多模態幻覺、多模態上下文學習(Multimodal In?Context Learning,M-ICL)、多模態思維鏈(Multimodal Chain of Thought,M-CoT)和 LLM 輔助的視覺推理(LLM-Aided Visual Reasoning,LAVR)等。


多模態幻覺的研究主要關注模型生成的回答與圖片內容不符的問題。視覺和文本本質上是異構的信息,完全對齊兩者本身就具有相當大的挑戰。增大圖像分辨率和提升訓練數據質量是降低多模態幻覺的兩種最直觀的方式,此外我們仍然需要在原理上探索多模態幻覺的成因和解法。例如,當前的視覺信息的 Token 化方法、多模態對齊的范式、多模態數據和 LLM 存儲知識的沖突等對多模態幻覺的影響仍需深入研究。


多模態上下文學習技術為少樣本學習方法,旨在使用少量的問答樣例提示模型,提升模型的few-shot 性能。提升性能的關鍵在于讓模型有效地關注上下文,并將內在的問題模式泛化到新的問題上。以 Flamingo[10]為代表的工作通過在圖文交錯的數據上訓練來提升模型關注上下文的能力。目前對于多模態上下文學習的研究還比較初步,有待進一步探索。


多模態思維鏈的基本思想是通過將復雜的問題分解為較簡單的子問題,然后分別解決并匯總。相較于純文本的推理,多模態的推理涉及更多的信息來源和更復雜的邏輯關系,因此要復雜得多。當前該方面的工作也比較少。


LLM 輔助的視覺推理方法探索如何利用 LLM 強大的內嵌知識與能力,并借助其他工具,設計各種視覺推理系統,解決各種現實問題。相比于通過端到端訓練獲得單一模型,這類方法一般關注如何通過免訓練的方式擴展和加強 LLM 的能力,從而構建一個綜合性的系統。

挑戰和未來方向

針對 MLLM 的研究現狀,我們進行了深入思考,將挑戰與可能的未來發展方向總結如下:

  • 現有 MLLM 處理多模態長上下文的能力有限,導致模型在長視頻理解、圖文交錯內容理解等任務中面臨巨大挑戰。以 Gemini 1.5 Pro 為代表的 MLLM 正在掀起長視頻理解的浪潮,而多模態圖文交錯閱讀理解(即長文檔中既有圖像也有文本)則相對空白,很可能會成為接下來的研究熱點。
  • MLLM 服從復雜指令的能力不足。例如,GPT-4V 可以理解復雜的指令來生成問答對甚至包含推理信息,但其他模型這方面的能力則明顯不足,仍有較大的提升空間。
  • MLLM 的上下文學習和思維鏈研究依然處于初步階段,相關的能力也較弱,亟需相關底層機制以及能力提升的研究探索。
  • 開發基于 MLLM 的智能體是一個研究熱點。要實現這類應用,需要全面提升模型的感知、推理和規劃能力。
  • 安全問題。MLLM 容易受設計的惡意攻擊影響,生成有偏的或不良的回答。該方面的相關研究也仍然欠缺。
  • 目前 MLLM 在訓練時通常都會解凍 LLM,雖然在訓練過程中也會加入部分單模態的文本訓練數據,但大規模的多模態和單模態數據共同訓練時究竟對彼此互有增益還是互相損害仍然缺乏系統深入的研究。

?

更詳細內容請閱讀

  • 論文鏈接:https://arxiv.org/pdf/2306.13549.pdf
  • 項目鏈接:https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models


本文轉自 AI生成未來 ,作者:AINLP


原文鏈接:??https://mp.weixin.qq.com/s/yRcaw0UW1VOYUtktPzsw2g??

標簽
收藏
回復
舉報
回復
相關推薦
91成人理论电影| 欧美人与z0zoxxxx视频| 久久久99爱| 亚洲av无码不卡| 91精品久久久久久久蜜月| 日韩欧美国产高清| 97成人在线观看视频| av资源种子在线观看| 精品一区精品二区高清| 久久青草福利网站| 日韩av片在线免费观看| 一区二区三区在线免费看 | 秋霞影院一区二区| 不卡中文字幕av| 久久久久国产精品区片区无码| 成人亚洲免费| 午夜a成v人精品| 一区二区三区久久网| 欧美一级在线免费观看| 久久99最新地址| 91av视频在线| 精品国产精品国产精品| 亚洲视频分类| 欧美一区二区三区免费在线看| 岳毛多又紧做起爽| 日韩av官网| 国产精品国产精品国产专区不蜜 | 国产一级免费大片| 欧美黄色网页| 精品国产乱码久久久久久虫虫漫画| 一级二级三级欧美| 日本免费一区二区三区最新| 激情另类小说区图片区视频区| 日韩免费av在线| 在线观看免费国产视频| 亚洲乱码免费伦视频| 亚洲一区二区国产| 久久久久久久无码| 亚洲一区二区三区在线免费| 欧美日韩一级二级| 精品视频无码一区二区三区| √最新版天堂资源网在线| 亚洲欧美乱综合| 宅男在线精品国产免费观看| 岛国视频免费在线观看| 99精品视频一区二区三区| 999精品在线观看| 国产v片在线观看| 黄色小说综合网站| 国产在线观看一区二区三区| 欧美 亚洲 另类 激情 另类| 日日噜噜夜夜狠狠视频欧美人| 97在线免费观看| 日本少妇在线观看| 亚洲激情黄色| 久久久久久久久久国产精品| 亚洲精品动漫100p| 日韩尤物视频| 国产人成在线视频| 不卡在线观看av| 日韩在线观看免费全集电视剧网站| 捆绑裸体绳奴bdsm亚洲| 欧美专区一区| 国产成人91久久精品| 日韩成人免费在线视频| 悠悠资源网久久精品| 欧美成人免费在线视频| 国产av 一区二区三区| 小小影院久久| 欧美成人精品激情在线观看 | 亚洲精选一二三| 亚洲精品高清国产一线久久| 日本在线观看www| 99这里有精品| 97色在线观看| 免费av网站在线| 日韩精品乱码av一区二区| 国产成人福利视频| 在线视频免费观看一区| 成人欧美一区二区三区在线 | 国产福利一区二区三区在线视频| 成人在线激情视频| 午夜免费福利视频| 99久久久久久99| 欧美日韩亚洲综合一区二区三区激情在线| 九色国产在线观看| 国产精品久久久久久久久久久免费看 | 131美女爱做视频| 亚洲高清黄色| 91精品国产免费| 欧美在线一级片| 久久福利综合| 久久露脸国产精品| 中文字幕在线日本| 国产成人av福利| 欧美日韩一区二区三区免费| 人人干在线视频| 午夜精品福利视频网站| 国产一二三区av| 久久精品色播| 精品国模在线视频| 黄网在线观看视频| 精品一区二区三区在线观看| 国产丝袜不卡| 伊人免费在线| 午夜电影久久久| 极品粉嫩美女露脸啪啪| 色综合久久中文| 久久国产精品免费视频| 欧美 日韩 精品| 国产精品77777| 日韩三级电影| 亚洲天堂免费电影| 日韩一卡二卡三卡四卡| 一区二区伦理片| 黑人一区二区| 成人福利免费观看| 青青青手机在线视频观看| 亚洲激情第一区| 亚洲综合av在线播放| 菁菁伊人国产精品| 久久成人国产精品| 中文字幕在线播出| 久久久午夜精品| 日韩精品视频在线观看视频| 久久亚洲精品中文字幕| 亚洲欧洲黄色网| 欧美bbbbbbbbbbbb精品| 国产福利精品一区| 青春草在线视频免费观看| 日韩一区二区三区在线免费观看 | 欧美性猛交xxxx乱大交3| 中文字幕55页| 久久久五月天| 成人免费视频网址| 1024国产在线| 在线视频一区二区三区| 日本黄色片在线播放| 亚洲视频观看| 国产精品免费一区二区三区观看| 51xtv成人影院| 91精品国产综合久久久久久漫画| 精品一区二区6| 奇米四色…亚洲| 无遮挡亚洲一区| 福利一区在线| 色噜噜国产精品视频一区二区| 久久中文字幕免费| 久久综合色综合88| 日本成年人网址| 亚洲桃色综合影院| 98精品在线视频| 色天堂在线视频| 欧美性生交xxxxx久久久| 51调教丨国产调教视频| 午夜亚洲一区| 日本在线视频不卡| 97人人做人人爽香蕉精品| 中文字幕一区日韩电影| 国产精品无码AV| 亚洲一卡二卡三卡四卡五卡| 五月天丁香社区| 一本久道综合久久精品| 久久久久九九九| 另类专区亚洲| 最近2019中文字幕mv免费看| 一级黄色片在线看| 亚洲欧美国产高清| 日韩少妇一区二区| 鲁大师成人一区二区三区| 无遮挡亚洲一区| 麻豆精品国产| 97视频色精品| a√资源在线| 91精品国产综合久久福利| 免费一级黄色大片| 91玉足脚交白嫩脚丫在线播放| 欧美在线观看www| 久久影院100000精品| 成人激情av| 欧美大片免费观看网址| 色爱av美腿丝袜综合粉嫩av| 99精品久久久久久中文字幕| 精品福利一区二区| 国产小视频你懂的| 不卡视频在线看| 天堂中文视频在线| 欧美日韩一卡| 五月天丁香综合久久国产| 麻豆精品在线| 国产精品国产三级国产aⅴ9色| 国产网站在线免费观看| 亚洲国产精品嫩草影院久久| 在线播放精品视频| 亚洲国产精品一区二区久久| 日韩视频在线观看免费视频| 国产成都精品91一区二区三| 精品日韩久久久| 在线精品在线| 黄频视频在线观看| 日本一道高清一区二区三区| 91精品在线影院| 美女100%一区| 欧美激情18p| 国产免费av高清在线| 欧美va亚洲va在线观看蝴蝶网| 黄色网址中文字幕| 亚洲一区二区欧美日韩| 毛片aaaaaa| 91在线视频播放| 国产精品探花在线播放| 丝袜诱惑亚洲看片| 日韩伦理在线免费观看| 午夜精品一区二区三区国产| 日本午夜精品电影| 欧美18免费视频| 亚洲一区二区日本| 69堂精品视频在线播放| 欧美激情乱人伦一区| 日本福利在线| 亚洲视频在线播放| 午夜影院免费体验区| 欧美一区二区三区男人的天堂| 亚洲婷婷久久综合| 天天综合色天天综合色h| 欧美老熟妇一区二区三区| 国产欧美日韩一区二区三区在线观看| 中文字幕一区三区久久女搜查官| 国产精品一区一区三区| 视色视频在线观看| 日本va欧美va精品| 国产一二三四在线视频| 久久久噜噜噜| 92看片淫黄大片一级| 亚洲麻豆视频| 国产日韩欧美精品在线观看| 欧美精品啪啪| 国产高清不卡无码视频| 午夜av一区| 国产在线拍揄自揄拍无码| 视频在线不卡免费观看| 亚洲精品一区二区三| 欧美日韩中文一区二区| 日韩精品第一页| 日本一区二区三区视频| 亚洲精品日韩精品| 日韩一区二区三区免费播放| 亚洲欧美久久234| 国产精品99在线观看| 中文字幕在线亚洲三区| 欧美疯狂party性派对| 亚洲午夜高清视频| 99精品小视频| 99中文字幕在线观看| 亚洲精品99| 女人被男人躁得好爽免费视频| 欧美日韩一区二区国产| 男女激情免费视频| 亚洲精选国产| 毛片一区二区三区四区| 日韩成人一级大片| 五月花丁香婷婷| 成人综合在线观看| 一级做a爰片毛片| 国产亚洲精品超碰| 久久一级免费视频| 亚洲精品视频自拍| 国产精品成人免费一区二区视频| 午夜视频一区在线观看| 天天干在线播放| 欧美日韩免费不卡视频一区二区三区 | 日韩制服丝袜先锋影音| 五月婷婷激情久久| 国产一区二区三区不卡在线观看| 在线观看一区二区三区视频| 成人aa视频在线观看| 国产精品一二三区在线观看| 国产精品乱码妇女bbbb| 全程偷拍露脸中年夫妇| 亚洲成人午夜电影| 这里只有久久精品视频| 欧美精品日韩一本| 色欲av伊人久久大香线蕉影院| 亚洲乱码国产乱码精品精| aⅴ在线视频男人的天堂| 欧美精品九九久久| 97精品国产综合久久久动漫日韩 | 免费av一区二区三区四区| 少妇精品久久久久久久久久| 欧美激情1区2区| 97视频在线免费播放| 韩国一区二区在线观看| 国产xxxxxxxxx| 综合欧美一区二区三区| 美日韩一二三区| 日韩一区国产二区欧美三区| 日本免费不卡| 欧美成人精品激情在线观看 | 粗大黑人巨茎大战欧美成人| 6080yy精品一区二区三区| 亚洲男人在线| 久久综合九色综合久99| 久久久久久美女精品| 国产精品欧美激情在线观看| 国产精品性做久久久久久| 在哪里可以看毛片| 亚洲尤物视频在线| 伊人网综合在线| 亚洲另类图片色| 1024在线看片你懂得| 91精品在线观| 午夜精品免费观看| 国产日韩成人精品| 欧美成人三级视频| 欧美在线视频你懂得| 日本黄色不卡视频| 日韩有码在线电影| 欧美大片免费高清观看| 国产区一区二区三区| 天天做天天爱天天爽综合网| 免费av网址在线| 99这里只有精品| 欧美激情一区二区视频| 欧美精品一卡二卡| 高清性色生活片在线观看| 992tv在线成人免费观看| 欧美黄色一级| 亚洲欧美日韩不卡| 久久精品国产亚洲高清剧情介绍 | 丁香亚洲综合激情啪啪综合| 国产欧美一区二区三区在线观看视频 | 亚洲欧洲日韩综合二区| 久久精品中文| 中文幕无线码中文字蜜桃| 亚洲成va人在线观看| 99在线精品视频免费观看20| 日韩午夜在线视频| 久久亚洲精品人成综合网| 神马影院午夜我不卡影院| 视频一区二区三区入口| 国产中文字幕一区二区| 精品久久久久久久大神国产| 熟妇高潮一区二区三区| 性欧美激情精品| 久久精品色综合| www.com毛片| 国产偷v国产偷v亚洲高清| 久久精品无码av| 国产亚洲人成a一在线v站| 97久久香蕉国产线看观看| 日本欧美色综合网站免费| 奇米影视一区二区三区| 美女网站视频色| 91精品国产麻豆| 丁香花电影在线观看完整版| 精品乱色一区二区中文字幕| 麻豆九一精品爱看视频在线观看免费| 九色porny自拍视频| 在线观看精品一区| 日本三级视频在线观看| 亚洲综合在线中文字幕| 韩国一区二区三区在线观看| 中文字幕免费在线播放| 欧美性少妇18aaaa视频| 在线免费观看黄色av| 91香蕉嫩草影院入口| 欧美欧美天天天天操| 国产一级二级在线观看| 色综合久久99| 日本高清视频在线观看| 不卡视频一区| 亚洲精选成人| 国产无遮挡在线观看| 欧美一区二区免费观在线| 成人三级高清视频在线看| 日本一区二区三区www| 国产一区二区久久| 国产 欧美 日韩 在线| 一区二区三区精品99久久| 国产不卡精品| 欧美污视频网站| 亚洲男人的天堂在线观看| 天天干天天草天天射| 国产精品久久久久久搜索| 欧美1区2区| 中日韩精品一区二区三区| 欧美日韩一区成人| 超黄网站在线观看| 日韩在线三级| 高清不卡一区二区| 69视频免费看| 欧美激情精品久久久久久蜜臀| 精品成av人一区二区三区| 国产xxx在线观看| 欧美性色黄大片| 高清精品在线| 免费观看黄色的网站| 久久久一区二区三区| av中文字幕免费| 国产玖玖精品视频|