精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

什么是多模態AI 如何融合和對齊? 原創

發布于 2024-11-11 11:03
瀏覽
0收藏

近年來,大型語言模型Large Language Models(LLM)的研究取得了顯著的進展(例如GPT-3,LLaMa,ChatGPT,GPT-4),這些模型在各項自然語言處理(NLP)任務上展現了出色的性能。

通過在海量數據上預訓練,LLM獲得了豐富的知識以及強大的推理能力。只需要輸入一些用戶指令,這些模型就可以解析指令、進行推理并給出符合用戶預期的回答。這些能力背后蘊含著眾多關鍵思想和技術,包括指令微調(Instruction Tuning),上下文學習(In-Context Learning)和思維鏈(Chain of Thought)等,以及多模態。

什么是多模態

多模態人工智能利用來自多個不同模態(如文本、圖像、聲音、視頻等)的數據進行學習和推理。多模態人工智能強調不同模態數據之間的互補性和融合性,通過整合多種模態的數據,利用表征學習、模態融合與對齊等技術,實現跨模態的感知、理解和生成,推動智能應用的全面發展。

接下來分三部分:_數據采集與表示、數據處理與融合、學習與推理,一起來科普下多模型的基本術語。

什么是多模態AI 如何融合和對齊?-AI.x社區

多模態學習(Multimodal Learning)是一種利用來自不同感官或交互方式的數據進行學習的方法,這些數據模態可能包括文本、圖像、音頻、視頻等。多模態學習通過融合多種數據模態來訓練模型,從而提高模型的感知與理解能力,實現跨模態的信息交互與融合。接下來分三部分:模態表示、多模態融合、跨模態對齊,一起來總結下多模型的核心。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是多模態協同表示(Coordinated Representation)?多模態協同表示是一種將多個模態的信息分別映射到各自的表示空間,但映射后的向量或表示之間需要滿足一定的相關性或約束條件的方法。這種方法的核心在于確保不同模態之間的信息在協同空間內能夠相互協作,共同優化模型的性能。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是多模態融合

什么是多模態融合(MultiModal Fusion)?多模態融合能夠充分利用不同模態之間的互補性,它將抽取自不同模態的信息整合成一個穩定的多模態表征。從數據處理的層次角度將多模態融合分為數據級融合、特征級融合和目標級融合。

什么是多模態AI 如何融合和對齊?-AI.x社區

多模態融合

  1. 數據級融合(Data-Level Fusion):
  • 數據級融合,也稱為像素級融合或原始數據融合,是在最底層的數據級別上進行融合。這種融合方式通常發生在數據預處理階段,即將來自不同模態的原始數據直接合并或疊加在一起,形成一個新的數據集。
  • 應用場景:適用于那些原始數據之間具有高度相關性和互補性的情況,如圖像和深度圖的融合。
  1. 特征級融合(Feature-Level Fusion)
  • 特征級融合是在特征提取之后、決策之前進行的融合。不同模態的數據首先被分別處理,提取出各自的特征表示,然后將這些特征表示在某一特征層上進行融合。
  • 應用場景:廣泛應用于圖像分類、語音識別、情感分析等多模態任務中。
  1. 目標級融合(Decision-Level Fusion)
  • 目標級融合,也稱為決策級融合或后期融合,是在各個單模態模型分別做出決策之后進行的融合。每個模態的模型首先獨立地處理數據并給出自己的預測結果(如分類標簽、回歸值等),然后將這些預測結果進行整合以得到最終的決策結果。
  • 應用場景:適用于那些需要綜合考慮多個獨立模型預測結果的場景,如多傳感器數據融合、多專家意見綜合等。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是多模態對齊

什么是跨模態對齊(MultiModal Alignment)?跨模態對齊是通過各種技術手段,實現不同模態數據(如圖像、文本、音頻等)在特征、語義或表示層面上的匹配與對應。跨模態對齊主要分為兩大類:顯式對齊和隱式對齊。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是顯示對齊(Explicit Alignment)?直接建立不同模態之間的對應關系,包括無監督對齊和監督對齊。

  1. 無監督對齊:利用數據本身的統計特性或結構信息,無需額外標簽,自動發現不同模態間的對應關系。
  • CCA(典型相關分析):通過最大化兩組變量之間的相關性來發現它們之間的線性關系,常用于圖像和文本的無監督對齊。
  • 自編碼器:通過編碼-解碼結構學習數據的低維表示,有時結合循環一致性損失(Cycle Consistency Loss)來實現無監督的圖像-文本對齊。
  1. 監督對齊:利用額外的標簽或監督信息指導對齊過程,確保對齊的準確性。
  • 多模態嵌入模型:如DeViSE(Deep Visual-Semantic Embeddings),通過最大化圖像和對應文本標簽在嵌入空間中的相似度來實現監督對齊。
  • 多任務學習模型:同時學習圖像分類和文本生成任務,利用共享層或聯合損失函數來促進圖像和文本之間的監督對齊。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是隱式對齊(Implicit Alignment)?不直接建立對應關系,而是通過模型內部機制隱式地實現跨模態的對齊。這包括注意力對齊和語義對齊。

注意力對齊:通過注意力機制動態地生成不同模態之間的權重向量,實現跨模態信息的加權融合和對齊。Transformer模型:在跨模態任務中(如圖像描述生成),利用自注意力機制和編碼器-解碼器結構,自動學習圖像和文本之間的注意力分布,實現隱式對齊。BERT-based模型:在問答系統或文本-圖像檢索中,結合BERT的預訓練表示和注意力機制,隱式地對齊文本查詢和圖像內容。

語義對齊:在語義層面上實現不同模態之間的對齊,需要深入理解數據的潛在語義聯系。圖神經網絡(GNN):在構建圖像和文本之間的語義圖時,利用GNN學習節點(模態數據)之間的語義關系,實現隱式的語義對齊。預訓練語言模型與視覺模型結合:如CLIP(Contrastive Language-Image Pre-training),通過對比學習在大量圖像-文本對上訓練,使模型學習到圖像和文本在語義層面上的對應關系,實現高效的隱式語義對齊。

什么是多模態AI 如何融合和對齊?-AI.x社區

多模特LLM示例

Flamingo是2022年推出的多模態大語言模型。視覺和語言組件的工作原理如下:

視覺編碼器將圖像或視頻轉換為嵌入(數字列表)。這些嵌入的大小取決于輸入圖像的尺寸或輸入視頻的長度,因此另一個稱為感知器重采樣器的組件將這些嵌入轉換為通用的固定長度。

語言模型接收文本和來自 Percever Resampler 的固定長度視覺嵌入。視覺嵌入用于多個“交叉注意力”塊,這些塊學習根據當前文本權衡視覺嵌入不同部分的重要性。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖 1 來自 Flamingo 論文,展示了模型架構。

訓練分為三個步驟:

  • 視覺編碼器使用 CLIP 進行預訓練。CLIP 實際上同時訓練視覺編碼器和文本編碼器,因此此步驟中的文本編碼器將被丟棄。
  • 該語言模型是一個預先訓練了下一個標記預測的Chinchilla模型,即根據一系列先前的字符預測下一組字符。大多數 LLM(如 GPT-4)都是這樣訓練的。您可能會聽到這種類型的模型被稱為“自回歸”,這意味著該模型根據過去的值預測未來的值。
  • 在第三階段,將未經訓練的交叉注意力模塊插入語言模型中,并在視覺編碼器和語言模型之間插入未經訓練的感知器重采樣器。這是完整的 Flamingo 模型,但交叉注意力模塊和感知器重采樣器仍需要訓練。為此,整個 Flamingo 模型用于計算下一個標記預測任務中的標記,但輸入現在包含與文本交錯的圖像。此外,視覺編碼器和語言模型的權重被凍結。換句話說,只有感知器重采樣器和交叉注意力模塊實際上得到更新和訓練。

經過訓練,Flamingo 能夠執行各種視覺語言任務,包括以對話形式回答有關圖像的問題。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖 2 取自 Flamingo 論文,展示了視覺對話的示例。

Flamingo 論文:

??https://arxiv.org/pdf/2204.14198??

BLIP-2是一款多模態 LLM,于 2023 年初發布。與 Flamingo 一樣,它包含預訓練的圖像編碼器和 LLM。但與 Flamingo 不同的是,圖像編碼器和LLM 均未受影響(預訓練后)。

為了將圖像編碼器連接到 LLM,BLIP-2 使用“Q-Former”,它由兩個組件組成:

  • 視覺組件接收一組可學習的嵌入和凍結圖像編碼器的輸出。與 Flamingo 中所做的一樣,圖像嵌入被輸入到交叉注意層中。
  • 文本組件接收文本。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖摘自 BLIP-2 論文,展示了 Q-Former 的內部結構及其訓練目標。

BLIP-2 訓練分為兩個階段:

  • 在第 1 階段,Q-Former 的兩個組件針對三個目標進行訓練,這些目標實際上源自BLIP-1論文:
  • 圖像-文本對比學習(類似于 CLIP,但有一些細微的差別)。
  • 基于圖像的文本生成(生成圖像的標題)。
  • 圖像-文本匹配(二元分類任務,其中對于每個圖像-文本對,模型必須回答 1 來表示匹配,否則回答 0)。
  • 在第 2 階段,通過在 Q-Former 和 LLM 之間插入投影層來構建完整模型。此投影層將 Q-Former 的嵌入轉換為具有與 LLM 兼容的長度。然后,完整模型負責描述輸入圖像。在此階段,圖像編碼器和 LLM 保持凍結狀態,并且僅訓練 Q-Former 和投影層。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖 3 摘自 BLIP-2 論文,展示了完整的模型架構。投影層標記為“完全連接”。

在論文的實驗中,他們使用 CLIP 預訓練圖像編碼器和OPT或Flan-T5作為 LLM。實驗表明,BLIP-2 在各種視覺問答任務上的表現都優于 Flamingo,但可訓練參數卻少得多。這使得訓練過程更加輕松,且更具成本效益。

BLIP-2 論文

??https://arxiv.org/pdf/2301.12597??

LLaVA是一種多模態 LLM,于 2023 年發布。其架構非常簡單:

  • 視覺編碼器使用 CLIP 進行預訓練
  • LLM 是經過預先訓練的Vicuna模型
  • 視覺編碼器通過單個投影層連接到 LLM

請注意視覺編碼器和 LLM 之間的組件的簡單性,與 BLIP-2 中的 Q-Former 以及 Flamingo 中的感知器重采樣器和交叉注意層相比。

訓練分為兩個階段:

  • 在第 1 階段,訓練目標是圖像字幕。視覺編碼器和 LLM 被凍結,因此只訓練投影層。
  • 在第 2 階段,LLM 和投影層在部分合成的指令跟蹤數據集上進行微調。它是部分合成的,因為它是在 GPT-4 的幫助下生成的。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖 1 來自 LLaVA 論文,展示了完整的模型架構。

作者對 LLaVA 的評價如下:

  • 他們使用 GPT-4 來評估 LLaVA 在部分合成數據集上的響應質量。在這里,LLaVA 相對于 GPT-4 的得分為 85%。
  • 他們在名為 ScienceQA

LLaVA 說明,簡單架構在使用部分合成數據進行訓練可取得優異結果。LLaVA論文:https://arxiv.org/pdf/2304.08485


本文轉載自公眾號數字化助推器  作者:天涯咫尺TGH

原文鏈接:??https://mp.weixin.qq.com/s/ca3J3xMN8Z5V8jQv2jUoOA??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-11-11 11:03:45修改
收藏
回復
舉報
回復
相關推薦
国产成人亚洲综合青青| 欧美一区二区三区播放老司机| 国产欧美日韩综合精品二区| 久久久久97国产| 欧美交a欧美精品喷水| 欧美日韩午夜激情| 神马一区二区影院| 伊人22222| 欧美理论在线| 精品亚洲国产成av人片传媒 | 超碰免费97在线观看| 蜜桃视频在线观看一区二区| 久久69精品久久久久久国产越南| 国产麻豆剧传媒精品国产av| eeuss鲁一区二区三区| 久久久久免费观看| 91亚洲精品在线| 六月丁香激情综合| 国产一区二区三区天码| 日韩一区二区在线观看视频| 国产精品一线二线三线| 国产高清一区在线观看| 国产91精品入口| 日韩av片免费在线观看| 久草综合在线视频| 亚洲va久久| 欧美一卡二卡在线| 欧美视频免费播放| 91网址在线观看| 性生交大片免费全黄| 亚洲毛片一区二区| 亚洲精品网址| 日韩欧美一级| 国产农村妇女毛片精品久久麻豆| 国产精品一区二区久久久| 九九在线观看视频| 日韩1区在线| 日韩激情av在线播放| www.欧美激情.com| 99九九久久| 色综合久久久久网| 中国成人亚色综合网站 | 欧美日韩中文字幕一区| 男人日女人视频网站| 免费网站黄在线观看| 91偷拍与自偷拍精品| 91久久国产综合久久蜜月精品 | 日韩88av| 亚洲男人的天堂网站| 精人妻一区二区三区| 亚洲综合视频| 欧美视频一区二区三区四区 | 国产亚洲福利社区| 精品国产亚洲av麻豆| 久久av资源网| 国产九九精品视频| 中文字幕乱码视频| 欧美一级网站| 国内精品久久久久久影视8| 紧身裙女教师波多野结衣| 欧美女王vk| 亚洲欧美日韩久久久久久| 国产精品嫩草69影院| 欧美h版在线观看| 欧美日本韩国一区二区三区视频| 日本成人中文字幕在线| 原纱央莉成人av片| 好吊成人免视频| 人妻精品无码一区二区三区| 少女频道在线观看免费播放电视剧| 中文字幕一区二区三区色视频| 午夜精品亚洲一区二区三区嫩草 | 久久综合福利| 性感美女福利视频| 久久无码av三级| 日本不卡免费新一二三区| 久久经典视频| 亚洲国产精品传媒在线观看| 日本一区二区三不卡| 成人午夜影视| 中文字幕色av一区二区三区| 亚洲第一页在线视频| 韩国中文字幕在线| 亚洲一区二区四区蜜桃| 免费一级特黄特色毛片久久看| 91超碰免费在线| 大荫蒂欧美视频另类xxxx | 日韩高清不卡一区| 国产日产欧美精品| 精品人妻伦一二三区久久| 精品在线播放免费| 成人一区二区三区四区| 天天干视频在线观看| 暴力调教一区二区三区| 欧美人与物videos另类| 无遮挡的视频在线观看| 亚洲精品成人精品456| 日本丰满少妇xxxx| 免费h在线看| 欧美无乱码久久久免费午夜一区 | 狠狠色狠狠色合久久伊人| 亚洲aⅴ日韩av电影在线观看 | 久久久综合久久久| 亚洲永久免费| 91久久久久久久一区二区 | 精品国产乱码久久久久久蜜臀| 在线观看免费视频黄| 少妇精品导航| 日韩视频免费中文字幕| 国产精久久久久久| 日本午夜精品视频在线观看| 91精品国产一区二区三区动漫| 国产99视频在线| 26uuu国产日韩综合| 亚洲一区二区三区涩| 久色国产在线| 欧美性感一区二区三区| 日本一区二区在线观看视频| 欧美一区电影| 啊v视频在线一区二区三区 | 久久人91精品久久久久久不卡| 精品久久久久久久久久久久久久久久| 久久99精品国产麻豆婷婷| 国产日韩在线一区二区三区| 久热国产在线| 日韩欧美一区视频| 小明看看成人免费视频| 色狼人综合干| 久久亚洲精品网站| 无码人妻熟妇av又粗又大| 国产成人日日夜夜| 亚洲一区二区三区精品视频| 中文字幕乱码在线播放| 日韩欧美国产综合| 狂野欧美性猛交| 黄色亚洲精品| 亚洲一区二区三区乱码aⅴ蜜桃女| 色久视频在线播放| 亚洲一区二区三区三| 日本肉体xxxx裸体xxx免费| 日韩成人午夜| 好吊妞视频这里有精品 | 黄色三级生活片| 天堂av一区二区三区在线播放| 亚洲精品一区二区网址| 久久久久久久九九九九| 快she精品国产999| 韩国成人动漫在线观看| 黄色片免费在线观看| 色综合久久久网| 熟妇人妻久久中文字幕| 国户精品久久久久久久久久久不卡| 国产精品视频区| 浮生影视网在线观看免费| 欧美日韩免费看| 亚洲精品在线视频免费观看 | 日韩精品大片| 韩国成人动漫| 亚洲精品美女网站| 亚洲一区欧美在线| 国产乱色国产精品免费视频| 中文字幕一区二区三区乱码 | 国产三级精品视频| 久久精品免费一区二区| 亚洲制服一区| 日产日韩在线亚洲欧美| 黄色小视频在线观看| 精品国产福利在线| 国产精品伦子伦| 亚洲欧美网站| 日本一区二区三区视频免费看| 婷婷六月国产精品久久不卡| 精品一区二区三区四区| 九一国产在线观看| 国产精品午夜在线| 超碰在线超碰在线| 在线亚洲成人| 一区二区精品视频| 高清精品视频| 热门国产精品亚洲第一区在线| sese在线视频| 亚洲的天堂在线中文字幕| 亚洲色成人www永久网站| 成人免费在线视频| 999精品免费视频| 日本色综合中文字幕| 91传媒免费视频| 亚洲午夜久久| 91成人免费看| 欧美色网在线| 久久久人成影片一区二区三区| 飘雪影院手机免费高清版在线观看| 欧美日韩国产综合一区二区三区| 国产在线视频卡一卡二| 国产三级精品三级在线专区| 成人三级做爰av| 日日骚欧美日韩| 福利在线一区二区| 日韩精品午夜| 精品一区在线播放| 国产精品一区免费在线| 国产999精品| 金瓶狂野欧美性猛交xxxx| 中文字幕成人在线| 欧美性受xxxx狂喷水| 欧美日韩精品电影| 日韩欧美在线观看免费| 亚洲午夜羞羞片| fc2ppv在线播放| 久久久久久久网| 99热超碰在线| 国产一区二区导航在线播放| 日本激情视频在线| 最新亚洲激情| 丁香色欲久久久久久综合网| 精品日韩免费| 欧美日本韩国在线| 99香蕉久久| 亚洲va久久久噜噜噜| jvid一区二区三区| 欧亚精品在线观看| www视频在线观看| 久久久久成人网| 超碰在线免费播放| 久久精品国产96久久久香蕉| 国产午夜在线观看| 亚洲女人天堂视频| 青青青草网站免费视频在线观看| 精品美女一区二区三区| 国产浮力第一页| 4438x亚洲最大成人网| 中文字幕第99页| 欧美日韩免费观看一区三区| 做爰视频毛片视频| 欧美吞精做爰啪啪高潮| 五月激情丁香网| 欧美在线一区二区| 18国产免费视频| 欧美三级在线播放| 中文字幕人妻互换av久久| 欧美午夜在线一二页| 337p粉嫩色噜噜噜大肥臀| 色婷婷av一区二区三区gif| 国产在线观看黄色| 日韩欧美在线视频| 国产成人无码av| 欧美综合天天夜夜久久| 夜夜爽妓女8888视频免费观看| 一本色道久久综合亚洲aⅴ蜜桃| 欧美在线观看不卡| 在线一区二区观看| 伊人网综合在线| 538prom精品视频线放| 国产亲伦免费视频播放| 日韩欧美综合在线| 欧美一区,二区| 亚洲男人的天堂在线播放| 肉色超薄丝袜脚交| 99精品视频精品精品视频| 亚洲啪啪av| 91精品精品| 久久亚洲精品无码va白人极品| 亚洲国产精品一区| 免费日韩视频在线观看| 蜜臀va亚洲va欧美va天堂 | 免费在线一区二区三区| 亚洲国产成人av网| 日韩欧美三级视频| 91高清在线观看| 97精品人妻一区二区三区香蕉| 日韩一区二区电影| 婷婷五月综合激情| 国产亚洲精品美女| 91麻豆一二三四在线| 久久免费精品视频| 亚洲爱爱视频| 99国产在线视频| 亚洲肉体裸体xxxx137| 亚洲免费久久| 亚洲清纯自拍| 天天视频天天爽| 成人精品亚洲人成在线| 级毛片内射视频| 亚洲精品视频观看| 婷婷激情五月网| 制服丝袜日韩国产| 性感美女一级片| 精品国产一区二区三区久久久| 久久亚洲导航| 国产精品亚洲欧美导航| 粉嫩一区二区三区四区公司1| 日日夜夜精品网站| 在线观看一区视频| 日日躁夜夜躁aaaabbbb| 成人avav影音| www.毛片com| 91黄色免费观看| 成人免费公开视频| 中文字幕免费精品一区高清| 看黄在线观看| 99电影在线观看| 成人综合久久| 国产男女在线观看| 国产不卡在线视频| 欧美aaa级片| 欧美日韩在线视频一区| 国产视频在线一区| 国产亚洲精品久久久久久牛牛| 秋霞在线视频| 成人黄色片在线| 久草在线成人| 日韩精品 欧美| 国产成人福利片| 97精品在线播放| 91高清视频免费看| 日本成人动漫在线观看| 欧美巨乳在线观看| 日韩欧美专区| 日韩精品另类天天更新| 国产精品久久久久久久免费软件| 亚洲午夜精品在线观看| 亚洲视频小说图片| 成人黄色三级视频| 亚洲欧美中文另类| 午夜激情电影在线播放| 国产一区二区三区免费不卡| 午夜欧美视频| 中文字幕一二三| 亚洲免费色视频| 国产成人三级一区二区在线观看一 | 国产欧美激情视频| 国产女同性恋一区二区| 无码人妻av免费一区二区三区| 日韩精品免费电影| 阿v视频在线观看| 国新精品乱码一区二区三区18| 欧美午夜a级限制福利片| 麻豆免费在线观看视频| 依依成人精品视频| 亚洲AV无码精品自拍| 欧美乱大交xxxxx另类电影| 欧美经典影片视频网站| 国产一二三四五| 国产成人aaa| 动漫精品一区一码二码三码四码| 日韩精品中文字幕一区二区三区| 污污影院在线观看| 成人激情直播| 一区二区三区四区五区在线| 国产伦精品一区二区三区妓女 | 国产欧美精品一区二区三区四区| 黑人精品无码一区二区三区AV| 亚洲精品福利视频| 美女日韩欧美| 日韩免费三级| 狠狠色丁香久久婷婷综合_中| www深夜成人a√在线| 日韩欧美黄色影院| 国内激情视频在线观看| 欧美一区少妇| 久久99久久精品| 九九九久久久久| 日韩大片免费观看视频播放| 另类图片综合电影| 一级日韩一区在线观看| 国产成人精品www牛牛影视| 日韩人妻无码一区二区三区99 | 欧美a在线看| 成人资源视频网站免费| 性伦欧美刺激片在线观看| 国产精品理论在线| 精品日韩99亚洲| 刘亦菲一区二区三区免费看| 亚洲一区二区三区免费看| 成人在线视频首页| 久久99国产综合精品免费| 日韩在线欧美在线| 成人性生交大片免费看96| 国产极品美女高潮无套久久久 | 亚洲一区久久久| 尹人成人综合网| 国产精品久久久久久久av| 日韩欧美国产一区在线观看| 无码小电影在线观看网站免费| 亚洲二区自拍| 成人精品免费视频| 亚洲第一区av| 久久久久久91| 日韩电影一区| 自拍视频一区二区| 制服丝袜成人动漫| 亚洲精品日产| 国产专区在线视频| 国产午夜精品理论片a级大结局| 国产草草影院ccyycom| 国产ts一区二区| 亚洲视频碰碰| 糖心vlog免费在线观看| 亚洲精品视频免费| 中文字幕一区图|