精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

太全了!多模態(tài)深度學(xué)習(xí)的綜述!

人工智能 深度學(xué)習(xí)
我們對世界的體驗(yàn)是多模態(tài)的 —— 我們看到物體,聽到聲音,感覺到質(zhì)地,聞到氣味,嘗到味道。模態(tài)是指某件事發(fā)生或經(jīng)歷的方式,當(dāng)一個研究問題包含多個模態(tài)時,它就具有多模態(tài)的特征。

1.介紹

我們對世界的體驗(yàn)是多模態(tài)的 —— 我們看到物體,聽到聲音,感覺到質(zhì)地,聞到氣味,嘗到味道。模態(tài)是指某件事發(fā)生或經(jīng)歷的方式,當(dāng)一個研究問題包含多個模態(tài)時,它就具有多模態(tài)的特征。為了讓人工智能在理解我們周圍的世界方面取得進(jìn)展,它需要能夠同時解釋這些多模態(tài)的信號。

例如,圖像通常與標(biāo)簽和文本解釋相關(guān)聯(lián),文本包含圖像,以更清楚地表達(dá)文章的中心思想。不同的模態(tài)具有非常不同的統(tǒng)計(jì)特性。這些數(shù)據(jù)被稱為多模態(tài)大數(shù)據(jù),包含豐富的多模態(tài)和跨模態(tài)信息,對傳統(tǒng)的數(shù)據(jù)融合方法提出了巨大的挑戰(zhàn)。

這篇綜述中,我們會介紹一些開創(chuàng)性的深度學(xué)習(xí)模型來融合這些多模態(tài)大數(shù)據(jù)。隨著對多模態(tài)大數(shù)據(jù)的探索越來越多,仍有一些挑戰(zhàn)需要解決。因此,本文對多模態(tài)數(shù)據(jù)融合的深度學(xué)習(xí)進(jìn)行了綜述,旨在為讀者(無論其原始社區(qū)如何)提供多模態(tài)深度學(xué)習(xí)融合方法的基本原理,并激發(fā)深度學(xué)習(xí)的新型多模態(tài)數(shù)據(jù)融合技術(shù)。

通過多模態(tài)深度學(xué)習(xí),結(jié)合不同的模態(tài)或信息類型來提高效果,從直觀上看是一項(xiàng)很有吸引力的任務(wù),但在實(shí)踐中,如何結(jié)合不同的噪聲水平和模態(tài)之間的沖突是一個挑戰(zhàn)。此外,模型對預(yù)測結(jié)果有不同的定量影響。在實(shí)踐中最常見的方法是將不同輸入的高級嵌入連接起來,然后應(yīng)用softmax。

種方法的問題是,它將給予所有子網(wǎng)絡(luò)/模式同等的重要性,這在現(xiàn)實(shí)情況中是非常不可能的。這里需要采用子網(wǎng)絡(luò)的加權(quán)組合,以便每個輸入模態(tài)可以對輸出預(yù)測有一個學(xué)習(xí)貢獻(xiàn)(Theta)。

2.具有代表性的深度學(xué)習(xí)架構(gòu)   

在本節(jié)中,我們將介紹多模態(tài)數(shù)據(jù)融合深度學(xué)習(xí)模型的代表性深度學(xué)習(xí)架構(gòu)。具體而言,給出了深度架構(gòu)的定義、前饋計(jì)算和反向傳播計(jì)算,以及典型的變體。表1總結(jié)了代表性模型。

 表1:代表性深度學(xué)習(xí)模型摘要。

2.1 深度信念網(wǎng)絡(luò)(DBN)  

受限玻爾茲曼機(jī)(RBM)是深度信念網(wǎng)的基本塊(Zhang, Ding, Zhang, & Xue, 2018;Bengio,2009 年)。RBM是玻爾茲曼機(jī)的特殊變體(見圖1)。它由可見層和隱藏層組成;可見層的單元與隱藏層的單元之間存在全連接連接,但同一層中的單元之間沒有連接。RBM 也是一個生成圖形模型,它使用能量函數(shù)以捕獲可見單元和隱藏單元之間的概率分布.

最近,有人提出了一些先進(jìn)的RBM來提高性能。例如,為了避免網(wǎng)絡(luò)過度擬合,Chen, Zhang, Yeung, and Chen (2017) 設(shè)計(jì)了稀疏玻爾茲曼機(jī),該機(jī)基于分層潛在樹學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)。Ning, Pittman, and Shen (2018) 將快速對比發(fā)散算法引入 RBM,其中基于邊界的濾波和 delta 積用于減少計(jì)算中的冗余點(diǎn)積計(jì)算。為了保護(hù)多維數(shù)據(jù)的內(nèi)部結(jié)構(gòu),Ju et al. ( 2019) 提出了張量 RBM,學(xué)習(xí)隱藏在多維數(shù)據(jù)中的高級分布,其中使用張量分解來避免維災(zāi)難。

DBM是一種典型的深度架構(gòu),由多個RBM堆疊而成(Hinton&Salakhutdinov,2006)。它是一種基于預(yù)訓(xùn)練和微調(diào)訓(xùn)練策略,可以利用能量來捕捉可見物體與相應(yīng)標(biāo)簽之間的關(guān)節(jié)分布的生成模型。在預(yù)訓(xùn)練中,每個隱藏層都被貪婪地建模為在無監(jiān)督策略中訓(xùn)練的 RBM。之后,通過監(jiān)督策略中訓(xùn)練標(biāo)簽的判別信息進(jìn)一步訓(xùn)練每個隱藏層。DBN 已被用于解決許多領(lǐng)域的問題,例如數(shù)據(jù)降維、表示學(xué)習(xí)和語義哈希。具有代表性的 DBM 如圖 1 所示。

 圖 1:

2.2 堆疊式自動編碼器(SAE)  

堆疊式自動編碼器(SAE)是編碼器-解碼器架構(gòu)的典型深度學(xué)習(xí)模型(Michael,Olivier和Mario,2018;翁,盧,譚,和周,2016)。它可以通過以無監(jiān)督-監(jiān)督方式將原始輸入轉(zhuǎn)換為中間表示來捕獲輸入的簡潔特征。SAE已廣泛應(yīng)用于許多領(lǐng)域,包括降維(Wang,Yao,&Zhao,2016),圖像識別(Jia,Shao,Li,Zhao,&Fu,2018)和文本分類(Chen&Zaki,2017)。圖 2 展示了具有代表性的 SAE。    

 圖2:

2.3 卷積神經(jīng)網(wǎng)絡(luò)(CNN)  

DBN 和 SAE 是完全連接的神經(jīng)網(wǎng)絡(luò)。在這兩個網(wǎng)絡(luò)中,隱藏層中的每個神經(jīng)元都連接到前一層的每個神經(jīng)元,這種拓?fù)浣Y(jié)構(gòu)會產(chǎn)生大量連接。為了訓(xùn)練這些連接的權(quán)重,全連接的神經(jīng)網(wǎng)絡(luò)需要大量的訓(xùn)練對象來避免過度擬合和欠擬合,這是計(jì)算密集型的。此外,全連接拓?fù)洳豢紤]神經(jīng)元之間所包含的特征的位置信息。因此,完全連接的深度神經(jīng)網(wǎng)絡(luò)(DBN、SAE及其變體)無法處理高維數(shù)據(jù),尤其是大圖像和大音頻數(shù)據(jù)。

卷積神經(jīng)網(wǎng)絡(luò)是一種特殊的深度網(wǎng)絡(luò),它考慮了數(shù)據(jù)的局部拓?fù)浣Y(jié)構(gòu)(Li, Xia, Du, Lin, & Samat, 2017;Sze,Chen,Yang和Emer,2017)。卷積神經(jīng)網(wǎng)絡(luò)包括全連接網(wǎng)絡(luò)和包含卷積層和池化層的約束網(wǎng)絡(luò)。約束網(wǎng)絡(luò)使用卷積和池化運(yùn)算來實(shí)現(xiàn)局部感受野和參數(shù)約簡。與 DBN 和 SAE 一樣,卷積神經(jīng)網(wǎng)絡(luò)也通過隨機(jī)梯度下降算法進(jìn)行訓(xùn)練。它在醫(yī)學(xué)圖像識別(Maggiori,Tarabalka,Charpiat和Alliez,2017)和語義分析(胡,Lu,Li,&Chen,2014)方面取得了很大進(jìn)展。具有代表性的 CNN 如圖 3 所示。

 圖 3:    

2.4 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)  

遞歸神經(jīng)網(wǎng)絡(luò)是一種處理串行數(shù)據(jù)的神經(jīng)計(jì)算架構(gòu)(Martens & Sutskever, 2011;Sutskever,Martens和Hinton,2011)。與深度前向架構(gòu)(即DBN,SAE和CNN)不同,它不僅將輸入模式映射到輸出結(jié)果,而且還通過利用隱藏單元之間的連接將隱藏狀態(tài)傳輸?shù)捷敵觯℅raves&Schmidhuber,2008)。通過使用這些隱藏的連接,RNN 對時間依賴性進(jìn)行建模,從而在時間維度上共享對象之間的參數(shù)。它已被應(yīng)用于各個領(lǐng)域,如語音分析(Mulder,Bethard和Moens,2015),圖像標(biāo)題(Xu等人,2015)和語言翻譯(Graves&Jaitly,2014),取得了出色的性能。與深度前向架構(gòu)類似,其計(jì)算也包括前向傳遞和反向傳播階段。在前向傳遞計(jì)算中,RNN 同時獲取輸入和隱藏狀態(tài)。在反向傳播計(jì)算中,它使用時間反向傳播算法來反向傳播時間步長的損耗。圖 4 顯示了具有代表性的 RNN。   

 圖 4:

3.面向多模態(tài)數(shù)據(jù)融合的深度學(xué)習(xí)   

在本節(jié)中,我們從模型任務(wù)、模型框架和評估數(shù)據(jù)集的角度回顧了最具代表性的多模態(tài)數(shù)據(jù)融合深度學(xué)習(xí)模型。根據(jù)所使用的深度學(xué)習(xí)架構(gòu),它們分為四類。表2總結(jié)了具有代表性的多模態(tài)深度學(xué)習(xí)模型。

 表2:

代表性多模態(tài)深度學(xué)習(xí)模型摘要.

3.1 基于網(wǎng)絡(luò)的深度信念多模態(tài)數(shù)據(jù)融合  

3.1.1 示例1  

Srivastava 和 Salakhutdinov (2012) 提出了一種基于深度玻爾茲曼學(xué)習(xí)模型的多模態(tài)生成模型,通過擬合多模態(tài)數(shù)據(jù)在各種模態(tài)(如圖像、文本和音頻)上的聯(lián)合分布來學(xué)習(xí)多模態(tài)表示。

所提出的多模態(tài)DBN的每個模塊均采用無監(jiān)督逐層方式進(jìn)行初始化,并采用基于MCMC的近似方法進(jìn)行模型訓(xùn)練。    

為了評估學(xué)習(xí)到的多模態(tài)表示,執(zhí)行了大量的任務(wù),例如生成缺失模態(tài)任務(wù)、推斷聯(lián)合表示任務(wù)和判別任務(wù)。實(shí)驗(yàn)驗(yàn)證了學(xué)習(xí)到的多模態(tài)表示是否滿足所需的屬性。

3.1.2 示例2  

為了在早期有效診斷阿爾茨海默病,Suk、Lee、Shen和阿爾茨海默病神經(jīng)影像學(xué)計(jì)劃(2014)提出了一種多模態(tài)玻爾茲曼模型,該模型可以融合多模態(tài)數(shù)據(jù)中的互補(bǔ)知識。具體來說,為了解決淺層特征學(xué)習(xí)方法造成的局限性,DBN用于通過將特定領(lǐng)域的表示轉(zhuǎn)移到分層抽象表示來學(xué)習(xí)每個模態(tài)的深度表示。然后,在串聯(lián)向量上構(gòu)建單層 RBM,該向量是來自每個模態(tài)的分層抽象表示的線性組合。它用于通過構(gòu)建不同多模態(tài)特征的聯(lián)合分布來學(xué)習(xí)多模態(tài)表示。最后,根據(jù)三種典型診斷對ADNI數(shù)據(jù)集對所提出的模型進(jìn)行了廣泛的評估,實(shí)現(xiàn)了最先進(jìn)的診斷準(zhǔn)確性。

3.1.3 示例3  

為了準(zhǔn)確估計(jì)人類姿勢,Ouyang, Chu, and Wang (2014)設(shè)計(jì)了一個多源深度學(xué)習(xí)模型,該模型通過提取高階空間中身體模式的聯(lián)合分布,從混合類型、外觀得分和變形模態(tài)中學(xué)習(xí)多模態(tài)表示。在人-姿態(tài)多源深度模型中,從圖像結(jié)構(gòu)模型中提取了三種廣泛使用的模態(tài),這些模型基于條件隨機(jī)場理論組合了身體的各個部位。為了獲得多模態(tài)數(shù)據(jù),通過線性支持向量機(jī)對圖形結(jié)構(gòu)模型進(jìn)行訓(xùn)練。之后,這三個特征中的每一個都被輸入到一個兩層受限玻爾茲曼模型中,以從特定于特征的表示中捕獲高階姿態(tài)空間的抽象表示。通過無監(jiān)督初始化,每個特定模態(tài)的受限玻爾茲曼模型都會捕獲全局空間的固有表示。然后,使用RBM進(jìn)一步學(xué)習(xí)基于高級混合類型、外觀得分和變形表示的串聯(lián)向量的人體姿態(tài)表示。為了訓(xùn)練所提出的多源深度學(xué)習(xí)模型,設(shè)計(jì)了一個同時考慮身體位置和人體檢測的任務(wù)特定目標(biāo)函數(shù)。所提出的模型在LSP、PARSE和UIUC上進(jìn)行了驗(yàn)證,并產(chǎn)生了高達(dá)8.6%的改進(jìn)。    

最近,人們提出了一些新的基于DBN的多模態(tài)特征學(xué)習(xí)模型。例如,Amer、Shields、Siddiquie 和 Tamrakar ( 2018) 提出了一種用于序列事件檢測的混合方法,其中采用條件 RBM 來提取具有附加判別標(biāo)簽信息的模態(tài)和跨模態(tài)特征。Al-Waisy、Qahwaji、Ipson 和 Al-Fahdawi ( 2018) 引入了一種識別人臉的多模態(tài)方法。在這種方法中,使用基于DBN的模型對Curvelet變換捕獲的局部手工特征的多模態(tài)分布進(jìn)行建模,可以合并局部特征和深度特征的優(yōu)勢(Al-Waisy等人,2018)。

3.1.4 小結(jié)  

這些基于DBN的多模態(tài)模型使用概率圖形網(wǎng)絡(luò)將特定于模態(tài)的表示轉(zhuǎn)換為共享空間中的語義特征。然后,根據(jù)共享空間的特征對模態(tài)上的聯(lián)合分布進(jìn)行建模。這些基于DBN的多模態(tài)模型在無監(jiān)督、半監(jiān)督和監(jiān)督學(xué)習(xí)策略中更加靈活和穩(wěn)健。它們非常適合捕獲輸入數(shù)據(jù)的信息特征。然而,他們忽略了多模態(tài)數(shù)據(jù)的空間和時間拓?fù)浣Y(jié)構(gòu)。

3.2 基于堆疊自編碼器的多模態(tài)數(shù)據(jù)融合  

3.2.1 示例4    

Ngiam et al. (2011) 提出的多模態(tài)深度學(xué)習(xí)是基于堆疊自編碼器 (SAE) 的多模態(tài)數(shù)據(jù)融合最具代表性的深度學(xué)習(xí)模型。這種深度學(xué)習(xí)模型旨在解決兩個數(shù)據(jù)融合問題:跨模態(tài)和共享模態(tài)表征學(xué)習(xí)。前者旨在利用來自其他模態(tài)的知識來捕捉更好的單模態(tài)表示,而后者則在中級學(xué)習(xí)模態(tài)之間的復(fù)雜相關(guān)性。為了實(shí)現(xiàn)這些目標(biāo),設(shè)計(jì)了三種學(xué)習(xí)場景——多模態(tài)、跨模態(tài)和共享模態(tài)學(xué)習(xí),如表 3 和圖 6 所示。

 圖 6:

多模態(tài)、跨模態(tài)和共享模態(tài)學(xué)習(xí)的架構(gòu)。多模態(tài)、跨模態(tài)和共享模態(tài)學(xué)習(xí)的架構(gòu)。

表3:   多模態(tài)學(xué)習(xí)的設(shè)置。

在多模態(tài)學(xué)習(xí)場景中,音頻頻譜圖和視頻幀以線性方式連接成向量。將串聯(lián)向量饋入稀疏受限玻爾茲曼機(jī) (SRBM),以學(xué)習(xí)音頻和視頻之間的相關(guān)性。該模型只能學(xué)習(xí)多個模態(tài)的陰影聯(lián)合表示,因?yàn)橄嚓P(guān)性隱含在原始級別的高維表示中,而單層 SRBM 無法對它們進(jìn)行建模。受此啟發(fā),中級表示的串聯(lián)向量被輸入到 SRBM 中,以模擬多個模態(tài)的相關(guān)性,從而顯示出更好的性能。

在跨模態(tài)學(xué)習(xí)場景中,提出了一種深度堆疊多模態(tài)自編碼器來顯式學(xué)習(xí)模態(tài)之間的相關(guān)性。具體來說,音頻和視頻都作為特征學(xué)習(xí)中的輸入呈現(xiàn),在監(jiān)督訓(xùn)練和測試中,只有其中一個被輸入到模型中。該模型以多模態(tài)學(xué)習(xí)的方式進(jìn)行初始化,能夠很好地模擬跨模態(tài)關(guān)系。

在共享模態(tài)表示中,在去噪自編碼器的激勵下,引入了特定于模態(tài)的深度堆疊多模態(tài)自編碼器,以探索模態(tài)之間的聯(lián)合表示,尤其是在缺少一個模態(tài)時。通過將其中一個模態(tài)替換為零而擴(kuò)大的訓(xùn)練數(shù)據(jù)集被輸入到特征學(xué)習(xí)的模型中。    

最后,在CUAVE和AVLetters數(shù)據(jù)集上進(jìn)行了詳細(xì)的實(shí)驗(yàn),以評估多模態(tài)深度學(xué)習(xí)在特定任務(wù)特征學(xué)習(xí)中的性能。

3.2.2 示例5  

為了從一系列圖像(尤其是視頻)中生成視覺和語義上有效的人體骨骼,Hong,Yu,Wan,Tao和Wang(2015)提出了一種多模態(tài)深度自動編碼器來捕獲圖像和姿勢之間的融合關(guān)系。特別是,所提出的多模態(tài)深度自編碼器通過三階段策略進(jìn)行訓(xùn)練,以構(gòu)建二維圖像和三維姿態(tài)之間的非線性映射。在特征融合階段,利用多視圖超圖低秩表示,基于流形學(xué)習(xí),從一系列圖像特征(如定向梯度直方圖和形狀上下文)構(gòu)建內(nèi)部二維表示。在第二階段,訓(xùn)練單層自動編碼器來學(xué)習(xí)抽象表示,該抽象表示用于通過重建二維圖像間特征來恢復(fù)三維姿態(tài)。同時,以類似的方式訓(xùn)練單層自動編碼器,以學(xué)習(xí)三維姿勢的抽象表示。在獲得每個單一模態(tài)的抽象表示后,使用神經(jīng)網(wǎng)絡(luò)通過最小化兩個模態(tài)互表示之間的平方歐幾里得距離來學(xué)習(xí)二維圖像和三維姿態(tài)之間的多模態(tài)相關(guān)性。所提出的多模態(tài)深度自編碼器的學(xué)習(xí)由初始化和微調(diào)階段組成。在初始化中,從相應(yīng)的自編碼器和神經(jīng)網(wǎng)絡(luò)復(fù)制多模態(tài)深度自編碼器每個子部分的參數(shù)。然后,通過隨機(jī)梯度下降算法對整個模型的參數(shù)進(jìn)行進(jìn)一步微調(diào),從相應(yīng)的二維圖像中構(gòu)造出三維姿態(tài)。

3.2.3 小結(jié)  

基于SAE的多模態(tài)模型采用編碼器-解碼器架構(gòu),通過無監(jiān)督方式通過重構(gòu)方法提取內(nèi)在的模態(tài)特征和跨模態(tài)特征。由于它們基于SAE,這是一個完全連接的模型,因此需要訓(xùn)練許多參數(shù)。此外,他們忽略了多模態(tài)數(shù)據(jù)中的空間和時間拓?fù)浣Y(jié)構(gòu)。

3.3 基于卷積神經(jīng)網(wǎng)絡(luò)的多模態(tài)數(shù)據(jù)融合  

3.3.1 示例 6  

為了模擬圖像和句子之間的語義映射分布,馬,Lu,Shang和Li(2015)提出了一個多模態(tài)卷積神經(jīng)網(wǎng)絡(luò)。為了充分捕捉語義相關(guān)性,在端到端架構(gòu)中設(shè)計(jì)了三級融合策略——詞級、階段級和句子級。該架構(gòu)由影像子網(wǎng)、匹配子網(wǎng)和多模態(tài)子網(wǎng)組成。圖像子網(wǎng)是一個具有代表性的深度卷積神經(jīng)網(wǎng)絡(luò),例如Alexnet和Inception,它有效地將圖像輸入編碼為簡潔的表示。匹配子網(wǎng)對將圖像內(nèi)容與語義空間中句子的單詞片段相關(guān)聯(lián)的聯(lián)合表示進(jìn)行建模。    

3.3.2 示例 7  

為了將視覺識別系統(tǒng)擴(kuò)展到無限數(shù)量的離散類別,F(xiàn)rome等人(2013)通過利用文本數(shù)據(jù)中的語義信息提出了一種多模態(tài)卷積神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)由語言子模型和視覺子模型組成。語言子模型基于skip-gram模型,該模型可以將文本信息傳輸?shù)秸Z義空間的密集表示中。視覺子模型是一個具有代表性的卷積神經(jīng)網(wǎng)絡(luò),例如 Alexnet,它在 1000 類 ImageNet 數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練以捕獲視覺特征。為了對圖像和文本之間的語義關(guān)系進(jìn)行建模,語言和視覺子模型通過線性投影層進(jìn)行組合。每個子模型都由每個模態(tài)的參數(shù)初始化。之后,為了訓(xùn)練這種視覺語義多模態(tài)模型,提出了一種新的損失函數(shù),通過結(jié)合點(diǎn)積相似度和鉸鏈秩損失,可以為正確的圖像和標(biāo)簽對提供高相似性分?jǐn)?shù)。該模型可以在 ImageNet 數(shù)據(jù)集上產(chǎn)生最先進(jìn)的性能,避免語義上不合理的結(jié)果。    

3.3.3 小結(jié)  

基于CNN的多模態(tài)模型可以通過局部字段和池化操作來學(xué)習(xí)模態(tài)之間的局部多模態(tài)特征。它們顯式地對多模態(tài)數(shù)據(jù)的空間拓?fù)溥M(jìn)行建模。而且它們不是參數(shù)數(shù)量大大減少的完全連接模型。

3.4 基于遞歸神經(jīng)網(wǎng)絡(luò)的多模態(tài)數(shù)據(jù)融合   

3.4.1 示例 8  

為了生成圖像的標(biāo)題,毛等人(2014)提出了一種多模態(tài)遞歸神經(jīng)架構(gòu)。這種多模態(tài)遞歸神經(jīng)網(wǎng)絡(luò)可以彌合圖像和句子之間的概率相關(guān)性。它解決了以前工作無法生成新圖像標(biāo)題的局限性,因?yàn)橐郧暗墓ぷ鞲鶕?jù)學(xué)習(xí)的圖像-文本映射在句子數(shù)據(jù)庫中檢索相應(yīng)的標(biāo)題。與以前的工作不同,多模態(tài)遞歸神經(jīng)模型(MRNN)根據(jù)給定的單詞和圖像學(xué)習(xí)語義空間上的聯(lián)合分布。當(dāng)圖像出現(xiàn)時,它會根據(jù)捕獲的聯(lián)合分布逐字生成句子。具體來說,多模態(tài)遞歸神經(jīng)網(wǎng)絡(luò)由語言子網(wǎng)、視覺子網(wǎng)和多模態(tài)子網(wǎng)組成,如圖 7 所示。語言子網(wǎng)由兩層詞嵌入部分和單層循環(huán)神經(jīng)部分組成,前者捕獲有效的特定任務(wù)表示,后者對句子的時間依賴性進(jìn)行建模。視覺子網(wǎng)本質(zhì)上是一個深度卷積神經(jīng)網(wǎng)絡(luò),如Alexnet、Resnet或Inception,它將高維圖像編碼為緊湊的表示。最后,多模態(tài)子網(wǎng)是一個隱藏網(wǎng)絡(luò),它對學(xué)習(xí)語言和視覺表示的聯(lián)合語義分布進(jìn)行建模。

 圖 7:

3.4.2 示例 9  

為了解決當(dāng)前視覺識別系統(tǒng)無法一目了然地生成圖像豐富描述的局限性,通過橋接視覺和文本數(shù)據(jù)之間的模態(tài)間關(guān)系,提出了一種多模態(tài)對齊模型(Karpathy&Li,2017)。為了實(shí)現(xiàn)這一點(diǎn),提出了一個雙重方案。首先,設(shè)計(jì)了一個可視化語義嵌入模型來生成多模態(tài)訓(xùn)練數(shù)據(jù)集。然后,在此數(shù)據(jù)集上訓(xùn)練多模態(tài) RNN,以生成圖像的豐富描述。

在視覺語義嵌入模型中,區(qū)域卷積神經(jīng)網(wǎng)絡(luò)用于獲取豐富的圖像表示,這些圖像表示包含與句子相對應(yīng)的內(nèi)容的足夠信息。然后使用雙向 RNN 將每個句子編碼為具有圖像表示的相同維度的密集向量。此外,還給出了一個多模態(tài)評分函數(shù)來衡量圖像和句子之間的語義相似性。最后,利用馬爾可夫隨機(jī)場方法生成多模態(tài)數(shù)據(jù)集。

在多模態(tài)RNN中,提出了一種基于文本內(nèi)容和圖像輸入的更有效的擴(kuò)展模型。該多模態(tài)模型由對圖像輸入進(jìn)行編碼的卷積神經(jīng)網(wǎng)絡(luò)和對圖像特征和句子進(jìn)行編碼的 RNN 組成。該模型還通過隨機(jī)梯度下降算法進(jìn)行訓(xùn)練。這兩種多模態(tài)模型都在 Flickr 和 Mscoco 數(shù)據(jù)集上進(jìn)行了廣泛的評估,并實(shí)現(xiàn)了最先進(jìn)的性能。

3.4.3 小結(jié)  

基于RNN的多模態(tài)模型能夠借助隱藏單元計(jì)算中的顯式狀態(tài)傳遞來分析隱藏在多模態(tài)數(shù)據(jù)中的時間依賴性。他們使用時間反向傳播算法來訓(xùn)練參數(shù)。由于在隱藏狀態(tài)傳輸中進(jìn)行計(jì)算,因此很難在高性能設(shè)備上并行化。

4.總結(jié)與展望   

我們將模型總結(jié)為基于DBN、SAE、CNN和RNN的四組多模態(tài)數(shù)據(jù)深度學(xué)習(xí)模型。這些開創(chuàng)性的模式已經(jīng)取得了一些進(jìn)展。然而,這些模型仍處于初步階段,因此仍然存在挑戰(zhàn)。    

先,多模態(tài)數(shù)據(jù)融合深度學(xué)習(xí)模型中存在大量的自由權(quán)重,特別是對目標(biāo)任務(wù)影響不大的冗余參數(shù)。為了訓(xùn)練這些捕獲數(shù)據(jù)特征結(jié)構(gòu)的參數(shù),將大量數(shù)據(jù)輸入到基于反向傳播算法的多模態(tài)數(shù)據(jù)融合深度學(xué)習(xí)模型中,該算法計(jì)算密集且耗時。因此,如何結(jié)合現(xiàn)有的壓縮策略設(shè)計(jì)新的多模態(tài)深度學(xué)習(xí)壓縮方法也是一個潛在的研究方向。

其次,多模態(tài)數(shù)據(jù)不僅包含跨模態(tài)信息,而且包含豐富的跨模態(tài)信息。因此,深度學(xué)習(xí)和語義融合策略的結(jié)合可能是解決探索多模態(tài)數(shù)據(jù)所帶來的挑戰(zhàn)的一種方式。    

第三,從動態(tài)環(huán)境中收集多模態(tài)數(shù)據(jù),表明數(shù)據(jù)是不確定的。因此,隨著動態(tài)多模態(tài)數(shù)據(jù)的爆炸式增長,必須解決用于數(shù)據(jù)融合的在線和增量多模態(tài)深度學(xué)習(xí)模型的設(shè)計(jì)問題。

責(zé)任編輯:華軒 來源: 數(shù)據(jù)分析及應(yīng)用
相關(guān)推薦

2020-09-29 17:00:33

人工智能

2024-11-13 15:00:00

模型數(shù)據(jù)

2022-10-26 15:41:38

深度學(xué)習(xí)Deepfake機(jī)器學(xué)習(xí)

2023-04-13 15:25:14

模型

2022-02-25 10:56:08

自動駕駛傳感器技術(shù)

2023-05-28 23:26:16

多模態(tài)機(jī)器學(xué)習(xí)大腦

2024-07-01 10:19:22

2017-07-06 13:18:37

深度學(xué)習(xí)應(yīng)用問題及趨勢

2017-09-20 16:25:00

深度學(xué)習(xí)視覺領(lǐng)域計(jì)算機(jī)

2024-06-25 12:47:06

2022-10-31 09:36:47

深度學(xué)習(xí)數(shù)據(jù)集

2024-12-16 07:30:00

2025-05-21 08:47:00

2021-07-01 15:56:42

深度學(xué)習(xí)人工智能互聯(lián)網(wǎng)

2025-01-08 08:21:16

2024-05-21 07:54:30

視頻多模態(tài)語義檢索算法

2023-07-30 16:05:44

多模態(tài)學(xué)習(xí)框架自然語言

2025-08-06 09:10:10

2024-06-28 18:18:22

2025-09-08 08:20:00

AI大模型系統(tǒng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

av成人在线网站| 中文字幕日本不卡| 免费在线午夜视频| 欧美人成在线观看| 欧美日韩一区二区不卡| 久久夜色精品国产噜噜av小说| 欧美多人猛交狂配| 欧美激情免费观看| 精品一区二区在线免费观看| 色视频在线观看| 日韩a级在线观看| 日韩女优电影在线观看| 日韩久久精品| 嫩草影院一区二区三区| 免费看污久久久| 欧美性猛交xxxx| 欧美电影免费网站| 日韩精品视频播放| 国产精品美女黄网| 天涯成人国产亚洲精品一区av| 一区二区三区四区精品视频| 搜索黄色一级片| 亚洲va国产va天堂va久久| 亚洲欧美综合色| 免费一区二区三区在线视频| 欧产日产国产v| 99国产超薄肉色丝袜交足的后果 | 日韩视频免费| 亚洲av成人精品日韩在线播放| 亚洲 自拍 另类小说综合图区| 亚洲福利在线看| 久久午夜电影| 国产黄色在线网站| 免费不卡的av| 国产成人精品免高潮费视频| 欧美激情资源网| 51社区在线成人免费视频| 国产对白videos麻豆高潮| 人偷久久久久久久偷女厕| 欧美日产在线观看| 亚洲性色视频| 色综合久久影院| 一个人看的视频www| 欧美日韩性生活| 欧美精品福利| 91看片在线观看| 三级男人添奶爽爽爽视频| 国产精品视频男人的天堂| 亚洲大片在线观看| 婷婷亚洲图片| www.久久热.com| 国产激情视频网站| 91麻豆蜜桃| 欧美精品日日鲁夜夜添| 欧美专区在线| h片在线观看下载| 九九热精品免费视频| 欧美一区二区在线视频观看| 欧美精品一区二区三区高清aⅴ| 六月丁香综合在线视频| 中文字幕av一区二区三区佐山爱| 久久免费精彩视频| 国产 国语对白 露脸| 中文字幕国产精品久久| 国产亚洲一二三区| 国产一区三区在线播放| 经典三级在线| 精品少妇一区二区三区密爱| 亚洲日本无吗高清不卡| www.精品av.com| 亚洲乱码国产乱码精品精98午夜 | 日韩欧美国产午夜精品| 国产成人亚洲精品青草天美| 欧美欧美在线| 五月色婷婷综合| 97超碰在线免费观看| 色噜噜一区二区| 久久伊人精品一区二区三区| 亚洲男人的天堂一区二区| 精品91久久久久| 国产ktv在线视频| 成人a v视频| 手机看片国产精品| 精品国产第一页| 中文字幕日韩综合av| 亚洲综合激情网| 久久精品人人| 一区二区在线视频观看| 免费在线高清av| 麻豆精品一区二区三区视频| koreanbj精品视频一区| 国产精品第8页| 精品国产一区二区三区久久影院 | 午夜18视频在线观看| 性欧美精品男男| 黄色一级片在线看| 国产欧美精品在线播放| 精品亚洲一区二区三区在线观看| 最新高清无码专区| 久久精品网址| 欧美电影在线观看免费| 97超碰在线公开在线看免费| 国产偷人爽久久久久久老妇app | 亚洲综合色婷婷在线观看| 福利在线视频导航| 久久久精品免费看| 欧产日产国产精品98| 日韩精品久久一区二区| 亚洲www永久成人夜色| 最近中文字幕2019免费| 色999日韩国产欧美一区二区| 高清免费成人av| 欧美激情麻豆| 精品一区二区三区在线观看视频| 在线观看国产原创自拍视频| japanese国产在线观看| 国产在线观看h| 国产 porn| 综合操久久久| 99伊人久久| 97久久精品视频| 亚洲天堂成人在线视频| 欧美午夜精品一区二区三区| 国产精品国产a级| 国产乱妇无码大片在线观看| 欧美日韩视频一区二区三区| 91精品国产自产精品男人的天堂| 99久久精品免费观看国产| 国产 欧美 自拍| 成人免费毛片男人用品| 国产激情av在线| 亚洲另类第一页| av高清在线免费观看| 日韩精品第一页| 亚洲在线免费视频| 秋霞av国产精品一区| 中文字幕av一区二区三区谷原希美| 制服丝袜亚洲网站| 狠狠躁夜夜躁人人躁婷婷91| 国产免费成人在线视频| 成人小视频免费在线观看| 午夜亚洲视频| 黄页网站一区| 四季av在线一区二区三区| 91蜜桃臀久久一区二区| 国产日本久久| 另类激情视频| 99riav视频在线观看| 免费在线观看黄| 国产精品秘入口| 亚洲乱码在线观看| 国产又大又黄又爽| 69视频免费看| 无码人妻一区二区三区线| 国产污片在线观看| 免费在线观看av网址| 精品自拍偷拍视频| 国产成人在线网址| 神马久久久久久久久久久| 日韩一级视频在线观看| 一级特黄a大片免费| 又黄又色的网站| 日韩 中文字幕| 刘亦菲国产毛片bd| 欧美伦理片在线观看| 一本色道久久99精品综合| 亚洲aaaaaa| 亚洲色图欧美制服丝袜另类第一页 | 中文字幕第15页| 超薄肉色丝袜一二三| 免费黄色在线视频| 精品无码国产污污污免费网站| 少妇毛片一区二区三区| 中文字幕在线免费看线人| 人妻激情偷乱频一区二区三区| 国产成人强伦免费视频网站| 日本55丰满熟妇厨房伦| 亚洲综合色av| 夜夜嗨av色综合久久久综合网 | av一区和二区| 国产一区精品在线| 视频一区二区在线观看| 天天综合五月天| 国产一区二区视频播放| 午夜激情av在线| 日本一卡二卡在线| 四虎影视一区二区| 国产无遮挡又黄又爽| 中文字幕理论片| 凸凹人妻人人澡人人添| 国产三级视频在线| 精品国产99久久久久久| zzzwww在线看片免费| 亚洲图片小说区| 国产99亚洲| 亚洲国产综合在线看不卡| 免费成人在线影院| 97se狠狠狠综合亚洲狠狠| 中文字幕 久热精品 视频在线| 午夜精品福利久久久| 911精品国产一区二区在线| 亚洲女人天堂色在线7777| 欧美国产日韩中文字幕在线| 成人免费福利视频| 五月天丁香综合久久国产 | 99久久99久久精品免费观看| 中文成人综合网| 日本高清不卡视频| 亚洲男人第一网站| 国产激情久久久| 日韩中文一区| 欧美伦理片在线看| 色一情一交一乱一区二区三区| 日本三级理论片| 天堂网在线播放| 成人免费网站观看| 久久porn| 亚洲欧美日本国产专区一区| av电影在线观看一区| 五月天久久比比资源色| 亚洲国模精品一区| 青青久久av北条麻妃海外网| 日本一区免费看| а 天堂 在线| 久久精品国产亚洲av麻豆色欲| 日本成人动漫在线观看| 免费成人直播| 午夜影院欧美| 91视频在线观看免费| 欧美综合久久久| 久久av.com| 日本午夜精品电影| 中文字幕第六页| 天堂网免费视频| 亚洲资源一区| 国产一区二区三区探花| 国产一区不卡视频| 91传媒视频在线播放| www.亚洲一区| 日韩免费中文专区| 久久av一区二区三| 在线观看毛片av| 小草在线视频免费播放| 2023国产精品久久久精品双| 99精品久久免费看蜜臀剧情介绍| 欧美亚洲国产一区在线观看网站| 欧美成人在线免费视频| 亚洲资源视频| 亚洲理论片在线观看| 免费av网站观看| 96sao精品免费视频观看| 日韩高清在线电影| 午夜精品久久一牛影视| 欧美国产乱视频| 欧美狂野激情性xxxx在线观| 911国产在线| 999国产在线视频| 91欧美在线| ...xxx性欧美| 色噜噜狠狠狠综合曰曰曰88av| 黄色99视频| 日本xxx在线播放| 色视频精品视频在线观看| 日韩欧美黄色| 久久精品免费在线观看| 亚洲性生活视频| 亚洲欧美电影在线观看| 91禁男男在线观看| 欧美a免费在线| 欧美高清一区| 狠狠做深爱婷婷久久综合一区| 久久久久久久久国产| 精品中文字幕av| 欧美成人一区二区视频| 国产精品99精品一区二区三区∴| 日韩福利电影在线观看| 欧美一区日韩一区| 国产亚洲精品久久飘花| 青青草视频成人| www在线免费观看视频| 国产精品扒开腿做爽爽爽软件| 亚洲国产精品人人做人人爽| 国产第一区电影| 亚洲怡红院在线| 欧美zozo| 国产欧美不卡| 91精品国产手机| 欧美精品久久久| 国产亚洲精品久久777777| 欧美gay视频| 国产成人精品免费在线| 亚洲免费av片| 少妇大叫太大太粗太爽了a片小说| 性高潮视频在线观看| www.亚洲一二| 亚洲黄色片在线观看| 国产伊人精品在线| 欧美人与性囗牲恔配| 超碰在线资源| 国产aⅴ精品一区二区三区色成熟| 中文字幕视频在线免费欧美日韩综合在线看 | 色欲av永久无码精品无码蜜桃| 日韩欧美视频专区| 色婷婷国产精品| 开心色怡人综合网站| 国产午夜视频在线播放| 亚洲午夜精品| 亚洲自拍偷拍欧美| 国产高清一区视频| 国产亚洲成人av| 国产香蕉精品| 午夜视频一区二区| 麻豆久久久av免费| 亚洲s码欧洲m码国产av| 日韩深夜福利| 欧美性猛交xxxx乱大交极品| 蜜桃网站成人| 波多野结衣一区二区三区在线| 在线日韩一区| 欧美揉bbbbb揉bbbbb| 日本三级福利片| 日本中文在线视频| 日韩高清在线观看一区二区| 亚洲高清中文字幕| 免费亚洲一区二区| 亚洲天堂男人网| 亚洲免费二区| 亚洲欧美国产一区二区三区| 成人在线观看黄| 2021国产在线| 久久久99免费| 亚洲www在线| 69视频免费看| 99国产精品自拍| 精品国产区一区二区三区在线观看| 黄色一级片免费播放| 免费毛片b在线观看| 国产精品人妖ts系列视频| 国产a一区二区| 国产精品国产三级国产普通话对白 | 免费在线播放电影| 中文字幕精品三区| 国产一区二区三区四区hd| 九九热最新视频| 日韩视频精品在线观看| 两个人的视频www国产精品| 久久久久亚洲av无码a片| 精品亚洲自拍| 精品国产免费久久| 天堂网成人在线| 在线成人免费| 欧美精品日韩一区| 99re精彩视频| 日本电影久久久| 欧美日韩高清一区二区不卡| 能看的毛片网站| 福利一区二区免费视频| 在线观看一区日韩| 国产熟女高潮视频| 少妇视频在线观看| 婷婷中文字幕一区三区| 91专区在线观看| 成人小电影网站| 欧美性一区二区| 在线免费观看视频黄| 人人鲁人人莫人人爱精品| 色av一区二区| 亚洲色图偷拍视频| 国产成人久久精品一区二区三区| 69p69国产精品| 日本中文字幕精品| 人人香蕉久久| 中文精品99久久国产香蕉| 久久视频一区二区三区| 欧美好骚综合网| 久久人91精品久久久久久不卡| 在线观看亚洲欧美| 蜜臀久久99精品久久久画质超高清 | 一级欧美一级日韩片| 久久综合欧美| 久久夜精品香蕉| 日韩毛片一区二区三区| 另类小说视频一区二区| 国产乱码精品一区二区三区日韩精品| 午夜影院免费视频| 国产精品美女一区二区| 成年人网站国产| 国产成人免费av一区二区午夜| 亚洲精品一区二区三区四区高清 | 欧美区一区二区| 尤物tv国产一区| 国产一级aa大片毛片| 奇米精品一区二区三区四区| 国产精品一 二 三| 久操视频在线免费播放| 91豆麻精品91久久久久久| 91九色蝌蚪porny| 欧美日韩一区自拍 | 中文字幕在线有码| 日本中文字幕一区|