精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

mPLUG-達(dá)摩院開(kāi)源多模態(tài)對(duì)話大模型技術(shù)與應(yīng)用解析

人工智能
mPLUG-Owl 是阿里巴巴達(dá)摩院 mPLUG 系列的最新工作,延續(xù)了 mPLUG 系列的模塊化訓(xùn)練思想,把 LLM 升級(jí)為一個(gè)多模態(tài)對(duì)話大模型。在 mPLUG 系列工作中,之前的 E2E-VLP 、mPLUG 、mPLUG-2 分別被 ACL2021 、EMNLP2022、ICML2023 錄用,其中 mPLUG 工作在 VQA 榜單首超人類的成績(jī)。

純文本大模型方興未艾,多模態(tài)領(lǐng)域也開(kāi)始涌現(xiàn)出多模態(tài)對(duì)話大模型工作,地表最強(qiáng)的 GPT-4 具備讀圖的多模態(tài)能力,但是遲遲未向公眾開(kāi)放體驗(yàn),于是乎研究社區(qū)開(kāi)始在這個(gè)方向上發(fā)力研究并開(kāi)源。MiniGPT-4 和 LLaVA 問(wèn)世不久,阿里達(dá)摩院便推出mPLUG-Owl ,一個(gè)基于模塊化實(shí)現(xiàn)的多模態(tài)對(duì)話大模型。mPLUG-Owl 是阿里巴巴達(dá)摩院 mPLUG 系列的最新工作,延續(xù)了 mPLUG 系列的模塊化訓(xùn)練思想,把 LLM 升級(jí)為一個(gè)多模態(tài)對(duì)話大模型。在 mPLUG 系列工作中,之前的 E2E-VLP 、mPLUG 、mPLUG-2 分別被 ACL2021 、EMNLP2022、ICML2023 錄用,其中 mPLUG 工作在 VQA 榜單首超人類的成績(jī)。本文將分享mPLUG的工作,即多模態(tài)對(duì)話大模型技術(shù)與應(yīng)用解析。

https://github.com/X-PLUG/mPLUG-Owl。

一、多模態(tài)大模型技術(shù)發(fā)展歷程

首先介紹一下多模態(tài)大模型技術(shù)的發(fā)展歷程。ChatGPT4展現(xiàn)了非常強(qiáng)的多模態(tài)能力。在今年之前多模態(tài)的研究熱點(diǎn)主要圍繞在多模態(tài)預(yù)訓(xùn)練。

圖片

多模態(tài)預(yù)訓(xùn)練大概開(kāi)始于18年前后,是多模態(tài)領(lǐng)域最重要的研究方向之一,并且在實(shí)際業(yè)務(wù)中有著非常廣的應(yīng)用場(chǎng)景。多模態(tài)預(yù)訓(xùn)練最經(jīng)典的四個(gè)任務(wù),比如VQA視覺(jué)問(wèn)答,上傳一張圖片以及一個(gè)問(wèn)題,就可以讓機(jī)器回答出相關(guān)答案;ImageCaption,給一張圖片,可以生成answer;還有跨模態(tài)檢索,以及Visual Grounding。

圖片

剛開(kāi)始的18,19年是基于檢測(cè)特征的兩階段方法,包括UNITER,LXMERT等經(jīng)典方法。2021年,進(jìn)入了端到端的方法,包括CLIP、ViLT等。2022年開(kāi)始嘗試大一統(tǒng)的方法,通過(guò)一個(gè)統(tǒng)一的模型解決圖文、視頻文本這種單模態(tài)的相關(guān)任務(wù),以及Scaling up增加模型size以及預(yù)訓(xùn)練的數(shù)據(jù)量。最近幾個(gè)月最主要的工作就是多模態(tài)對(duì)話大模型。因?yàn)镚PT4并沒(méi)有公開(kāi)其模型和demo,所以最近有很多類GPT4的工作,包括miniGPT4以及mPLUG-Owl的工作。

在多模態(tài)預(yù)訓(xùn)練領(lǐng)域最重要的榜單就是VQA Leaderboard。mPLUG在2021年VQA Challenge排名第一,以81.26的成績(jī)首次超越了人類。現(xiàn)在最高的效果已經(jīng)達(dá)到了86.26,并且是一個(gè)端到端的模型。這些都向我們展示了多模態(tài)預(yù)訓(xùn)練發(fā)展的迅速。無(wú)論是從預(yù)訓(xùn)練的角度還得對(duì)話的角度,都是多模態(tài)研究最重要的方向。

下面介紹一下多模態(tài)預(yù)訓(xùn)練技術(shù)的發(fā)展歷程。

圖片

在18,19年,多模態(tài)預(yù)訓(xùn)練開(kāi)始成為最重要的一個(gè)研究方向的時(shí)候,大家主要是基于目標(biāo)檢測(cè)的視覺(jué)特征抽取,做單/雙流的圖文特征融合,其中代表性工作包括單流UNITER,雙流LXMERT。

進(jìn)入2020年,大家開(kāi)始嘗試端到端的方法,因?yàn)橹暗膬呻A段方法存在效率不高的問(wèn)題,以及領(lǐng)域遷移的問(wèn)題。其中代表性工作基于Resnet的Pixel-BERT、E2E-VLP,以及Transformer的VILT。

2021年,開(kāi)始了數(shù)據(jù)以及模型規(guī)模的Scaling-up,其中代表性的工作包括ALBEF、SimVLM、mPLUG。

2022之后,大家開(kāi)始基于大一統(tǒng)的方法,可以做單/多模態(tài),其中代表性工作包括Coca,F(xiàn)lamingo以及mPLUG-2。

圖片

今年ChatGPT大火,我們通過(guò)GPT4的一些case可以看到,它有著非常強(qiáng)的視覺(jué)內(nèi)容細(xì)粒度理解與推理能力,這已經(jīng)超越了很多之前的方法。比如上圖中左側(cè)的這個(gè)例子,它已經(jīng)能識(shí)別出插口是VGA的,以及手機(jī)是iPhone的,并且能夠給出比較詳細(xì)的結(jié)果。右側(cè)圖的這個(gè)case是對(duì)笑話的理解能力,也是非常細(xì)粒度的。

圖片

GPT4還展示了非常強(qiáng)的視覺(jué)內(nèi)容富文本圖片表格理解與推理能力。

這非常符合自動(dòng)化辦公的要求,documentAI 之前都是用一個(gè)非常復(fù)雜的系統(tǒng)來(lái)做的,既需要做OCR,還需要理解圖片布局,才能做summary,其中的步驟是非常復(fù)雜的。GPT4能用一個(gè)端到端的方法非常詳細(xì)地理解表格中的內(nèi)容,并且具有非常強(qiáng)的文本生成能力。

圖片

上圖左側(cè)是一個(gè)數(shù)學(xué)公式,GPT4能夠理解其中的內(nèi)容,并給出數(shù)學(xué)推導(dǎo)。右側(cè)是一篇論文,GPT4能夠理解得非常詳細(xì)。驚喜點(diǎn)在于這里的文本是比較長(zhǎng)的,并且里面既有圖片又有表格,格式復(fù)雜,而GPT4能夠理解這篇論文講的是什么,要解決的是什么,并給出非常好的summary。這些都展示了GPT4非常強(qiáng)大的富文本圖片理解能力和表格理解能力。

但GPT4并沒(méi)有開(kāi)源demo,現(xiàn)有的demo還是純文本模型,所以從三四月份開(kāi)始相繼發(fā)布了很多類GPT4的模型。

圖片

多模態(tài)對(duì)話大模型主要分成兩類,第一類基于系統(tǒng),將ChatGPT作為一個(gè)中樞,將視覺(jué)信息轉(zhuǎn)換成文本信息,通過(guò)ChatGPT進(jìn)行信息的整理與回復(fù)。其中代表性工作有Visual ChatGPT、MM-REACT以及HuggingGPT。

圖片

第二類模型是端到端的,這種更類似ChatGPT。這類工作主要基于一個(gè)非常強(qiáng)的文本大模型,通過(guò)一個(gè)視覺(jué)backbone來(lái)做文本的對(duì)齊。這種類GPT4的工作希望能夠通過(guò)一個(gè)模型同時(shí)擁有多模態(tài)與文本的能力。代表性工作有MiniGPT-4、LLAVA、Kosmos,以及達(dá)摩院的mPLUG-Owl。

二、多模態(tài)對(duì)話大模型mPLUG技術(shù)與應(yīng)用解析

圖片

mPLUG是一個(gè)模塊化的多模態(tài)模型,圖文的mPLUG以及大一統(tǒng)的mPLUG-2這兩個(gè)工作分別在EMNLP2022和ICML2023發(fā)表。mPLUG系列多模態(tài)預(yù)訓(xùn)練工作,借鑒了人腦的模塊化思想,針對(duì)不同模態(tài)input,不同模態(tài)output,因?yàn)椴煌B(tài)特有屬性針對(duì)不同的功能設(shè)計(jì)不同的模塊,進(jìn)行層次化的預(yù)訓(xùn)練,這樣可以輕量化,可拆拔的靈活應(yīng)用到各種Zero/Few-Shot、Continue Pretrain、下游Finetuning,以及多模態(tài)表征等層次化應(yīng)用場(chǎng)景。所以mPLUG系列工作的主要思想就是層次模塊化、輕量化,這樣我們可以用一個(gè)比較統(tǒng)一的模型應(yīng)用到各種復(fù)雜的場(chǎng)景。

上圖左側(cè)是mPLUG-2的一個(gè)工作,我們針對(duì)不同的模態(tài)拆分成不同的模塊來(lái)做特定的任務(wù),比如Video captioning需要做Video-Encoder和Text-Encoder,Universal Layers用來(lái)做對(duì)齊,VL Fusion用來(lái)做模態(tài)融合然后輸入到Video-Decoder輸出結(jié)果。右側(cè)給出了現(xiàn)有的大一統(tǒng)模型,比如BEiT-3、Coca、Flamingo這些都很難在CV和NLP任務(wù)取得SOTA效果。我們分析其原因都是因?yàn)闆](méi)有這種模塊化、輕量化的概念,所以很難用一個(gè)大一統(tǒng)的模型來(lái)做各種模態(tài)的任務(wù),并且不同模態(tài)之間沒(méi)有做好協(xié)同,不同模態(tài)之間的差距還是很大的。所以我們就提出了mPLUG模塊化多模態(tài)模型。

右下角是mPLUG給出的一個(gè)table,對(duì)于不同的單模態(tài)或多模態(tài)任務(wù)如何組合不同的module。這就是我們之前做的兩個(gè)工作,一個(gè)是圖文mPLUG,一個(gè)是大一統(tǒng)模型mPLUG-2。我們?cè)?0+的任務(wù)上取得了SOTA。這個(gè)工作也發(fā)表在了ICML上。如果大家感興趣,可以去看一下具體的文章。

圖片

接下來(lái)將重點(diǎn)介紹多模態(tài)對(duì)話大模型mPLUG-Owl的工作。這個(gè)工作我們也在github上進(jìn)行了開(kāi)源。最近我們也在第三方上海人工智能實(shí)驗(yàn)室OpenGVLab組織的人工標(biāo)注評(píng)測(cè)多模態(tài)LLM榜單排名第一!與其對(duì)比的是前面提到的一些比較經(jīng)典的模型,比如LLaVA,MiniGPT4,Otter等等。

mPLUG-Owl有非常多的應(yīng)用場(chǎng)景,比如下圖的旅游指南和創(chuàng)意文案。

比如給出一個(gè)富士山的圖片,讓模型給出一個(gè)兩天的行程計(jì)劃。mPLUG-Owl可以給出非常詳細(xì)的旅游指南。右側(cè)的例子是創(chuàng)意文案,給出一張圖片讓模型寫(xiě)一首詩(shī),mPLUG-Owl可以給出比較優(yōu)美的一首詩(shī)。

應(yīng)用場(chǎng)景還包括使用指南和展覽向?qū)А?/span>

圖片

比如給出一個(gè)錘子,問(wèn)模型該如何使用。我們還對(duì)說(shuō)明書(shū),以及非常長(zhǎng)的document進(jìn)行了測(cè)試,mPLUG-Owl都可以給出非常詳細(xì)的描述。右側(cè)這種展覽向?qū)Вo模型一個(gè)圖片,模型可以為我們展示非常詳細(xì)信息,比如圖片的源頭,以及一些發(fā)散性的創(chuàng)作。

下面具體介紹一下mPLUG-Owl的工作。

圖片

mPLUG-Owl是模塊化的結(jié)構(gòu), Visual Encoder我們拿了一個(gè)預(yù)訓(xùn)練好的VIT。文本的大模型包括LLaMA,GPT等。我們也上線了中文的多語(yǔ)言模型。

我們拿兩種模塊化的單模態(tài)的模型加入Visual Abstractor的model,因?yàn)樵诙嗄B(tài)里面端到端的方法存在一個(gè)問(wèn)題,視覺(jué)的長(zhǎng)度比較長(zhǎng),所以我們需要做降序列的操作,將序列長(zhǎng)度降下來(lái),就很容易擬合到純文本的LLaMA、GPT這種結(jié)構(gòu)里面。

我們采用了兩階段的方法,第一階段進(jìn)行預(yù)訓(xùn)練,用海量的圖文pair,主要是為了學(xué)習(xí)視覺(jué)的對(duì)象,把文本和視覺(jué)對(duì)應(yīng)起來(lái),比如人物、地點(diǎn)以及概念,通過(guò)預(yù)訓(xùn)練將它們對(duì)齊。所以在預(yù)訓(xùn)練階段,將視覺(jué)的Encoder、 abstract以及summarize這些模塊放開(kāi),文本模塊freeze住。讓視覺(jué)特征和文本特征更好的對(duì)齊,從而更好地學(xué)習(xí)視覺(jué)的一些概念。第二階段是為了開(kāi)發(fā)視覺(jué)的一些能力,所以我們把視覺(jué)的abstract和Encoder板塊freeze住,文本的部分打開(kāi),加輕量化的LoRA。

圖片

我們也與現(xiàn)有方法進(jìn)行了對(duì)比,像MiniGPT4、Kosmos、LLaVA,大家的工作都是比較類似的,區(qū)別就在于如何做預(yù)訓(xùn)練。與其它方法相比,我們的特點(diǎn)主要在第一階段將視覺(jué)放開(kāi),因?yàn)槲覀冋J(rèn)為視覺(jué)和文本對(duì)齊是非常重要的,需要學(xué)習(xí)這些視覺(jué)的概念;第二階段是要把文本部分放開(kāi),這樣就能開(kāi)發(fā)出文本的SFD能力以及多模態(tài)的SFD的能力。

圖片

之前的工作比如MiniGPT4、LLaVA等,并沒(méi)有做詳細(xì)的性能評(píng)測(cè),只是開(kāi)源了一些demo讓大家來(lái)體驗(yàn)。我們構(gòu)建了一個(gè)多模態(tài)指令評(píng)測(cè)集OwlEval來(lái)評(píng)測(cè)不同的模型,包括OpenFlamingo、BLIP-2、MiniGPT4,LLaVA,以及我們的mPLUG-Owl。

評(píng)分指標(biāo)主要分為四類,進(jìn)行人工評(píng)測(cè)。A:聽(tīng)懂人類的指令,且回答滿意;B:聽(tīng)懂指令,但是回答部分會(huì)存在一些錯(cuò)誤;C:聽(tīng)懂指令,但是回答錯(cuò)誤或者用戶不滿意;D:聽(tīng)不懂指令或者無(wú)效的回答。

我們首先對(duì)知識(shí)問(wèn)答進(jìn)行評(píng)測(cè)。

圖片

對(duì)比的模型有MM-REACT、MiniGPT-4,可以看到mPLUG-Owl給出的回復(fù)非常正確。能夠清楚的理解人類的意圖,并且回答的也是非常正確的。所以我們給出的score是A,MiniGPT-4是B,而MM-REACT的knowledge不太好。

第二個(gè)是多輪對(duì)話的評(píng)測(cè)。

圖片

首先模型要能夠不停的聊,并且能夠理解指代關(guān)系,比如姚明和杜峰的這個(gè)例子,問(wèn)第二個(gè)問(wèn)題的時(shí)候問(wèn)模型左邊是誰(shuí)?更高的是誰(shuí)?這種有指代關(guān)系的問(wèn)題,mPLUG-Owl回復(fù)的都比較好。

圖片

接下來(lái)我們也進(jìn)行了笑話理解的測(cè)試。

MM-REACT很難理解,最終得分是c。GPT-4回答的就非常好,GPT-4的笑話理解和細(xì)粒度理解能力確實(shí)非常強(qiáng)。mPLUG-Owl回答的也算不錯(cuò),至少明白了它的意圖,給出的答案是有一些錯(cuò)誤的,稍微有一些幻覺(jué),但整體來(lái)說(shuō)回答的還是不錯(cuò)的,也展示了mPLUG-Owl非常強(qiáng)的細(xì)粒度理解能力。

我們?cè)谠u(píng)測(cè)的時(shí)候也發(fā)現(xiàn)了mPLUG-Owl的涌現(xiàn)能力,超出了我們的想象。

圖片

我們?cè)陬A(yù)訓(xùn)練的時(shí)候主要是通過(guò)圖文pair,并沒(méi)有加入多圖和OCR的能力,我們進(jìn)行了一些多圖的能力測(cè)試。對(duì)于上圖左側(cè)兩張姚明相關(guān)的圖片,mPLUG-Owl也展示了給出多圖之間關(guān)系的能力。右側(cè)四張圖的漫畫(huà),也進(jìn)一步說(shuō)明了mPLUG-Owl的能力。

還有OCR的能力。

圖片

針對(duì)給出的文章首頁(yè)截圖,mPLUG-Owl能夠很好的理解文章的標(biāo)題和摘要,展現(xiàn)了mPLUG-Owl的OCR的能力。

我們也將其擴(kuò)展到了視頻。我們與優(yōu)酷聯(lián)合發(fā)布了一個(gè)最大的中文數(shù)據(jù)集YouKu-mPLUG,基于此又將其擴(kuò)展到了mPLUG-Owl視頻理解。

圖片

例如上圖左側(cè),模型能夠很好地理解視頻內(nèi)容。右側(cè)是基于視頻進(jìn)行一些創(chuàng)作。并且明白了視頻里面的步驟。這些都展示了模型較強(qiáng)的視頻理解能力。

前面也提到了我們發(fā)布的多語(yǔ)言版本。

圖片

我們希望模型能夠支持更多的中文場(chǎng)景,我們也開(kāi)源了一個(gè)多語(yǔ)言版本,上圖是幾個(gè)case,都展現(xiàn)了mPLUG-Owl的多語(yǔ)言能力。多語(yǔ)言還包含其他語(yǔ)言,比如法語(yǔ)、日語(yǔ)、葡萄牙語(yǔ)等。

圖片

這些都展示了mPLUG-Owl的多語(yǔ)言能力。

剛剛也提到了我們與優(yōu)酷聯(lián)合發(fā)布了一個(gè)業(yè)內(nèi)最大的中文視頻數(shù)據(jù)集YouKu-mPLUG,也是為了推動(dòng)中文社區(qū)的發(fā)展。我們也訓(xùn)練mPLUG-Video中文視頻對(duì)話模型。我們可以基于視頻進(jìn)行多輪的對(duì)話,以及剛剛提到的OCR的能力。以及knowledge的能力都表現(xiàn)的非常好。因?yàn)楝F(xiàn)在中文沒(méi)有海量的視頻數(shù)據(jù)集,如果大家對(duì)我們這個(gè)視頻數(shù)據(jù)集比較感興趣也可以到我們這個(gè)鏈接下進(jìn)行下載。

我們還做了mPLUG-Owl的消融實(shí)驗(yàn)。

圖片

證明了多模態(tài)預(yù)訓(xùn)練和文本的instruction以及多模態(tài)instruction相關(guān)的能力,針對(duì)上圖的六項(xiàng)能力,我們的策略對(duì)模型的提升是比較明顯的,也證明了我們的訓(xùn)練策略和多模態(tài)指令微調(diào)數(shù)據(jù)的有效性。

圖片

剛剛提到了我們與優(yōu)酷聯(lián)合發(fā)布了一個(gè)業(yè)內(nèi)最大的中文視頻數(shù)據(jù)集YouKu-mPLUG,我們也加入了非常多的安全策略,對(duì)數(shù)據(jù)集做了一些過(guò)濾。我們的數(shù)據(jù)集分布比較均勻,大概有45個(gè)類,我們基于數(shù)據(jù)集標(biāo)注了一個(gè)benchmark,包含了分類,檢索等等。都是為了推動(dòng)中文多模態(tài)社區(qū)發(fā)展。因?yàn)橹形亩嗄B(tài)社區(qū)發(fā)展受限的一個(gè)主要原因就是沒(méi)有中文預(yù)訓(xùn)練多模態(tài)數(shù)據(jù)集。第二是沒(méi)有benchmark,無(wú)法做公平的對(duì)比。這也是YouKu-mPLUG的初心。

圖片

上面是我們數(shù)據(jù)的一些case,分布還是比較廣泛的,包括影視,綜藝等等。模型的結(jié)果跟mPLUG-Owl比較類似,只是將一個(gè)文本的模塊擴(kuò)展成視頻的模塊。對(duì)應(yīng)的任務(wù)包括Video Category Prediction以及Video Captioning,基于mPLUG-Owl的結(jié)構(gòu)都取得了不錯(cuò)的效果和明顯的提升。

三、ModelScope實(shí)戰(zhàn)分享

圖片

mPLUG-Owl在ModelScope上開(kāi)源了很多的模型,包括mPLUG-Owl模型以及mPLUG圖文模型、視頻模型等等。大家在ModelScope上搜索模型庫(kù)輸入mPLUG就能查看相關(guān)模型。

圖片

使用也是非常簡(jiǎn)單,將ModelScope安裝之后,直接導(dǎo)入指定好的模型,輸入圖片以及輸入問(wèn)題,就可以得到模型給出的答案。比如我們問(wèn)這個(gè)人的情緒是怎么樣的?模型會(huì)給出“he is angry”。

ModelScope創(chuàng)空間給出了一些demo。

圖片

mPLUG-Owl的兩個(gè)demo包括英文版本和多語(yǔ)言版本也在創(chuàng)空間進(jìn)行了開(kāi)源。點(diǎn)開(kāi)后是一個(gè)聊天的界面,如果大家對(duì)我們的工作感興趣也可以通過(guò)上圖中的鏈接到ModelScope創(chuàng)空間進(jìn)行體驗(yàn)。

圖片

同時(shí),我們的工作也在huggingface和github進(jìn)行了開(kāi)源,左側(cè)是huggingface的使用指南,也歡迎大家進(jìn)行使用體驗(yàn)。

四、mPLUG項(xiàng)目主頁(yè)

圖片

文中提到的mPLUG的工作都已在github進(jìn)行了開(kāi)源,github項(xiàng)目名為X-PLUG,里面包含了mPLUG-2多模態(tài)模塊化大一統(tǒng)模型,以及mPLUG-Owl多模態(tài)對(duì)話大模型。項(xiàng)目主頁(yè)上還包括文中提到的我們與優(yōu)酷聯(lián)合發(fā)布的中文視頻數(shù)據(jù)集YouKu-mPLUG,我們的論文、代碼以及數(shù)據(jù)集的鏈接。歡迎大家star和fork!

如果對(duì)創(chuàng)空間感興趣,可以直接掃描上面的二維碼進(jìn)行體驗(yàn),包括英文和多語(yǔ)言兩個(gè)版本。

整個(gè)X-PLUG體系還包含了很多其它模型,我們也建立了一個(gè)討論區(qū),歡迎大家掃碼加入討論區(qū),或者訪問(wèn)我的知乎鏈接,進(jìn)行交流。

五、問(wèn)答環(huán)節(jié)

Q1:剛剛提到了和優(yōu)酷聯(lián)合發(fā)布的中文視頻數(shù)據(jù)集,能否介紹一下這個(gè)數(shù)據(jù)集可以用到什么場(chǎng)景去解決什么樣的問(wèn)題?

A:YouKu-mPLUG這個(gè)數(shù)據(jù)集的初衷是要補(bǔ)齊中文社區(qū)沒(méi)有中文視頻預(yù)訓(xùn)練多模態(tài)數(shù)據(jù)集的短板。我們現(xiàn)在的應(yīng)用場(chǎng)景更多的是短視頻,比如抖音、快手等等,沒(méi)有這種視頻數(shù)據(jù)集,會(huì)非常影響這種視頻應(yīng)用場(chǎng)景的發(fā)展。并且我們也加入了非常多的安全策略,對(duì)數(shù)據(jù)集做了一些過(guò)濾。

第一是為了推動(dòng)中文多模態(tài)社區(qū)發(fā)展。第二是視頻領(lǐng)域比較經(jīng)典的任務(wù)沒(méi)有benchmark大家不好做公平的對(duì)比。第三是為了推動(dòng)更多的視頻應(yīng)用場(chǎng)景,包括視頻生成和視頻編輯。公開(kāi)這個(gè)數(shù)據(jù)集也是為了讓工業(yè)界和學(xué)術(shù)界來(lái)做更多的應(yīng)用和研究,這也是YouKu-mPLUG的初心。

Q2:多模態(tài)在NLP方面可以怎么使用?用在什么方面?

A:現(xiàn)在的多模態(tài)和NLP是聯(lián)系緊密的,當(dāng)前的多模態(tài)更偏向NLP,因?yàn)槟P偷膐utput是文本。output是視覺(jué)的,比如視頻生成、圖片生成是屬于另外一個(gè)分支。output是文本的跟NLP走的是比較緊密的。區(qū)別只是輸入多了一個(gè)圖片而已,所以NLP的很多技術(shù)也是在多模態(tài)有應(yīng)用的。多模態(tài)預(yù)訓(xùn)練這部分工作應(yīng)該很多都是做NLP出身的,現(xiàn)在的很多應(yīng)用場(chǎng)景,很難是單文本的,包括ChatGPT讓我們經(jīng)驗(yàn)的一個(gè)點(diǎn)也是他是多模態(tài)的。無(wú)論我們輸入圖片還是文本,都能夠非常流暢地進(jìn)行對(duì)話,所以多模態(tài)在NLP的應(yīng)用場(chǎng)景是非常廣的,多模態(tài)可能跟文本唯一不一樣的地方就是需要你完全理解圖片,所以我覺(jué)得這兩個(gè)方向是不分家的。

責(zé)任編輯:姜華 來(lái)源: DataFunTalk
相關(guān)推薦

2023-05-08 10:14:07

模型AI

2023-05-30 10:23:45

模型研究

2024-12-30 00:01:00

多模態(tài)大模型Python

2024-11-11 15:11:23

2024-08-19 13:35:09

2025-09-16 09:35:52

2025-01-08 08:21:16

2023-06-08 11:45:50

模型語(yǔ)言

2023-09-02 12:49:01

2025-02-27 01:00:00

大模型OLMOCRrag

2025-05-20 08:30:00

2023-05-15 12:14:02

ChatGPT語(yǔ)音模型

2025-05-23 09:18:25

2025-08-05 02:25:00

多模態(tài)大語(yǔ)言模型

2024-03-25 12:30:18

AI訓(xùn)練開(kāi)源

2021-06-22 15:56:24

人工智能深度語(yǔ)言開(kāi)源

2024-01-22 13:59:00

模型訓(xùn)練

2024-05-10 06:59:06

2021-01-13 12:39:46

科技趨勢(shì)電子器件量子霸權(quán)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产精品国产亚洲精品| 国产色在线 com| 亚洲午夜伦理| 精品视频在线播放色网色视频| 自拍日韩亚洲一区在线| 国产中文在线| 国产在线精品国自产拍免费| 欧美黑人性生活视频| 成人免费av片| 97精品资源在线观看| 亚洲一区二区三区四区的| 久久精品女人的天堂av| 在线免费观看视频网站| 亚洲图片在线| 最近2019免费中文字幕视频三 | 国产综合一区二区| 91精品国产乱码久久久久久蜜臀 | 深夜视频在线观看| 成人欧美magnet| 亚洲女人的天堂| 蜜桃久久影院| 亚洲第一视频在线播放| 日本欧美在线看| 欧美极品少妇xxxxx| 秋霞网一区二区三区| 国内露脸中年夫妇交换精品| 欧美日韩久久不卡| 免费av观看网址| а天堂中文在线官网| 国产三级精品三级在线专区| 高清视频在线观看一区| 伊人影院中文字幕| 美女视频一区免费观看| 欧美激情视频在线观看| 性色国产成人久久久精品| 亚洲国产欧美日韩在线观看第一区| 欧美一区二区免费观在线| 国产嫩草在线观看| 竹内纱里奈兽皇系列在线观看| 一级女性全黄久久生活片免费| 亚洲精品一区二区三区樱花| 青青视频在线观| av综合在线播放| 亚洲伊人一本大道中文字幕| 在线观看国产精品入口男同| 久久一区视频| 4p变态网欧美系列| 国产无遮挡aaa片爽爽| 一区二区三区毛片免费| 精品国产一区久久久| 欧美精品日韩在线| av亚洲免费| 日韩电影大全免费观看2023年上| 中国老熟女重囗味hdxx| 国产亚洲人成a在线v网站| 日韩欧美国产骚| 久久久久久久久久久福利| 国产99在线| 性做久久久久久免费观看| 国产欧美123| 先锋成人av| 亚洲综合男人的天堂| 国产高清不卡无码视频| 欧洲黄色一区| 午夜av区久久| 国产精品免费观看久久| 丝袜美腿诱惑一区二区三区| 欧美性xxxx18| 亚洲激情在线观看视频| 91av一区| 欧美精品少妇一区二区三区| 奇米777在线| 日韩精品一区二区三区中文| 欧美成人综合网站| 亚洲色偷偷色噜噜狠狠99网| 伦理一区二区| 国产亚洲xxx| 日本二区三区视频| 欧美日韩成人| 97av在线影院| 亚洲综合成人av| 黑人巨大精品欧美黑白配亚洲| 91精品视频免费观看| 亚洲爱爱综合网| 91免费版在线| 亚洲一区三区视频在线观看| 青草青在线视频| 欧美日韩一区二区精品| 亚洲欧美视频二区| 亚洲天堂av资源在线观看| 亚洲国产精品成人精品| 亚洲av熟女国产一区二区性色| 久久久久久久久丰满| 国内精品久久久久久久| 久草视频在线免费| 国产成人午夜精品影院观看视频| 欧美日产一区二区三区在线观看| www.久久热.com| 亚洲一区二区三区视频在线播放 | 亚洲一区二区三区在线观看视频| av观看在线| 精品国产电影一区| 特黄视频免费观看| 日韩成人av在线资源| 伊人激情综合网| 久久综合加勒比| 日本视频一区二区三区| 高清视频一区| 婷婷五月在线视频| 狠狠色狠狠色综合日日五| 久热精品在线观看视频| 欧美国产极品| 九九热精品视频| 国产精品午夜一区二区| 国产91对白在线观看九色| 亚洲精品国产精品久久| 国产免费拔擦拔擦8x高清在线人 | 午夜免费一级片| 精品在线观看入口| 欧美极品少妇xxxxⅹ喷水| 91国在线视频| 国产欧美1区2区3区| 亚洲不卡中文字幕无码| 日本一区二区三区电影免费观看 | 色呦呦在线看| 欧美丰满高潮xxxx喷水动漫| 在线观看国产精品一区| 在线播放不卡| 国产不卡一区二区在线观看| 日韩欧美小视频| 在线视频国产一区| 黄色a一级视频| 99国产一区| 国产精品制服诱惑| 污污的视频在线观看| 欧美精品高清视频| 久久久久99精品成人| 久久久综合网| 欧美午夜精品理论片a级大开眼界 欧美午夜精品久久久久免费视 | 黄色在线观看av| 激情91久久| 3d动漫精品啪啪一区二区三区免费| 97超碰国产一区二区三区| 日韩欧美成人网| 玖玖爱在线观看| 国产日韩欧美一区| 九九99久久| 蜜桃视频在线观看免费视频| 亚洲黄色成人网| 日本一级黄色录像| a美女胸又www黄视频久久| 欧美乱大交xxxxx潮喷l头像| 高清精品视频| 97精品国产91久久久久久| 黄色av网站免费在线观看| 亚洲综合色噜噜狠狠| 岛国av免费观看| 在线亚洲一区| 免费中文日韩| 欧美成人免费电影| 国产小视频91| 亚洲天天综合网| 亚洲蜜臀av乱码久久精品蜜桃| 黄色片免费网址| 欧美婷婷在线| 狠狠色综合色区| 国模套图日韩精品一区二区| 亚洲人成自拍网站| 中文字幕在线观看国产| 亚洲欧美自拍偷拍| 国产xxx在线观看| 国产欧美一区二区三区国产幕精品| 欧美aaaaa喷水| 国产精品久久久久久久久久齐齐 | fc2ppv在线播放| 国产一区二区三区香蕉| 国产一二三区在线播放| 欧美电影在线观看免费| 国产精品久久久久久久久久久久久久 | 亚洲欧美另类中文字幕| 亚洲高清在线看| 亚洲欧美一区二区不卡| 午夜不卡久久精品无码免费| 日韩一区精品字幕| 国产高清免费在线| 精品国产18久久久久久洗澡| 国产精品欧美激情在线播放| 特级毛片在线| 亚洲精品天天看| 国产日韩精品suv| 高跟丝袜欧美一区| 91制片厂在线| 91亚洲精品久久久蜜桃网站| 麻豆三级在线观看| 亚洲高清自拍| 亚洲精品一区二区三区樱花| 国产三级精品三级在线观看国产| 国产精品精品久久久| 久草在线视频网站| 一本色道久久综合亚洲精品小说| av综合在线观看| 日韩人体视频一二区| 日韩三级在线观看视频| 91视频.com| 被黑人猛躁10次高潮视频| 天堂一区二区在线| 大西瓜av在线| 天天综合国产| 日本在线高清视频一区| 亚洲国产欧美国产第一区| 国产成人综合亚洲| 超碰99在线| 欧美成人合集magnet| 国产精品麻豆一区二区三区| 欧美v日韩v国产v| 一本色道久久综合熟妇| 色综合天天综合| 国产午夜视频在线播放| 1024成人网| 亚洲天堂最新地址| 26uuu精品一区二区在线观看| 久久久久无码精品| 麻豆国产91在线播放| 国产xxxxx在线观看| 伊人成年综合电影网| 日本xxx免费| 久久婷婷蜜乳一本欲蜜臀| 欧美另类视频在线| 日韩三级毛片| 精品一区二区三区日本| 91成人精品在线| 91丨九色丨国产| 欧美黄色一级| 91免费福利视频| 四虎在线精品| 成人福利在线观看| 日本午夜免费一区二区| 国产精品九九九| 亚洲日本在线观看视频| 日本道色综合久久影院| 日韩电影毛片| 97视频在线免费观看| 久草免费在线视频| 18性欧美xxxⅹ性满足| segui88久久综合9999| 韩国国内大量揄拍精品视频| wwww亚洲| 97视频在线观看播放| 午夜激情电影在线播放| 欧美亚洲另类激情另类| 26uuu亚洲电影| 国产va免费精品高清在线| 国产日韩电影| 国产精品流白浆视频| 97久久网站| 成人黄色午夜影院| 久久gogo国模啪啪裸体| 91九色在线观看| 国产一区二区三区不卡av| 国产一区在线观| 国产一卡不卡| 亚欧洲精品在线视频免费观看| 欧美色图国产精品| 亚洲一区二区三区色| 欧美国产专区| 日本人体一区二区| 国产欧美日韩综合一区在线播放| 免费av网址在线| 蜜臀av性久久久久av蜜臀妖精 | 欧美一区=区三区| 成人午夜激情免费视频| 99亚洲乱人伦aⅴ精品| 久久综合久久久| 日韩一区二区在线| 天天在线免费视频| 日韩天堂av| 伊人色在线观看| 成人国产精品免费观看动漫| 老司机福利av| 亚洲人妖av一区二区| 日本在线免费观看| 欧美性色黄大片手机版| 精品人妻久久久久一区二区三区 | 91精品国产一区二区人妖| 亚洲av永久无码国产精品久久| 日韩麻豆第一页| 浪潮av一区| 91av视频在线| 在线免费观看亚洲| 国产一区二区不卡视频在线观看| 国产精品最新| 丁香色欲久久久久久综合网| 久久九九电影| 91福利视频免费观看| 久久人人超碰精品| a在线视频播放观看免费观看| 欧美日韩国产在线看| 国产精品怡红院| 亚洲图片欧洲图片av| 羞羞网站在线免费观看| 国产91亚洲精品| 爱高潮www亚洲精品| 色播亚洲婷婷| 99riav1国产精品视频| 亚洲免费av一区| 久久久久久久久久久电影| 青娱乐免费在线视频| 91福利资源站| 色窝窝无码一区二区三区| 日韩亚洲一区二区| 小视频免费在线观看| 91九色偷拍| 婷婷亚洲综合| 黄色一级大片在线观看| 成人小视频在线观看| 污污的视频在线免费观看| 欧美综合天天夜夜久久| 婷婷丁香花五月天| 欧美另类交人妖| www.久久热| 色综合影院在线观看| 老司机一区二区三区| 污污污www精品国产网站| 一区二区三区中文在线观看| 91丨porny丨在线中文 | 国产一区二区免费在线观看| 婷婷综合五月| 狠狠躁狠狠躁视频专区| 久久精品在这里| 精品不卡一区二区| 亚洲精品国产美女| 福利网站在线观看| 99久久99久久| 欧美精品三级| 国产男女无遮挡猛进猛出| 综合久久久久久久| 亚洲一区二区色| 在线观看日韩av| 秋霞国产精品| 西游记1978| 美女网站视频久久| 91狠狠综合久久久久久| 欧美唯美清纯偷拍| 137大胆人体在线观看| 国产精品久久一区主播| 久久中文字幕二区| 日本三级黄色网址| 国产精品色在线| 亚洲一级视频在线观看| 色婷婷**av毛片一区| 2020国产精品小视频| 亚洲美女自拍偷拍| 国产精品69毛片高清亚洲| 久久久久久久极品内射| 亚洲精品一区二区三区影院| f2c人成在线观看免费视频| 国产精品欧美久久| 一本色道精品久久一区二区三区 | 亚洲va久久久噜噜噜久久| 男人天堂999| 国产欧美日韩在线观看| 夜夜狠狠擅视频| 欧美日韩爱爱视频| 国产精品nxnn| 成人在线观看a| 国产精品久久一卡二卡| 国产视频在线免费观看| 久久久久久久久久久国产| 一区二区三区日本久久久| 亚洲色图久久久| 亚洲精品日韩综合观看成人91| 黄色av免费观看| 国产精品6699| 亚洲午夜精品一区 二区 三区| 无码人妻精品一区二区三| 欧美色另类天堂2015| av网页在线| 成人欧美一区二区三区视频 | 日本v片在线免费观看| 国产精品久久久久久久久久新婚| 91精品国产91久久久久久密臀 | 亚洲成人福利在线观看| 日韩美女精品在线| 色丁香婷婷综合久久| 国产精品高清在线观看| 欧美激情视频一区二区三区免费| 中文字幕日韩三级片| 欧美日韩卡一卡二| caoporn视频在线观看| 亚洲精品9999| www.在线成人| 97超碰人人模人人人爽人人爱| 韩国福利视频一区| 99久久婷婷这里只有精品| 精品人妻伦一二三区久| 欧美美女一区二区在线观看| 男人av在线播放| 樱空桃在线播放| 国产色产综合产在线视频| 黑人乱码一区二区三区av|