精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

1億圖文對(duì)!格靈深瞳開源RealSyn數(shù)據(jù)集,CLIP多任務(wù)性能刷新SOTA

人工智能 新聞
格靈深瞳最新發(fā)布的高質(zhì)量數(shù)據(jù)集RealSyn,不僅規(guī)模大——包含1億組圖文對(duì),而且每張圖片都同時(shí)關(guān)聯(lián)多個(gè)真實(shí)和合成文本。

新的億級(jí)大規(guī)模圖文對(duì)數(shù)據(jù)集來了,CLIP達(dá)成新SOTA!

格靈深瞳最新發(fā)布的高質(zhì)量數(shù)據(jù)集RealSyn,不僅規(guī)模大——包含1億組圖文對(duì),而且每張圖片都同時(shí)關(guān)聯(lián)多個(gè)真實(shí)和合成文本。

所有的圖像和句子都基于冗余進(jìn)行了嚴(yán)格過濾,在確保數(shù)據(jù)質(zhì)量的同時(shí),引入基于簇的語義平衡采樣策略,構(gòu)建了可滿足多樣工作需求的三種規(guī)模大小的數(shù)據(jù)集:15M、30M、100M

圖片

這下CLIP終于可以大展身手了!

RealSyn所展現(xiàn)的超強(qiáng)擴(kuò)展性,以及在視覺語言表征學(xué)習(xí)中極為優(yōu)越的表現(xiàn),讓模型性能在多任務(wù)中達(dá)到了新的SOTA。

目前,該數(shù)據(jù)集已全面開源,可點(diǎn)擊文末鏈接一鍵獲取~

圖片

以下是RealSyn的更多相關(guān)細(xì)節(jié)。

相關(guān)工作

大規(guī)模預(yù)訓(xùn)練數(shù)據(jù)集

近年來,多個(gè)從互聯(lián)網(wǎng)收集的大規(guī)模圖像-文本數(shù)據(jù)集陸續(xù)發(fā)布。

YFCC100M數(shù)據(jù)集提供了自 Flickr 2004 年創(chuàng)立至2014年初期照片和視頻記錄及分享演變的全面概覽。由于下載失敗和非英語標(biāo)題,DeCLIP重新處理 YFCC15M 數(shù)據(jù)集并提出了一個(gè)新版本。此外,LAION400M數(shù)據(jù)集包含從 Common Crawl 收集的4億個(gè)圖像-文本對(duì)并被廣泛的應(yīng)用到視覺-語言預(yù)訓(xùn)練。

最近還推出了幾個(gè)大規(guī)模圖文交錯(cuò)文檔數(shù)據(jù)集。OBELICS數(shù)據(jù)集使用全面的過濾策略,包括1.41億個(gè)網(wǎng)頁、3.53億張相關(guān)圖片和從 Common Crawl 提取的1150億文本標(biāo)記。

然而,由于數(shù)據(jù)格式的限制和訓(xùn)練效率的低下,圖文交錯(cuò)文檔目前不適用于視覺語言對(duì)比表示學(xué)習(xí)。

視覺語言預(yù)訓(xùn)練

作為視覺語言預(yù)訓(xùn)練領(lǐng)域的開創(chuàng)性工作,CLIP因其強(qiáng)大的零樣本識(shí)別能力和卓越的遷移學(xué)習(xí)表現(xiàn)而受到廣泛關(guān)注。受 CLIP 啟發(fā),近年來誕生了大量視覺-語言預(yù)訓(xùn)練研究。

SLIP通過結(jié)合自監(jiān)督學(xué)習(xí)與 CLIP 預(yù)訓(xùn)練提高性能。DeCLIP通過整合跨模態(tài)的多視角監(jiān)督和來自相似對(duì)的最近鄰監(jiān)督,提高了預(yù)訓(xùn)練效率。為了減輕噪聲數(shù)據(jù)的影響,ALIP引入了一種動(dòng)態(tài)樣本權(quán)重分配的門控機(jī)制。

盡管這些方法取得了顯著的進(jìn)展,但它們主要依賴于從互聯(lián)網(wǎng)上爬取的大規(guī)模圖像-文本對(duì)。最近的研究表明,隨著高質(zhì)量圖像-文本數(shù)據(jù)集的擴(kuò)展,CLIP的能力也在增強(qiáng)。因此迫切需要開發(fā)新的數(shù)據(jù)構(gòu)建范式以進(jìn)一步擴(kuò)大高質(zhì)量圖像-文本數(shù)據(jù)的規(guī)模。

合成標(biāo)題

最近的研究表明,從網(wǎng)站獲得的圖像-文本對(duì)含有內(nèi)在噪聲,這直接影響視覺-語言預(yù)訓(xùn)練的有效性。

為提高現(xiàn)有數(shù)據(jù)集的質(zhì)量,LaCLIP利用大型語言模型的上下文學(xué)習(xí)能力重寫與每張圖片相關(guān)的文本描述。CapsFusion使用大型語言模型精煉來自網(wǎng)絡(luò)的圖像-文本對(duì)和合成標(biāo)題信息,提高多模態(tài)預(yù)訓(xùn)練數(shù)據(jù)的質(zhì)量。類似地,DreamLIP 使用預(yù)訓(xùn)練的大型多模態(tài)模型為3000萬張圖片生成詳細(xì)描述。

然而,這些方法主要關(guān)注合成數(shù)據(jù)的增強(qiáng),忽視了現(xiàn)實(shí)世界數(shù)據(jù)的重要性。此外,這些方法生成的合成標(biāo)題的多樣性和分布本質(zhì)上受到所用生成模型能力的限制。

RealSyn數(shù)據(jù)集

真實(shí)世界數(shù)據(jù)抽取

為了將圖文交錯(cuò)文檔轉(zhuǎn)換為視覺-語言表示學(xué)習(xí)的形式,團(tuán)隊(duì)建立了一個(gè)真實(shí)世界數(shù)據(jù)提取Pipeline以提取高質(zhì)量的圖像和文本。

圖片

該流程包括三個(gè)步驟:數(shù)據(jù)提取、圖像過濾和句子過濾

  • 數(shù)據(jù)提取

團(tuán)隊(duì)使用來自OBELICS的1.18億個(gè)圖文交錯(cuò)文檔作為主要數(shù)據(jù)源。所有圖像都被提取并存儲(chǔ)在專用的圖像數(shù)據(jù)庫(kù)中,句子則使用自然語言工具包(NLTK)進(jìn)行分割,并存儲(chǔ)在單獨(dú)的句子數(shù)據(jù)庫(kù)中。這個(gè)過程共計(jì)從多模態(tài)文檔中抽取了3.36億張圖像和21.3億個(gè)句子

  • 圖像過濾

在提取了3.36億張圖像后,團(tuán)隊(duì)設(shè)計(jì)了一個(gè)兩階段的過濾過程,以提升數(shù)據(jù)質(zhì)量并降低冗余。

首先,丟棄符合以下任一條件的圖像:

  1. 圖像短邊長(zhǎng)度少于100像素。
  2. 寬高比超過3或低于1/3。

這一步去除了5100萬張低質(zhì)量圖像。

接下來,參考CLIP-CID,使用EVA02-CLIP E/14-plus模型來提取圖像嵌入,并應(yīng)用Union-Find算法來消除感知和語義上的冗余圖像。這一步去除了額外的8700萬張圖像,最終得到了一組精煉的1.98億張高質(zhì)量圖像數(shù)據(jù)集

  • 句子過濾

從圖文交錯(cuò)文檔中提取了21.3億個(gè)句子后,研究人員基于質(zhì)量、語義和冗余進(jìn)行嚴(yán)格過濾。

首先,根據(jù)以下標(biāo)準(zhǔn)來過濾低質(zhì)量句子:

  1. 包含表情符號(hào)或URL;
  2. 句子包含少于3個(gè)或多于81個(gè)單詞;
  3. 根據(jù)CAT,保留至少具有C1復(fù)雜度并包含動(dòng)作的樣本。

這一階段將語料庫(kù)規(guī)模從21.3億減少到18.2億。

然后,對(duì)剩余的句子進(jìn)行語義過濾,研究人員通過信息熵來排除掉語義信息較少的句子:

圖片

其中,圖片表示句子中的單詞數(shù),圖片表示句子圖片中的第圖片個(gè)單詞,圖片是整個(gè)語料庫(kù)中單詞圖片的概率。

基于人類認(rèn)知原則和經(jīng)驗(yàn),過濾掉得分低于0.3的句子。為了進(jìn)一步通過消除困難或模糊的句子來完善語料庫(kù),研究人員使用GTP2-large來計(jì)算每個(gè)句子的困惑度分?jǐn)?shù)圖片

圖片

其中,圖片表示句子中token數(shù)量,圖片表示給定前序tokens時(shí)第圖片個(gè)token的似然概率。

研究人員保留困惑度分?jǐn)?shù)在30到200之間的句子。經(jīng)過整體語義過濾后,語料庫(kù)縮減至11.6億個(gè)句子。在最后階段,類似于冗余圖像過濾,對(duì)句子進(jìn)行了感知和語義去重

這一過程最終得到了一個(gè)包含大量現(xiàn)實(shí)世界知識(shí)的精煉語料庫(kù),共計(jì)8.4億個(gè)句子

檢索和生成框架

在從文檔中提取高質(zhì)量圖像和句子后,團(tuán)隊(duì)提出了一個(gè)高效且可擴(kuò)展的框架,用于為每個(gè)圖像檢索多個(gè)語義相關(guān)文本,并利用大型語言模型將檢索的真實(shí)文本與細(xì)粒度的視覺信息整合,生成合成文本。

圖片

框架的架構(gòu)主要包括三個(gè)組件:文本語義聚類、層次化檢索和圖像語義增強(qiáng)生成

  • 文本語義聚類

為了有效地為每個(gè)圖像檢索多個(gè)語義相關(guān)文本,首先使用EVA02-CLIP E/14-plus模型對(duì)所有句子進(jìn)行編碼。受Unicom啟發(fā),研究人員利用標(biāo)準(zhǔn)的K-means算法離線將8.4億個(gè)文本通過高效特征量化劃分為200萬個(gè)簇。

  • 層次化檢索

考慮到直接從8.4億個(gè)句子中檢索語義文本的計(jì)算開銷過高(在8個(gè)A100 GPU上超過10,000小時(shí)),團(tuán)隊(duì)設(shè)計(jì)了一種層次檢索方法來優(yōu)化計(jì)算效率。

首先執(zhí)行簇間檢索,找到每個(gè)圖像最相關(guān)的簇中心。然后,研究人員將共享相同簇中心的圖像分組,并執(zhí)行簇內(nèi)檢索,以獲取多個(gè)語義相關(guān)句子。

這種方法能夠在40小時(shí)內(nèi)使用8個(gè)A100 GPU完成對(duì)1.98億圖像和8.4億句子的檢索。

  • 圖像語義增強(qiáng)生成

盡管檢索到的真實(shí)文本表現(xiàn)出滿意的性能,但它們?cè)诓蹲郊?xì)粒度視覺語義方面存在限制。為了解決這個(gè)問題,團(tuán)隊(duì)引入了圖像語義增強(qiáng)生成模塊

該模塊最初采用OFA模型為每張圖片生成一個(gè)簡(jiǎn)潔的標(biāo)題。然后,團(tuán)隊(duì)集成了開放集圖片標(biāo)簽?zāi)P蚏AM++,該模型提取對(duì)象檢測(cè)標(biāo)簽。考慮到RAM++僅支持4000個(gè)標(biāo)簽,研究人員通過加入額外的4000個(gè)來自真實(shí)世界句子的標(biāo)簽,將這個(gè)集合擴(kuò)展到8000個(gè)標(biāo)簽。

參考CapsFusion,團(tuán)隊(duì)利用ChatGPT4 Turbo將檢索到的真實(shí)文本與簡(jiǎn)潔標(biāo)題和圖片標(biāo)簽合并,構(gòu)建一個(gè) 10 萬條指令的數(shù)據(jù)集。隨后,使用LLaMA Factory對(duì) LLaMA3-8B模型進(jìn)行微調(diào),并部署vLLM進(jìn)行大規(guī)模推理。

最終,將1.18億多模態(tài)交錯(cuò)文檔轉(zhuǎn)換為1.98億圖文對(duì),其中每張圖片都與多個(gè)檢索到的真實(shí)文本和合成文本相關(guān)聯(lián)。

語義均衡采樣

為了進(jìn)一步提升數(shù)據(jù)集的質(zhì)量和多樣性,團(tuán)隊(duì)在1.98億圖文對(duì)中進(jìn)行語義均衡采樣。具體來說,使用EVA02-CLIP E/14-plus來編碼并計(jì)算圖像和合成文本之間的余弦相似性。

為了減少在預(yù)訓(xùn)練期間因OCR相關(guān)或不匹配對(duì)的影響,研究人員過濾掉余弦相似度高于0.61或低于0.51的2970萬對(duì)數(shù)據(jù)。受到MetaCLIP的啟發(fā),還引入了一種簡(jiǎn)單但高效的基于簇的語義平衡采樣策略,并將剩余的 1.683億對(duì)中的圖像嵌入聚類到100萬個(gè)中心。

為了增強(qiáng)數(shù)據(jù)集的語義多樣性,團(tuán)隊(duì)從超過這些閾值的簇中隨機(jī)選擇20,35和180個(gè)樣本,同時(shí)保留較小簇中的所有樣本。這種方法最終構(gòu)建了 RealSyn15M、RealSyn30M和RealSyn100M數(shù)據(jù)集

實(shí)驗(yàn)

實(shí)現(xiàn)細(xì)節(jié)

團(tuán)隊(duì)最初從OBELICS收集了1.18億個(gè)交錯(cuò)的圖像-文本文檔作為主要數(shù)據(jù)源。并使用圖片圖片來生成簡(jiǎn)潔的標(biāo)題和語義標(biāo)簽。

為了驗(yàn)證數(shù)據(jù)集的性能,他們受LaCLIP的啟發(fā),預(yù)訓(xùn)練標(biāo)準(zhǔn)CLIP,監(jiān)督文本隨機(jī)從三個(gè)檢索到的真實(shí)文本和一個(gè)合成文本中選擇。

在預(yù)訓(xùn)練期間,采用AdamW作為優(yōu)化器,學(xué)習(xí)率為1e-3,權(quán)重衰減為0.2。參數(shù)圖片圖片分別設(shè)為0.9和0.98。輸入圖像尺寸為224×224,輸入文本序列長(zhǎng)度為77。溫度參數(shù)??初始化為0.07。研究人員在8×A100(80G)GPU上訓(xùn)練32個(gè)周期,batch大小為4096。

為了驗(yàn)證RealSyn數(shù)據(jù)集的有效性,團(tuán)隊(duì)將RealSyn與之前的數(shù)據(jù)集在不同模型和數(shù)據(jù)規(guī)模上進(jìn)行比較,將RealSyn15M與DeCLIP過濾的YFCC15M進(jìn)行比較。遵循ALIP的方法,還與LAION15M、LAION30M和LAION100M(從LAION400M隨機(jī)選取的子集)進(jìn)行比較。

主要結(jié)果

  • 線性探測(cè)

在下表中,展示了ViT-B/32模型在20個(gè)下游數(shù)據(jù)集中的線性探測(cè)性能。

圖片

當(dāng)在1500萬規(guī)模上預(yù)訓(xùn)練時(shí),RealSyn15M在20個(gè)數(shù)據(jù)集中的16個(gè)中超過了YFCC15M,平均性能提高了6.9%。

此外,RealSyn15M在20個(gè)數(shù)據(jù)集中的18個(gè)中表現(xiàn)優(yōu)于LAION15M,平均改進(jìn)了 1.6%。當(dāng)數(shù)據(jù)集擴(kuò)展到3000萬和1億時(shí),RealSyn分別在LAION上實(shí)現(xiàn)了平均1.3%和1.4%的性能提升。

這些結(jié)果證明了RealSyn數(shù)據(jù)集在視覺-語言表示學(xué)習(xí)中的有效性

  • 零樣本遷移

團(tuán)隊(duì)使用與SLIP相同的提示模板,評(píng)估了ViT-B/32模型在20個(gè)分類基準(zhǔn)測(cè)試中的零樣本遷移性能。如表所示,RealSyn15M在20個(gè)數(shù)據(jù)集中的18個(gè)上超過了YFCC15M,平均性能提高了14.3%。

圖片

與LAION15M相比,RealSyn15M在20個(gè)數(shù)據(jù)集中的18個(gè)上表現(xiàn)優(yōu)異,平均改進(jìn)了 5.2%。當(dāng)數(shù)據(jù)集規(guī)模擴(kuò)大到3000萬和1億時(shí),RealSyn分別比LAION實(shí)現(xiàn)了平均3.5%和2.3%的性能提升,凸顯了其效率和可擴(kuò)展性

  • 零樣本圖文檢索

在表中,展示了ViT-B/32模型在不同規(guī)模數(shù)據(jù)集上預(yù)訓(xùn)練后的零樣本圖文檢索性能。

圖片

RealSyn 在所有評(píng)估指標(biāo)上均取得了優(yōu)異的結(jié)果。具體而言,RealSyn15M在Flickr30K上將召回率提高了35.8%&26%,在MSCOCO上提高了22.5%&12.6%。RealSyn30M在Flickr30K上將召回率提高了16.4%&11.6%,在MSCOCO上提高了12.3%&7.4%。

這種在跨模態(tài)檢索性能上的顯著提升表明,RealSyn數(shù)據(jù)集通過利用真實(shí)和合成文本有效地改善了視覺-語言表示學(xué)習(xí),從而實(shí)現(xiàn)了健壯的表示和增強(qiáng)的跨模態(tài)對(duì)齊

  • 零樣本魯棒性

在下表中,展示了零樣本魯棒性性能。結(jié)果顯示,RealSyn顯著提升了視覺-語言預(yù)訓(xùn)練模型的魯棒性。

圖片

具體而言,與LAION相比,RealSyn分別在15M、30M萬和100M的數(shù)據(jù)集上平均性能提高了4.3%、4.2%和2.8%。

這一顯著的性能提升主要源自于使用檢索到的真實(shí)文本,這些文本不受生成模型限制,并且與YFCC和LAION相比具有更優(yōu)越的概念多樣性,從而大幅增強(qiáng)了模型的魯棒性

  • 通過MLLM進(jìn)行圖像描述

圖中展示了使用不同數(shù)據(jù)集(LAION與RealSyn)訓(xùn)練的LLaVA-1.5在圖像描述性能上的表現(xiàn)。

圖片

最初,團(tuán)隊(duì)首先使用LLaVA-1.5的初始558k數(shù)據(jù)集將視覺特征映射到文本特征空間。然后,他們從LAION和RealSyn開發(fā)了一個(gè)圖像描述數(shù)據(jù)集進(jìn)行指令調(diào)優(yōu)。具體來說,從每個(gè)數(shù)據(jù)集隨機(jī)選擇100萬樣本,并進(jìn)行了兩個(gè)周期的訓(xùn)練。

由此可見,RealSyn在COCO2017和Flickr30k基準(zhǔn)測(cè)試的所有評(píng)估指標(biāo)上均顯著優(yōu)于LAION。這一顯著的性能提升證實(shí)了RealSyn數(shù)據(jù)集的更高質(zhì)量和更好的圖像-文本對(duì)齊

分析

統(tǒng)計(jì)分析

  • 基于主題的評(píng)估

參考MMC4的方法,團(tuán)隊(duì)在隨機(jī)抽取的100萬圖像-真實(shí)文本對(duì)上運(yùn)行了LDA,涵蓋30個(gè)主題。

下圖中展示了六個(gè)主題的比例和示例:動(dòng)物、食物、飛機(jī)、花卉、汽車和地標(biāo)。值得注意的是,數(shù)據(jù)集中與“花卉”和“汽車”主題相關(guān)的樣本極少,分別僅占總數(shù)的0.4%和0.9%。

圖片

這種樣本的稀缺限制了模型充分學(xué)習(xí)這些概念的能力,從而在Flower和Car數(shù)據(jù)集的線性探針和零樣本遷移評(píng)估中影響了其性能。

  • 豐富性評(píng)估

圖中展示了來自YFCC15、LAION、RealSyn-R1(檢索到的最相關(guān)真實(shí)文本)和 RealSyn-S1(基于RealSyn-R1的語義增強(qiáng)合成文本)的1500萬樣本的圖文相似性和文本令牌分布。

圖片

與從互聯(lián)網(wǎng)收集的數(shù)據(jù)集相比,即使在移除OCR數(shù)據(jù)之后,RealSyn仍展示出穩(wěn)健的相似性指標(biāo)。此外,檢索到的真實(shí)文本和合成文本都包含更多的詞匯量,這可以提供更豐富的文本環(huán)境,從而增強(qiáng)視覺-語言表示學(xué)習(xí)。

  • 多樣性評(píng)估

RealSyn是基于現(xiàn)實(shí)世界中交錯(cuò)的圖文文件構(gòu)建的,包含了廣泛的多樣性信息。遵循之前的研究,團(tuán)隊(duì)隨機(jī)選擇了20萬樣本來計(jì)算標(biāo)題中獨(dú)特實(shí)體的數(shù)量,以評(píng)估不同數(shù)據(jù)集的數(shù)據(jù)多樣性。

圖片

如圖所示,檢索到的真實(shí)文本和圖像語義增強(qiáng)的合成文本均展示了更高數(shù)量的不同實(shí)體。這種多樣性豐富了數(shù)據(jù)集,有助于模型獲得全面的知識(shí),并提升了性能和魯棒性。

  • 數(shù)據(jù)縮放分析

團(tuán)隊(duì)從RealSyn數(shù)據(jù)集推導(dǎo)出數(shù)據(jù)縮放定律,證明了其在樣本規(guī)模上的可擴(kuò)展性。具體來說,他們使用提議的數(shù)據(jù)集進(jìn)行一系列視覺-語言預(yù)訓(xùn)練,數(shù)據(jù)集規(guī)模從12M到60M不等,并且將每個(gè)性能指標(biāo)擬合于對(duì)數(shù)函數(shù)的倒數(shù),其中訓(xùn)練樣本數(shù)為圖片百萬。

基于這些初步實(shí)驗(yàn)的擬合結(jié)果,將每個(gè)性能規(guī)模定律外推至100M樣本,并使用RealSyn100M數(shù)據(jù)集驗(yàn)證其預(yù)測(cè)的規(guī)模趨勢(shì),如圖所示。

圖片

值得注意的是,如方程中所示的系數(shù)所指示的那樣,這些性能規(guī)律也可能表明通過團(tuán)隊(duì)提出的視覺-語言預(yù)訓(xùn)練范式以及多模態(tài)交錯(cuò)文檔,ViT-B/32可能達(dá)到的模型能力的上限:

圖片

  • 模型縮放分析

為了進(jìn)一步探索模型擴(kuò)展能力,研究人員在圖中展示了三種模型的下游任務(wù)性能。值得注意的是,與LAION相比,RealSyn在線性探測(cè)、零樣本遷移和魯棒性的性能曲線上顯示出更陡峭的斜率,這表明其具有更優(yōu)越的模型擴(kuò)展能力。

圖片

消融實(shí)驗(yàn)

  • 語義平衡采樣的消融研究

為了展示所提出的語義平衡采樣方法的有效性,團(tuán)隊(duì)將其與隨機(jī)采樣進(jìn)行比較。如表所示,概念平衡采樣在線性探測(cè)、零樣本遷移和魯棒性中分別提高了0.7%、1.1% 和1.0%的性能。

圖片

此外,團(tuán)隊(duì)通過將1500萬樣本聚類到100萬個(gè)中心,使用不同的采樣方法可視化數(shù)據(jù)分布。如圖所示,來自語義平衡采樣的分布更為平滑,有助于學(xué)習(xí)長(zhǎng)尾概念

圖片

  • 擴(kuò)展到純圖像

研究人員發(fā)現(xiàn)本文所提出數(shù)據(jù)構(gòu)建范式除了應(yīng)用到圖文交錯(cuò)文檔以外還可以直接用于純圖像,為此他們?cè)贗mageNet上進(jìn)行實(shí)驗(yàn)。

首先從本文構(gòu)建的句子數(shù)據(jù)庫(kù)中為每個(gè)ImageNet圖像檢索語義相關(guān)的真實(shí)文本,并生成圖像語義增強(qiáng)的合成文本。然后,隨機(jī)從檢索到的真實(shí)文本和合成文本中選擇一個(gè)文本作為監(jiān)督信號(hào)來對(duì)ResNet50進(jìn)行預(yù)訓(xùn)練。

圖片

與SimCLR在相同條件下進(jìn)行比較分析顯示,使用團(tuán)隊(duì)構(gòu)建的數(shù)據(jù),在12個(gè)數(shù)據(jù)集上的線性探測(cè)平均性能提高了2.1%。

  • 真實(shí)文本和合成文本消融實(shí)驗(yàn)

團(tuán)隊(duì)進(jìn)行了消融實(shí)驗(yàn)來評(píng)估真實(shí)文本和合成文本數(shù)量變化對(duì)CLIP-B/32模型性能的影響。

如表所示,真實(shí)文本量從一增加到三,模型性能得到提升,這歸功于集成了廣泛的現(xiàn)實(shí)世界知識(shí)的文本增強(qiáng)。然而,將這一數(shù)量從三增加到五時(shí),由于信息飽和和噪聲引入,性能略有下降。相反,合成文本的數(shù)量從一增加到五,性能逐漸下降,反映了噪聲引入的增加。

圖片

值得注意的是,僅使用真實(shí)文本進(jìn)行訓(xùn)練可以顯著提升性能,與使用LAION15M數(shù)據(jù)集的69.8%相比,達(dá)到了71.2%的準(zhǔn)確率,突顯了現(xiàn)實(shí)世界知識(shí)在推進(jìn)視覺-語言表征學(xué)習(xí)中的重要作用。

論文鏈接:https://arxiv.org/pdf/2502.12513

代碼鏈接:https://github.com/deepglint/RealSyn

項(xiàng)目鏈接:https://garygutc.github.io/RealSyn/

數(shù)據(jù)集鏈接:https://huggingface.co/datasets/Kaichengalex/RealSyn100M

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2022-02-16 13:46:00

模型數(shù)據(jù)開源

2014-12-10 14:38:17

格靈深瞳智能監(jiān)控

2024-09-09 13:50:00

2025-05-08 09:31:50

2021-02-03 11:26:20

人工智能人臉識(shí)別

2016-07-21 16:48:48

2025-10-30 09:58:35

2024-02-26 00:00:00

谷歌AI數(shù)據(jù)集

2024-04-17 09:56:24

算法模型

2023-02-01 13:29:46

機(jī)器學(xué)習(xí)

2022-12-06 14:11:32

開源模型

2025-11-12 08:40:00

數(shù)據(jù)AI模型

2010-02-26 17:47:07

2024-04-22 15:08:35

擴(kuò)散模型自動(dòng)駕駛

2025-11-20 08:35:59

2025-08-07 16:24:19

小紅書開源dots.vlm1
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

久久韩剧网电视剧| 一区二区三区精品视频在线| 日韩69视频在线观看| 日本成人免费视频| 91嫩草国产线观看亚洲一区二区 | 国产精品久久久免费观看| 欧美性suv| 亚洲精品国产精华液| 精品无人区一区二区三区竹菊 | caoporn免费在线| 成人动漫视频在线| 国产精品女人久久久久久| 欧美黄片一区二区三区| 午夜欧洲一区| 日韩一级大片在线观看| 男女曰b免费视频| 18+视频在线观看| 久久久久久久久97黄色工厂| 91黄在线观看| 69av视频在线观看| 国产主播精品| 在线视频精品一| 无码人妻一区二区三区在线| julia一区二区三区中文字幕| 日韩码欧中文字| 欧美在线激情| 丰满人妻av一区二区三区| 老司机免费视频一区二区 | 高清av不卡| 夜夜嗨av一区二区三区中文字幕| 日韩欧美视频一区二区| 日本人妻熟妇久久久久久| 老司机午夜精品99久久| 在线观看国产日韩| 九九热精品在线| 中文在线永久免费观看| 国产美女亚洲精品7777| 欧美制服丝袜第一页| 欧美在线一区视频| 毛片网站在线看| 亚洲天堂网中文字| 亚洲欧美日韩另类精品一区二区三区 | 欧美精品久久天天躁| www.浪潮av.com| 日本高清在线观看视频| 亚洲图片你懂的| 日本特级黄色大片| 在线免费看av| 国产日产欧美一区| 欧美在线3区| 国产三级电影在线| 国产亚洲女人久久久久毛片| 女同一区二区| 久久99久久| 久久亚洲精品小早川怜子| 精品国产一区二区三区久久久久久| 精品人妻一区二区三区三区四区 | v片在线观看| 日韩理论片中文av| www.一区二区.com| 伊人精品影院| 亚洲高清免费视频| 成人在线国产视频| mm视频在线视频| 午夜激情一区二区| 国产免费观看高清视频| 樱桃视频成人在线观看| 色欧美片视频在线观看在线视频| 国产色一区二区| 国产三级精品网站| 国产成年妇视频| 国产成人av电影在线观看| 超碰97人人人人人蜜桃| 色欲av永久无码精品无码蜜桃 | 精品少妇人妻一区二区黑料社区| 免费视频亚洲| 深夜精品寂寞黄网站在线观看| 最新黄色av网址| 欧美在线看片| 81精品国产乱码久久久久久| av网站中文字幕| 麻豆精品久久精品色综合| 91精品久久久久久久久青青| 精品黑人一区二区三区在线观看| 成人在线视频首页| 你懂的网址一区二区三区| 日韩免费网站| 亚洲综合视频网| 欧美 日韩 国产在线观看| 欧美最新精品| 日韩视频123| 日韩人妻无码一区二区三区| 成人午夜国产| 欧美大片欧美激情性色a∨久久| 国产成人自拍视频在线| 奇米影视一区二区三区| 99re在线视频上| 理论视频在线| 一区二区三区在线观看视频| 久久国产成人精品国产成人亚洲| 欧美三级电影网址| 精品国精品自拍自在线| 欧美三级视频网站| 欧美三级特黄| 国产精品最新在线观看| 神马午夜电影一区二区三区在线观看| 亚洲国产精品av| 国产 日韩 亚洲 欧美| 国产福利91精品一区二区| 欧美www视频| 污污视频网站在线免费观看| 国产视频欧美| 91欧美精品成人综合在线观看| 性xxxx18| 亚洲综合成人在线| 天堂视频免费看| 伊人久久大香线蕉无限次| 欧美噜噜久久久xxx| 国产午夜无码视频在线观看| 国产成人8x视频一区二区 | 在线播放中文字幕一区| 亚洲视频在线播放免费| 国产精品久久久久一区二区三区厕所| 26uuu亚洲国产精品| 99热精品在线播放| 国产三级精品视频| 国内外成人免费激情视频| 亚洲国产一区二区三区网站| 日韩午夜在线视频| 狠狠人妻久久久久久| 成人久久视频在线观看| 四虎永久免费网站| 丁香久久综合| 亚洲欧美福利视频| 亚洲视频免费播放| 国产电影一区二区三区| 免费成人深夜夜行网站视频| 成人精品高清在线视频| 亚洲理论在线a中文字幕| 久久久久黄色片| 国产原创一区二区| 自拍亚洲欧美老师丝袜| 成人自拍视频网| 国产亚洲欧美aaaa| 国产免费一区二区三区四区五区| 91婷婷韩国欧美一区二区| 国产freexxxx性播放麻豆| 嫩呦国产一区二区三区av| 麻豆成人在线看| 99久久久久久久| 亚洲精品va在线观看| 古装做爰无遮挡三级聊斋艳谭| 天天超碰亚洲| 91视频88av| 天堂8中文在线| 日韩欧美亚洲一区二区| 久久久久久久久精| 91在线免费播放| 两根大肉大捧一进一出好爽视频| 中文字幕伦av一区二区邻居| 日韩av片电影专区| www.成人.com| 欧美日韩一区二区不卡| 久久人妻无码aⅴ毛片a片app| 国产一区二区三区在线观看免费视频| 久久免费看毛片| 视频一区日韩| 777精品视频| 福利小视频在线观看| 欧美日高清视频| 欧美 日韩 国产 一区二区三区| 国产精品综合在线视频| 欧美成人高潮一二区在线看| 蜜桃精品噜噜噜成人av| 国产精品视频久久| 午夜羞羞小视频在线观看| 亚洲国产精品久久91精品| 日本中文字幕第一页| 国产精品黄色在线观看| 能看毛片的网站| 国产精品久久久久9999高清| 日韩精品久久久| 玖玖精品一区| 欧美又大粗又爽又黄大片视频| 成人在线视频成人| 日韩一区二区中文字幕| av黄色在线看| 自拍偷拍国产精品| 久久久久久久久久久国产精品| 免费观看在线综合色| 日本a在线天堂| 国内黄色精品| 亚洲自拍偷拍视频| 三级在线观看视频| 俺去了亚洲欧美日韩| 亚洲伦理在线观看| 欧美性极品少妇| 国产主播在线播放| 国产精品私人影院| aaaa黄色片| 精久久久久久久久久久| 六月丁香激情网| 婷婷精品进入| 欧美lavv| 香蕉免费一区二区三区在线观看| 日本人成精品视频在线| 日韩免费影院| 在线观看日韩www视频免费| 性猛交xxxx乱大交孕妇印度| 91高清在线观看| 五月天婷婷丁香| 中文字幕在线不卡| 性欧美13一14内谢| 成人一区在线看| 亚洲免费成人在线视频| 久久精品免费| 九色自拍视频在线观看| 亚洲激情中文在线| 五月天久久狠狠| 香蕉视频一区| 国产日韩在线一区二区三区| 高清不卡一区| 国产精品亚洲第一区| 竹内纱里奈兽皇系列在线观看| 九九热99久久久国产盗摄| 免费不卡视频| 中文字幕在线观看日韩| 你懂得在线网址| 亚洲精品乱码久久久久久金桔影视| 精品久久久中文字幕人妻| 欧美日韩一区二区三区四区 | 欧美电视剧在线看免费| 一本色道久久综合亚洲| 在线观看视频一区二区| 伊人手机在线视频| 黄色成人av在线| www.99re7.com| 一区二区三区波多野结衣在线观看| 亚洲欧美另类日本| 国产精品久久久久7777按摩| 日韩免费成人av| 欧美国产综合一区二区| 成人无码av片在线观看| 国产色综合一区| 99国产精品免费| 国产精品全国免费观看高清| 四季av中文字幕| 中文字幕中文字幕一区二区 | 撸视在线观看免费视频| 国产视频欧美视频| 日本一区二区三区在线观看视频| 亚洲精品国产品国语在线| 天堂在线观看av| 亚洲激情在线视频| 人成在线免费视频| 亚洲欧美日韩区| 蜜芽tv福利在线视频| 国产亚洲欧美另类中文| 成年人视频在线免费观看| 伊人久久综合97精品| 香港伦理在线| 久久色在线播放| 免费在线看电影| 性欧美xxxx交| 日韩精品影院| 国产日韩av在线播放| 精品入口麻豆88视频| 国产精品swag| 亚洲精品国模| 亚洲人成77777| 欧美1区视频| 久久久久久久午夜| 日韩精品久久久久久| 黄色三级视频在线播放| 成人美女视频在线观看| 免费看污黄网站在线观看| 中文欧美字幕免费| 中文字幕五月天| 亚洲va在线va天堂| 波多野结衣电车痴汉| 欧美精品久久99| 蜜臀久久精品久久久久| 亚洲小视频在线| bt在线麻豆视频| 日本久久久久亚洲中字幕| 亚洲tv在线| 精品国产一区二区三区久久久久久| 欧美精品尤物在线观看| 国产又粗又长又爽视频| 国产精品日本| 国产女同无遮挡互慰高潮91| 99天天综合性| 欧美一区免费观看| 日韩欧美aⅴ综合网站发布| 国产精品久久久久久久免费 | 成人久久精品视频| 久久成人福利| 一本久道久久综合| 国产精品主播| 波多野结衣中文字幕在线播放| 97se亚洲国产综合自在线观| 老司机深夜福利网站| 精品福利免费观看| 91tv国产成人福利| 日韩精品在线私人| 四虎影视国产在线视频| 国产精品久久久久秋霞鲁丝 | a级网站在线观看| 奶水喷射视频一区| 中文字幕av一区二区三区人妻少妇| 国产亚洲成年网址在线观看| 国产精品99re| 51午夜精品国产| 日本ー区在线视频| 欧美精品激情视频| 在线免费观看亚洲| 日韩视频在线播放| 国产日韩欧美| 午夜福利三级理论电影| 亚洲欧洲美洲综合色网| 无码人妻精品一区二区50| 精品久久人人做人人爱| 国产午夜精品久久久久免费视| 国产成人av在线播放| 国产精品网址| 成年人深夜视频| 国产专区欧美精品| 国产在视频线精品视频| 日本二三区不卡| 亚洲欧洲精品视频| 欧美精品第一页在线播放| 欧一区二区三区| 国产系列第一页| 久久国产精品第一页| 538精品视频| 欧美综合亚洲图片综合区| 欧美香蕉爽爽人人爽| 欧美亚洲一区在线| 日本午夜精品| 欧美女人性生活视频| www激情久久| 欧美国产成人精品一区二区三区| 亚洲大胆人体视频| 91av久久| 久精品国产欧美| 国产模特精品视频久久久久| 中文字幕乱码在线| 欧美日韩国产精品一区二区三区四区 | av电影一区二区三区| 精彩视频一区二区三区| 国产美女久久久久久| 91精品免费在线观看| caopon在线免费视频| 官网99热精品| 亚洲精品影视| 性少妇bbw张开| 91国产精品成人| 日本视频在线观看| 91pron在线| 精品电影一区| 免费a级黄色片| 欧美亚日韩国产aⅴ精品中极品| 成在在线免费视频| 96国产粉嫩美女| 亚洲第一在线| 永久免费看mv网站入口78| 色婷婷综合视频在线观看| 岛国在线大片| 91久久久亚洲精品| 精品99视频| 男人的天堂官网| 337p亚洲精品色噜噜| 激情av在线播放| 久久精品一二三区| 麻豆一区二区在线| 加勒比婷婷色综合久久| 亚洲韩国日本中文字幕| av一区在线| 日本a级片在线观看| 99riav一区二区三区| 日韩欧美国产另类| 欧美成人在线影院| 私拍精品福利视频在线一区| 九九热在线免费| 一区二区三区中文字幕| 亚洲日本在线播放| 国产精品视频yy9099| 亚洲国产精品一区制服丝袜| 中文字幕免费高清| 日韩欧美中文字幕制服| 免费观看亚洲| 国产又粗又长又爽视频| 久久久久久麻豆| 精品欧美一区二区精品少妇| 欧美一级黑人aaaaaaa做受| 91精品综合| 欧美黑人欧美精品刺激| 在线播放日韩导航| 免费观看亚洲| 日韩国产一级片|