精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。

發(fā)布于 2024-5-6 09:04
瀏覽
0收藏

自2021年誕生,CLIP已在計算機視覺識別系統(tǒng)和生成模型上得到了廣泛的應用和巨大的成功。我們相信CLIP的創(chuàng)新和成功來自其高質(zhì)量數(shù)據(jù)(WIT400M),而非模型或者損失函數(shù)本身。雖然3年來CLIP有大量的后續(xù)研究,但并未有研究通過對CLIP進行嚴格的消融實驗來了解數(shù)據(jù)、模型和訓練的關系。


CLIP原文僅有簡短的數(shù)據(jù)處理描述,而后續(xù)工作依靠已經(jīng)訓練好的CLIP來重新過濾數(shù)據(jù)去訓練CLIP(學生)模型。更廣泛地說,雖然目前的開源著重強調(diào)已訓練模型權重的公開,而訓練數(shù)據(jù)以及如何從低質(zhì)量數(shù)據(jù)獲得高質(zhì)量數(shù)據(jù)的技巧的公開度卻往往并不那么高。


本文帶你揭開CLIP的數(shù)據(jù)質(zhì)量之謎,為開源社區(qū)帶來元數(shù)據(jù)導向的CLIP預訓練(MetaCLIP)。


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)


  • 原文鏈接:https://arxiv.org/abs/2309.16671
  • 項目鏈接:https://github.com/facebookresearch/MetaCLIP
  • 論文標題:Demystifying CLIP Data


MetaCLIP數(shù)據(jù)質(zhì)量


MetaCLIP根據(jù)CLIP原文對數(shù)據(jù)處理的描述,提出可擴展到整個CommonCrawl上的數(shù)據(jù)算法。該算法接受原始互聯(lián)網(wǎng)數(shù)據(jù)分布,產(chǎn)生在元數(shù)據(jù)上平衡的高質(zhì)量訓練數(shù)據(jù)分布。


MetaCLIP產(chǎn)生的數(shù)據(jù)質(zhì)量源自兩個部分:


(1) 通過元數(shù)據(jù)字符串匹配來抓取高質(zhì)量人類監(jiān)督文本;

(2)通過平衡數(shù)據(jù)在元數(shù)據(jù)上的分布來最大限度保留長尾數(shù)據(jù)的信號、弱化噪聲以及頭部分布的冗余信息。MetaCLIP的元數(shù)據(jù)來自50萬個WordNet和維基百科的視覺概念(visual concept),它們使被匹配的alt文本包含超越人類平均認知水平的監(jiān)督質(zhì)量(superhuman level supervision)。


我們的實驗嚴格遵循CLIP設定來控制研究數(shù)據(jù)分布對結果的影響。整個數(shù)據(jù)提取,訓練無需已訓練CLIP來過濾數(shù)據(jù)以及潛在未知的來自OpenAI CLIP的數(shù)據(jù)偏見。


相反的是,MetaCLIP數(shù)據(jù)算法同時輸出訓練數(shù)據(jù)分布。這使得訓練數(shù)據(jù)更加透明,以方便調(diào)試模型。MetaCLIP在400M訓練數(shù)據(jù)上達到ViT-B 70.8%的零樣本ImageNet分類精度;使用1B訓練數(shù)據(jù)上達到72.4%;在2.5B訓練數(shù)據(jù)上使用ViT-bigG模型達到82.1%,而整個模型和訓練參數(shù)并未進行任何更改(比如學習率或批樣本量)。


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)


消融實驗表明:字符串匹配(MetaCLIP w/o bal. (400M))和平衡分布(MetaCLIP(400M)) 對MetaCLIP的數(shù)據(jù)質(zhì)量產(chǎn)生重大貢獻。


CLIP數(shù)據(jù)算法介紹


本文正式提出CLIP數(shù)據(jù)算法,來簡化和產(chǎn)生高質(zhì)量的訓練數(shù)據(jù)。


該方法大致分為:創(chuàng)建元數(shù)據(jù),提出數(shù)據(jù)算法,提高數(shù)據(jù)質(zhì)量及輸出訓練數(shù)據(jù)等四個步驟。


具體方法見下:


(1) 實現(xiàn)了CLIP數(shù)據(jù)的相關描述,包括如何創(chuàng)建元數(shù)據(jù);

(2)提出如下數(shù)據(jù)算法:第一部分為元數(shù)據(jù)字符串匹配,第二部分為平衡數(shù)據(jù)分布。該算法簡潔可擴展,本文已證明可在所有CommonCrawl 300+B 級圖片樣本并行運行;

(3)可植入已有數(shù)據(jù)流水線或者數(shù)據(jù)加載器(data loader)來提高數(shù)據(jù)質(zhì)量;

(4)輸出訓練數(shù)據(jù)在元數(shù)據(jù)上的訓練分布使得訓練數(shù)據(jù)更透明。


該算法的python代碼如下:


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)


MetaCLIP的元數(shù)據(jù)來自WordNet和Wikipedia的高質(zhì)量視覺概念(visual concept)。我們根據(jù)CLIP原文描述實現(xiàn)了從維基百科提取uni/bi-gram以及高頻標題的過程。


相關選取的超參數(shù)如下:


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)

元數(shù)據(jù)的創(chuàng)建來源


MetaCLIP算法簡潔,可以將兩部分分開植入已有的數(shù)據(jù)流水線。


如下圖所示,該算法可以在數(shù)據(jù)流水線的早期進行植入,來減小數(shù)據(jù)規(guī)模和對計算資源存儲的開銷:


  • 第一部分(元數(shù)據(jù)字符串匹配)能減少50%的數(shù)據(jù)量;
  • 第二部分(平衡數(shù)據(jù)分布)能減少77%的數(shù)據(jù)量。


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)

算法可輕松接入已有數(shù)據(jù)流水線,降低處理低質(zhì)量數(shù)據(jù)的開銷


下圖展示了平衡數(shù)據(jù)分布的效果:橫坐標將元數(shù)據(jù)里每個視覺概念的匹配數(shù)量從低到高排列,縱坐標累計匹配。


表格中展示了不同頻率區(qū)段視覺概念的匹配數(shù)量:


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)

平衡數(shù)據(jù)分布使得1.6B的原始數(shù)據(jù)被下采樣成400M的訓練數(shù)據(jù)。


我們可以看到MetaCLIP數(shù)據(jù)算法對頭部分布進行了高度下采樣,這將降低頭部分布的冗余無效信息和頭部數(shù)據(jù)的噪聲(比如untitled photo),所有長尾分布的視覺概念全部保留。


實驗結果


我們設計了兩個數(shù)據(jù)池來運行數(shù)據(jù)算法。


  • 第一個池的目標是獲得400M訓練數(shù)據(jù)來和CLIP進行比較;
  • 第二個池的目標是所有CommonCrawl數(shù)據(jù)。


我們進一步對第二個數(shù)據(jù)池運行了兩次數(shù)據(jù)算法,一次設定頭尾分布的閾值(t=20k)與400M一致(最終獲得1B數(shù)據(jù)),一次設定尾部分布的比例與400M尾部的比例一致(t=170k,最終獲得2.5B數(shù)據(jù))。


MetaCLIP在DataComp的38個任務上的實驗結果如下:


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)


我們可以看到MetaCLIP在400M上略好于OpenAI CLIP或者OpenCLIP。在第二個池上性能進一步超越400M。更多的數(shù)據(jù)在更大的模型ViT-bigG上產(chǎn)生更好的效果。而這些性能的提升完全來自數(shù)據(jù)而非模型結構改進或者訓練技巧本身。


在CLIP/SLIP每個分類任務上的詳細實驗結果請參考原文。


實驗結論


本文提出了CLIP的數(shù)據(jù)算法來產(chǎn)生高質(zhì)量訓練數(shù)據(jù):算法可在所有CommonCrawl 的300+B 級圖片樣本對上并行運行。


實驗表明元數(shù)據(jù)字符串匹配和平衡分布都對結果有重大貢獻,算法無需使用CLIP模型過濾或者提高訓練開銷來提升性能,并且使得訓練數(shù)據(jù)分布更加透明。


本文轉(zhuǎn)自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/bEhDOBWcGeUZGMGA6lHoCA??

收藏
回復
舉報
回復
相關推薦
欧洲成人免费视频| 日韩免费在线观看| 夜夜爽99久久国产综合精品女不卡| 国产男人搡女人免费视频| 久久精品av| 精品国产百合女同互慰| 久久久久狠狠高潮亚洲精品| 麻豆视频在线观看免费网站| 成人美女视频在线观看| 国产福利成人在线| 欧美成人国产精品高潮| 亚洲资源网站| 日韩一区二区在线看| 人妻少妇被粗大爽9797pw| 久草中文在线| 久久网站最新地址| 91视频99| 一区二区视频网站| 国内精品99| 最近2019中文字幕mv免费看| 国产草草浮力影院| 中文字幕在线2019| 国模吧视频一区| 少妇激情综合网| 精品黑人一区二区三区观看时间| 高清一区二区中文字幕| 色婷婷综合久久久| 亚洲精品国产suv一区88| 精品电影在线| 99在线精品免费| 91精品国产一区二区三区动漫 | 天天综合色天天综合色h| 色女孩综合网| 日本v片在线免费观看| 国产suv一区二区三区88区| 国产精品日韩欧美综合| 五月婷婷亚洲综合| 韩国一区二区三区在线观看| 波霸ol色综合久久| www久久久久久久| 亚洲第一论坛sis| 亚洲国产精品99| 无码人妻一区二区三区免费n鬼沢| 精品三区视频| 色狠狠一区二区三区香蕉| 国产人妻777人伦精品hd| 婷婷色在线资源| 亚洲欧美日韩国产综合| 亚洲女人毛片| 在线观看麻豆| 国产精品嫩草久久久久| 日韩国产高清一区| 蜜桃视频在线观看视频| 26uuu亚洲综合色欧美| 久久久国产精品一区二区三区| 亚洲av无码一区二区三区性色| 国产中文字幕精品| 成人日韩在线电影| 国产美女免费看| 美国一区二区三区在线播放| 国产精品激情自拍| 99re热视频| 日本不卡免费在线视频| 国产高清视频一区三区| 免费在线观看av的网站| 麻豆成人在线观看| 成人福利网站在线观看11| 91av国产精品| 国产福利精品一区| 国产成人精品福利一区二区三区| 蜜臀久久精品久久久久| 波多野洁衣一区| 久久资源av| 成人jjav| 亚洲欧美电影一区二区| 污污污污污污www网站免费| 草莓视频丝瓜在线观看丝瓜18| 偷拍与自拍一区| 亚洲成熟丰满熟妇高潮xxxxx| 成人免费毛片嘿嘿连载视频…| 欧美精品精品一区| 久久黄色一级视频| 精品国产影院| 正在播放国产一区| 国产一区二区播放| 一本综合精品| 国产精品专区第二| 亚洲精品久久久久avwww潮水| 99久久精品免费看| 午夜精品区一区二区三| 91小视频xxxx网站在线| 午夜精品久久久久久久久| 国产裸体舞一区二区三区| 亚洲欧美久久精品| 亚洲第一视频在线观看| 蜜桃传媒一区二区亚洲| 欧美成人嫩草网站| 欧美在线一区二区三区四| 一级黄色免费片| 91在线观看一区二区| 亚洲欧洲一区二区| av最新在线| 欧美精品vⅰdeose4hd| 在线视频 日韩| 日韩欧美综合| 26uuu亚洲伊人春色| 91麻豆视频在线观看| 99精品欧美一区二区蜜桃免费| 亚洲精品成人三区| а√天堂中文在线资源8| 欧美日韩一区二区在线视频| 污片免费在线观看| 亚洲澳门在线| 国产精品爱啪在线线免费观看 | 国产91露脸合集magnet| 日韩欧美精品一区二区三区经典 | 热99在线视频| 性色av蜜臀av| 中文字幕一区日韩精品欧美| 国产日产欧美视频| eeuss鲁片一区二区三区| 一区二区三区天堂av| 日韩免费不卡视频| 国产精品亚洲人在线观看| 欧美日韩亚洲一区二区三区在线观看| 91最新在线视频| 欧美日韩成人在线一区| 在哪里可以看毛片| 亚洲久久一区| 99视频在线播放| 日本高清视频在线播放| 色婷婷久久99综合精品jk白丝| 俄罗斯黄色录像| 91精品一区国产高清在线gif | 91精品一区| 中文字幕亚洲综合久久| 亚洲大片免费观看| 99r精品视频| 男人日女人视频网站| 一本色道69色精品综合久久| 中文字幕在线看视频国产欧美| 国产精品免费精品一区| 91色porny蝌蚪| 久久久亚洲精品无码| 成人动漫视频| 久久久久久伊人| 日本黄色不卡视频| 午夜精品视频在线观看| av免费观看不卡| 亚洲精品123区| 精品在线视频一区二区| 蜜桃av在线| 亚洲免费av片| 五月婷婷激情视频| 国产亚洲婷婷免费| 中文字幕第80页| 日韩网站中文字幕| 一区二区三区高清国产| 日批视频免费观看| 国产精品麻豆视频| 中文国产在线观看| 亚洲午夜精品久久久久久app| 999日本视频| av女在线播放| 亚洲欧美综合精品久久成人| 蜜臀尤物一区二区三区直播| 国产欧美日韩视频一区二区| 污视频网址在线观看| 亚洲女同中文字幕| 51国偷自产一区二区三区| 欧美亚洲天堂| 日韩精品极品在线观看| 亚洲欧美一二三区| 中文字幕一区二区三| 91精产国品一二三产区别沈先生| 欧美 日韩 国产 一区| 国产91色在线|亚洲| 在线最新版中文在线| 伊人久久久久久久久久久久久| 中文字幕在线一| 夜夜嗨av一区二区三区四季av| 亚洲av成人精品一区二区三区| 另类亚洲自拍| 正在播放一区| 卡通动漫国产精品| 国产欧美精品在线播放| 午夜伦理在线视频| 亚洲视频axxx| av一级黄色片| 一本大道av伊人久久综合| 亚洲一级二级片| 99在线精品视频| 一二三级黄色片| 国产日韩一区二区三区在线| 亚洲一区影院| 免费看成人人体视频| 国产欧美在线视频| av丝袜在线| 色老头一区二区三区| 日韩一区免费视频| 9191久久久久久久久久久| 91美女免费看| 亚洲精品成a人| 美国一级黄色录像| 99精品视频在线免费观看| 女同激情久久av久久| 亚洲欧美日韩一区在线观看| 精品一区二区成人免费视频| 五月综合久久| 成人午夜电影在线播放| 青青国产精品| 国产成人+综合亚洲+天堂| 欧洲精品二区| 日韩中文字幕在线| 国产一级网站视频在线| 亚洲国产精品久久久久久| 国产又粗又猛又色又| 在线亚洲高清视频| 欧美三级一区二区三区| 一区二区三区在线影院| 秋霞欧美一区二区三区视频免费| 久久精品视频在线看| 亚洲激情 欧美| 国产高清不卡一区| 午夜影院免费观看视频| 久久精品国产亚洲aⅴ| 免费在线激情视频| 亚洲精品美女| 人妻无码久久一区二区三区免费| 亚洲精品97| 在线观看成人av电影| 精品视频亚洲| 日本一区二区三区四区在线观看 | 黄瓜视频在线免费观看| 亚洲一区二区三区四区在线免费观看 | 久久这里只有精品一区二区| 成人精品一二区| 免费一级欧美在线大片| 成人性生交xxxxx网站| 欧美大片网站| 成人在线一区二区| 日韩久久一区| 国产精品午夜视频| 玖玖精品在线| 成人国产在线视频| 欧美成人aaa| 成人在线免费观看视视频| 亚洲午夜国产成人| 成人在线视频网| 日韩三级精品| 鬼打鬼之黄金道士1992林正英| 伊色综合久久之综合久久| 91亚色免费| 99久久免费精品国产72精品九九 | 亚洲电影一级片| 国外成人在线视频网站| 美女一区二区在线观看| 免费久久一级欧美特大黄| 亚州国产精品| 日韩亚洲视频在线| 国产精品videosex性欧美| 天天综合五月天| 在线成人av| 91精品91久久久中77777老牛| 久久天堂精品| 日本免费色视频| 国产成人综合视频| 天堂久久久久久| 亚洲国产精品成人综合| 乱h高h女3p含苞待放| 亚洲影视在线观看| 69视频免费在线观看| 欧美日韩一区二区三区四区五区| 国产又粗又猛又爽又黄的| 日韩欧美一级二级三级久久久| 欧美视频在线观看一区二区三区| 日韩av在线天堂网| 成年在线观看免费人视频| 久久综合久久八八| av中文资源在线资源免费观看| 国产精品久久久久久久午夜 | 国产精品一区二区三区精品| 青青视频一区二区| 午夜精品一区二区三区四区| 影音先锋日韩精品| a级黄色一级片| 精品制服美女久久| 亚洲色图14p| 综合色中文字幕| 亚洲精品午夜国产va久久成人| 欧美日韩国产美女| 日本激情一区二区三区| 中文字幕亚洲二区| 嗯啊主人调教在线播放视频| 国产精品久久婷婷六月丁香| 99re8这里有精品热视频免费 | 欧洲另类一二三四区| av综合在线观看| 亚洲欧美在线一区二区| www在线观看播放免费视频日本| 98精品国产自产在线观看 | 91麻豆精品国产91| 午夜在线视频免费| www欧美日韩| 不卡福利视频| 波多野结衣精品久久| 三级电影一区| 久久久免费视频网站| 国产精品一卡二| 欧美亚洲色综久久精品国产| 亚洲va韩国va欧美va| 国产精品-色哟哟| 这里只有精品久久| 爱情电影社保片一区| 成人av免费看| 亚洲激情中文| 色片在线免费观看| 久久这里只有精品6| 国产一级一级片| 69p69国产精品| www 日韩| 国产suv精品一区二区| 美女网站色精品尤物极品姐弟| 久久久久久久久久久综合| 理论片日本一区| 国产三级av在线播放| 欧美日韩国产中文精品字幕自在自线| 99er热精品视频| 久久精品视频网站| 亚洲精品tv| 亚洲人成人77777线观看| 日韩不卡在线观看日韩不卡视频| 91玉足脚交白嫩脚丫| 亚洲国产日产av| 亚洲欧美高清视频| 欧美黑人性视频| 91蜜桃臀久久一区二区| www国产无套内射com| 国产精品一区二区黑丝| 日本高清一二三区| 欧美精三区欧美精三区| 在线a免费看| 国产综合在线观看视频| 91综合在线| 国产在线观看中文字幕| 亚洲精品高清视频在线观看| 国产成人精品一区二区无码呦| 乱亲女秽乱长久久久| 秋霞影院一区| 国产精品一色哟哟| www.日本不卡| 国产一级做a爱片久久毛片a| 亚洲欧美日韩在线一区| 澳门av一区二区三区| 亚洲欧美久久234| 国产一区二区三区高清播放| 欧美 日韩 国产 一区二区三区| 日韩三级在线观看| 九色91在线| 久久久一本精品99久久精品66| 久久xxxx| 成人信息集中地| 日韩欧美成人激情| 激情黄产视频在线免费观看| 久久久99国产精品免费| 日韩电影在线一区二区三区| 日韩精品久久久久久久的张开腿让| 在线成人高清不卡| 男人天堂亚洲天堂| 久久大片网站| 男人的天堂亚洲一区| 老熟妇高潮一区二区三区| 精品精品欲导航| 免费电影日韩网站| 亚洲精品一区二区三| 国产福利精品导航| www亚洲视频| 久久久久北条麻妃免费看| 国产精品45p| 免费日韩中文字幕| 亚洲人成在线观看一区二区| 天堂中文在线观看视频| 国产精品视频26uuu| 国产精品xvideos88| www.av天天| 日韩美一区二区三区| 免费观看成人性生生活片 | 国产精品av久久久久久无| 日韩欧美国产综合一区| 午夜久久中文| 日韩精品一区二区三区电影| 久久亚洲免费视频| 国产一区二区在线视频观看| 欧美天堂在线视频| 欧美日韩国产123区| 日韩精品卡一| 性欧美大战久久久久久久免费观看| 国产经典欧美精品| 亚洲无码精品一区二区三区| 欧美激情按摩在线|