精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Open Vocabulary Detection 開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽 2023獲勝團(tuán)隊(duì)方案分享

人工智能
由中國(guó)圖象圖形學(xué)學(xué)會(huì)與360人工智能研究院舉辦的Open Vocabulary Detection Contest - 開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽已經(jīng)正式結(jié)束,本文在征集各個(gè)競(jìng)賽團(tuán)隊(duì)的許可后,對(duì)部分優(yōu)勝團(tuán)隊(duì)的技術(shù)方案匯總并公開(kāi)分享。

OVD技術(shù)簡(jiǎn)介 

目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域中的一項(xiàng)核心任務(wù),其主要目標(biāo)是讓計(jì)算機(jī)能夠自動(dòng)識(shí)別圖片中目標(biāo)的類別,并準(zhǔn)確標(biāo)示每個(gè)目標(biāo)的位置。目前,主流的目標(biāo)檢測(cè)方法主要針對(duì)閉集目標(biāo)的開(kāi)發(fā),即在任務(wù)開(kāi)始之前需要對(duì)待檢測(cè)目標(biāo)進(jìn)行類別定義,并進(jìn)行人工數(shù)據(jù)標(biāo)注,通過(guò)有監(jiān)督模型的訓(xùn)練來(lái)實(shí)現(xiàn)目標(biāo)檢測(cè)。這種方法通常適用于待檢測(cè)目標(biāo)數(shù)量較少的情況,一般限定在幾十個(gè)類別以內(nèi)。然而,當(dāng)待檢測(cè)目標(biāo)的類別數(shù)量增加到幾千甚至萬(wàn)級(jí)時(shí),以上述方式進(jìn)行數(shù)據(jù)標(biāo)注已經(jīng)無(wú)法滿足需求。同時(shí),已經(jīng)訓(xùn)練好的模型也無(wú)法應(yīng)對(duì)新出現(xiàn)的類別。當(dāng)新的類別出現(xiàn)時(shí),需要手動(dòng)進(jìn)行標(biāo)注并重新訓(xùn)練模型,整體效率較低。

開(kāi)放詞集目標(biāo)檢測(cè)(Open Vocabulary Detection, OVD),亦即開(kāi)放世界目標(biāo)檢測(cè),提供了解決上述問(wèn)題的新思路。借助于現(xiàn)有跨模態(tài)模型(CLIP[1]、ALIGN[2]、R2D2[3] 等)的泛化能力,OVD可以實(shí)現(xiàn)以下功能:1)對(duì)已定義類別的few shot檢測(cè);2)對(duì)未定義類別的zero-shot檢測(cè)。OVD技術(shù)的出現(xiàn)吸引了計(jì)算機(jī)視覺(jué)研究者們的廣泛關(guān)注,首先,對(duì)于已定義類別的few shot檢測(cè),OVD的強(qiáng)大泛化能力可以讓算法在僅有少量樣本的情況下,準(zhǔn)確地識(shí)別出新的目標(biāo)類別。其次,對(duì)于未定義類別的zero-shot檢測(cè),OVD的能力更是令人驚嘆。通過(guò)學(xué)習(xí)各種物體的視覺(jué)特征和語(yǔ)義信息,OVD可以在沒(méi)有見(jiàn)過(guò)的類別中進(jìn)行目標(biāo)檢測(cè),進(jìn)一步將語(yǔ)言大模型技術(shù)引入OVD,將會(huì)進(jìn)一步提升OVD對(duì)未知類別的檢測(cè)能力。OVD技術(shù)有望成為未來(lái)目標(biāo)檢測(cè)算法開(kāi)發(fā)的新范式。

圖片

競(jìng)賽介紹 

OVD技術(shù)的研究在國(guó)內(nèi)尚處于起步階段,為了促進(jìn)國(guó)內(nèi)OVD技術(shù)的發(fā)展,并加強(qiáng)OVD技術(shù)的生態(tài)社區(qū)建設(shè),360人工智能研究院聯(lián)合中國(guó)圖象圖形學(xué)學(xué)會(huì)于ICIG2023大會(huì)上開(kāi)設(shè)了Open Vocabulary Detection Contest - 開(kāi)放世界目標(biāo)檢測(cè)2023競(jìng)賽。大賽于4月12日啟動(dòng)報(bào)名,報(bào)名期間吸引了來(lái)自新加坡南洋理工大學(xué)、清華大學(xué)、北京大學(xué)、香港大學(xué)、中國(guó)科學(xué)院自動(dòng)化研究所紫東太初大模型研究中心、鵬城實(shí)驗(yàn)室、華中科技大學(xué)、字節(jié)跳動(dòng)、滴滴等知名大學(xué)與公司機(jī)構(gòu)共140支隊(duì)伍參加競(jìng)賽。此次大賽所使用的賽題數(shù)據(jù)、競(jìng)賽提交平臺(tái)與賽題設(shè)置均由360人工智能研究院提供支持。

賽題數(shù)據(jù)主要涵蓋了服裝、數(shù)碼產(chǎn)品等眾多商品類目,對(duì)于一件商品,均給出了它的圖片以及對(duì)應(yīng)的檢測(cè)框標(biāo)注信息作為訓(xùn)練數(shù)據(jù)。商品數(shù)據(jù)在互聯(lián)網(wǎng)搜索、推薦中具有重要價(jià)值,是非常貼近業(yè)務(wù)場(chǎng)景的實(shí)用數(shù)據(jù)。其次商品數(shù)據(jù)集的難度較大,同類別商品之間普遍存在一些細(xì)節(jié)差異,而這一點(diǎn)也限制了傳統(tǒng)目標(biāo)檢測(cè)技術(shù)的泛化能力,進(jìn)而體現(xiàn)出OVD技術(shù)的優(yōu)勢(shì)性。

賽題設(shè)置:參賽者運(yùn)用OVD相關(guān)的方法,對(duì)圖像中的商品目標(biāo)進(jìn)行檢測(cè)。對(duì)于一件商品,主辦方會(huì)給出它的圖片以及bbox作為訓(xùn)練數(shù)據(jù)。目標(biāo)類別有兩類:base類和novel類。類別均為中文商品詞組。base類的目標(biāo)提供少量已標(biāo)注的訓(xùn)練樣本,novel類的目標(biāo)則沒(méi)有訓(xùn)練樣本。評(píng)測(cè)分別在base類的測(cè)試集和novel類的測(cè)試集上進(jìn)行,評(píng)測(cè)指標(biāo)為novel和base類的mAP@50,競(jìng)賽按照novel和base類別的整體mAP@50排序。

競(jìng)賽共分為初賽與復(fù)賽兩個(gè)階段,由初賽到復(fù)賽,賽題難度逐步提升,考驗(yàn)選手對(duì)開(kāi)放世界目標(biāo)檢測(cè)賽題的熟悉程度與靈活應(yīng)變能力。比賽中,各位選手的方案追逐激烈,最終前三名團(tuán)隊(duì)的復(fù)賽分?jǐn)?shù)十分接近。經(jīng)過(guò)初賽與復(fù)賽的層層選拔,最終有6支隊(duì)伍脫穎而出,由來(lái)自南洋理工大學(xué)的吳思澤團(tuán)隊(duì)摘得桂冠。獲得二等獎(jiǎng)的是來(lái)自華中科技大學(xué)的STAR團(tuán)隊(duì)與來(lái)自中國(guó)科學(xué)院自動(dòng)化研究所紫東太初大模型研究中心的咱們組有名稱嗎團(tuán)隊(duì),獲得三等獎(jiǎng)的是來(lái)自北京大學(xué)的OVD團(tuán)隊(duì)、來(lái)自哈爾濱工業(yè)大學(xué)的wzmwzr團(tuán)隊(duì)與來(lái)自武漢郵電科學(xué)研究院的藍(lán)色閃團(tuán)隊(duì)。Open Vocabulary Detection Contest - 開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽的官網(wǎng)鏈接:開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽2023 (360cvgroup.github.io)

在各個(gè)競(jìng)賽團(tuán)隊(duì)的積極參與、中國(guó)圖象圖形學(xué)學(xué)會(huì)與360人工智能研究院的大力支持下,Open Vocabulary Detection Contest - 開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽已經(jīng)正式結(jié)束,在征集各個(gè)競(jìng)賽團(tuán)隊(duì)的許可后,我們將部分優(yōu)勝團(tuán)隊(duì)的技術(shù)方案匯總并公開(kāi)分享,詳見(jiàn)本文下半部分。

圖片

[1] A. Radford, J. W. Kim, C. Hallacy, A. Ramesh, G. Goh, S. Agarwal, G. Sastry, A. Askell, P. Mishkin, J. Clark, et al. Learning transferable visual models from natural language supervision. In International Conference on Machine Learning, pages 8748–8763. PMLR, 2021.

[2] C. Jia, Y. Yang, Y. Xia, Y.-T. Chen, Z. Parekh, H. Pham, Q. V. Le, Y. Sung, Z. Li, and T. Duerig. Scaling up visual and vision-language representation learning with noisy text supervision. In International Conference on Machine Learning, 2021.

[3] Xie C, Cai H, Song J, et al. Zero and R2D2: A Large-scale Chinese Cross-modal Benchmark and A Vision-Language Framework[J]. arXiv preprint arXiv:2205.03860, 2022.

冠軍方案講解 

團(tuán)隊(duì)介紹

來(lái)自南洋理工大學(xué)的博士生吳思澤

賽題分析

1、數(shù)據(jù)集

本次主辦方提供的是商品數(shù)據(jù)集,總共466個(gè)物體類別,其中訓(xùn)練中可見(jiàn)的有233個(gè)base類別,測(cè)試時(shí)檢測(cè)器需要能夠同時(shí)識(shí)別base類的物體意見(jiàn)另外233個(gè)novel類別的物體。數(shù)據(jù)集中圖片以網(wǎng)購(gòu)商品圖為主,背景通常較為簡(jiǎn)單,每張圖物體數(shù)量不多,存在大量以物體為中心(object-centric)的圖片,訓(xùn)練集中平均每張圖的物體標(biāo)注數(shù)量<2。

2解決思路

根據(jù)數(shù)據(jù)集屬性,可知互聯(lián)網(wǎng)中存在大量包含新類別的商品圖片,由于圖片場(chǎng)景簡(jiǎn)單,物體單一,在圖像層級(jí)(image-level)上學(xué)習(xí)新類別的表征,可很好泛化到檢測(cè)上。因此選擇基礎(chǔ)方案為Detic,使用爬蟲(chóng)獲取帶有新類別tag的圖片,用于image-level的訓(xùn)練。

方案總覽

采用Detic[1]的訓(xùn)練策略,同時(shí)使用目標(biāo)檢測(cè)數(shù)據(jù)(base類)和圖像分類數(shù)據(jù)(base類+novel類)訓(xùn)練檢測(cè)器。

圖片

方案流程介紹

1、數(shù)據(jù)處理

選擇百度圖片為爬取對(duì)象,索引關(guān)鍵詞為”[中文名稱] 商品圖片”,為保證類別平衡,novel和base類別均爬取40頁(yè)(大約1000張)。每個(gè)類別爬取到的圖片存到一個(gè)路徑下,這些圖片只有類別Tag,沒(méi)有物體框標(biāo)注。

圖片

2、類別名稱翻譯

為方便使用現(xiàn)有的開(kāi)源模型(CLIP),需要將466個(gè)中文名稱均翻譯成英文,我們使用google translator翻譯每個(gè)名稱并人工校對(duì)。

圖片 

3、模型介紹

選擇ResNet50和SwinB作為檢測(cè)器backbone,檢測(cè)器結(jié)構(gòu)為CenterNet2,使用Detic公開(kāi)的在公開(kāi)數(shù)據(jù)集LVIS和ImageNet上預(yù)訓(xùn)練的模型權(quán)重作為初始化。CLIP模型選擇ViT-L-14(只用text encoder)來(lái)得到類別名稱的embeddings。分類的損失函數(shù)為BCE Loss。

4、Learnable Prompt

為了獲取類別名稱的text embeddings,在訓(xùn)練過(guò)程中學(xué)習(xí)一組長(zhǎng)度為4的learnable prompt以獲得更好的text表征。具體方案參考了coop[2]。

圖片

5、重要參數(shù)

  • 模型初始化:使用LVIS和ImageNet上預(yù)訓(xùn)練的模型作為初始化。
  • 總迭代次數(shù):18000。
  • image-level分支的batch size: 8x96,檢測(cè)分支batch size: 8x4。
  • image-level的權(quán)重:1.2,det分支權(quán)重:1.0。
  • 圖像分辨率:image-level分支448, 檢測(cè)分支 896。

6、測(cè)試結(jié)果

這里介紹的測(cè)試結(jié)果是隨著我們模塊和參數(shù)改變的變化,我們初始使用R50 backbone作為baseline, image-level分支的batch size為32,訓(xùn)練資源8xV100,增加到64之后需要8xA100 (或者整體batch size縮小,迭代數(shù)增加)。以下結(jié)果均來(lái)自初賽。 

圖片

  • ADetecting Twenty-thousand Classes using Image-level Supervision, Zhou et.al ECCV 2022.
  • Prompt Learning for Vision-Language Models, Zhou et.al IJCV 2022.

亞軍方案講解(第二名) 

團(tuán)隊(duì)介紹

來(lái)自華中科技大學(xué)的團(tuán)隊(duì),成員有冷福星,易成龍。

賽題分析

1、數(shù)據(jù)集

  • 訓(xùn)練數(shù)據(jù):233類已知類別的目標(biāo)檢測(cè)框
  • 初賽:7401張圖像
  • 復(fù)賽:14802張圖像

數(shù)據(jù)特點(diǎn):

  • 全部是電商類的商品圖像
  • 單張圖像中的目標(biāo)類別相同
  • 存在部分有效的OCR信息

2解決思路

利用前景檢測(cè)器對(duì)圖片進(jìn)行目標(biāo)定位,利用LLM來(lái)擴(kuò)充文本信息,最后結(jié)合ChineseCLIP進(jìn)行多模態(tài)圖文對(duì)齊生成類別信息。

方案總覽

如圖所示,是本次比賽中提出的算法 pipeline,不需要使用提供的類別信息,不引入額外的數(shù)據(jù),即可進(jìn)行任意商品類別的目標(biāo)檢測(cè):

  • 前景檢測(cè)器(Foreground Detector):不需要使用提供的233類類別信息,只使用位置坐標(biāo)訓(xùn)練一個(gè)前景檢測(cè)器,整個(gè) pipeline 中只有這里進(jìn)行梯度更新;
  • 提示詞工程(prompt engineering):使用大語(yǔ)言模型(LLM)進(jìn)行半自動(dòng)化的提示詞工程,輸入類別 c,給定模板規(guī)范,生成更多風(fēng)格多樣的提示詞;
  • 多模態(tài)圖文對(duì)齊:使用 Chinese CLIP 進(jìn)行圖文特征對(duì)齊,進(jìn)行類別分類,使用提示詞集成(prompt ensemble)提高性能;

方案流程介紹

1、前景檢測(cè)器

圖片

 當(dāng)前主流的檢測(cè)器如圖所示,主要包括 Anchor Based 和 Anchor Free 兩類檢測(cè)器,前者精度高但速度慢,后者精度略差但速度快;

  • 前景 proposal 使用 WBF(Weighted Boxes Fusio)集成了CBNetV2_Swin,CascadeRCNN_Convnext,CascadeRCNN_Hornet,CascadeRCNN_resnext101,DetecotoRS_r101,VFNet_resnext101;實(shí)際使用CBNetV2_Swin單個(gè)檢測(cè)器分?jǐn)?shù)不低,集成在分?jǐn)?shù)提升大概1個(gè)點(diǎn);
  • 使用訓(xùn)練好的前景檢測(cè)器檢測(cè)目標(biāo),進(jìn)行多尺度裁剪(外擴(kuò)+0,+30像素),并加入全圖(利用有效的OCR信息,如圖2中右上角的陶笛文本)一起進(jìn)行圖文對(duì)齊,將3個(gè)尺度的輸出 logits 進(jìn)行平均;

2、提示詞工程

CLIP模型是雙塔結(jié)構(gòu),直接使用類別信息進(jìn)行文本對(duì)齊的效果不是最佳的,為了充分挖掘文本 encode 的潛力,需要進(jìn)行一定的提示詞工程;在實(shí)驗(yàn)中,使用 “c” 和 一張“c”的圖片,驗(yàn)證集上后者分?jǐn)?shù)高5個(gè)點(diǎn);

可以使用 ChahtGPT/LLMA 2 進(jìn)行交互,逐步引導(dǎo) LLM 生成想要的提示詞模板;最后得到多條 prompts,可以進(jìn)行 prompt ensemble,ensemble 的方法有以下三種,實(shí)際只使用了最簡(jiǎn)單的 Uniform averaging;

  • Uniform averaging
  • Weighted averaging
  • Majority Voting

圖片

3、消融實(shí)驗(yàn)與實(shí)驗(yàn)結(jié)果

驗(yàn)證集:初賽訓(xùn)練集,(訓(xùn)練中沒(méi)有使用類別信息,用來(lái)評(píng)測(cè)CLIP模型分類能力)

  • PE:prompt engineering
  • CME:CLIP model ensemble(0.7*VIT-H@224+0.3*VIT-L@336)

圖片

4、拓展思路

上述提出的 pipeline 使用了位置信息進(jìn)行訓(xùn)練,使用 CLIP 也可不進(jìn)行訓(xùn)練進(jìn)行任意目標(biāo)檢測(cè):

圖片

將圖像分成小 patch,滑動(dòng)窗口 crop 圖像送入 CLIP 模型提取圖文相似性。每個(gè)窗口根據(jù)閾值判斷目標(biāo)類別,也可以將當(dāng)前窗口圖像置0,看整圖類別相似性哪個(gè)下降最多。但該方法,滑動(dòng)窗口的方式替代 proposal 的檢出比較耗時(shí),實(shí)測(cè)精度也沒(méi)有上述方法高;

季軍方案講解(第三名) 

團(tuán)隊(duì)介紹

“我們組有名稱嗎”團(tuán)隊(duì)來(lái)自中國(guó)科學(xué)院自動(dòng)化研究所紫東太初大模型研究中心,紫東太初大模型研究中心致力于構(gòu)建低功耗萬(wàn)億突觸多模態(tài)認(rèn)知大模型,建立面向開(kāi)放復(fù)雜環(huán)境的可解釋、可信、可演化的多模態(tài)人工智能基礎(chǔ)平臺(tái),建成新一代人工智能重大基礎(chǔ)設(shè)施,形成創(chuàng)新應(yīng)用生態(tài)。比賽團(tuán)隊(duì)由兩名博士生(詹宇飛、楊帆)、一名碩士生(趙弘胤)和一名本科生(王天琦)組成,在朱優(yōu)松老師指導(dǎo)下共同完成本次比賽,目前團(tuán)隊(duì)主要研究方向?yàn)橐曈X(jué)大模型、目標(biāo)檢測(cè)、開(kāi)放詞匯目標(biāo)檢測(cè)及長(zhǎng)尾目標(biāo)檢測(cè)等。

賽題分析

1、數(shù)據(jù)集

在開(kāi)放詞匯目標(biāo)檢測(cè)的研究中,端到端訓(xùn)練方法由于其在訓(xùn)練速度的優(yōu)勢(shì)和公平對(duì)比的要求獲得了更為廣泛的使用。在本次商品場(chǎng)景下的開(kāi)放世界目標(biāo)檢測(cè)競(jìng)賽中,主要存在以下四個(gè)問(wèn)題:

  • 噪聲大---數(shù)據(jù)標(biāo)注噪聲大,各類別均存在誤標(biāo)、漏標(biāo)等情況,標(biāo)注方式不統(tǒng)一;
  • 定位難---少樣本訓(xùn)練設(shè)定下,端到端微調(diào)精準(zhǔn)定位和分類效果差;
  • 易混淆---類別細(xì)粒度程度高,且多為商品數(shù)據(jù),類內(nèi)方差大,通用中文圖文模型無(wú)法有效區(qū)分;
  • 主體判斷難---該場(chǎng)景設(shè)定下,每張圖中只可識(shí)別出主要商品,共同出現(xiàn)的其他商品需被抑制。

2、解決思路

為解決上述問(wèn)題,通過(guò)對(duì)數(shù)據(jù)的類別分布和實(shí)例位置分布的分析,我們發(fā)現(xiàn)圖片的實(shí)例以單類別形式出現(xiàn),且居中分布,具備任務(wù)解耦的基礎(chǔ)。因此,我們選擇雙階段的方法,將框回歸和商品物體分類進(jìn)行剝離,分別實(shí)現(xiàn)類別無(wú)關(guān)的框回歸以解決定位難和主題判斷難得問(wèn)題,和基于CLIP特征的零樣本和少樣本分類以解決噪聲大和易混淆得問(wèn)題。且將任務(wù)拆分為兩個(gè)子任務(wù),分別迭代,有效提高了優(yōu)化速度。

方案總覽

方案整體框架下圖所示,按照子任務(wù)拆分,我們將訓(xùn)練分為檢測(cè)器訓(xùn)練和圖文模型優(yōu)化兩部分,將最終優(yōu)化好的模型在推理階段進(jìn)行組合,在推理規(guī)則的輔助下完成對(duì)場(chǎng)景中的少樣本和零樣本類別的檢測(cè)。 

圖片

方案流程介紹

1、用于目標(biāo)定位的數(shù)據(jù)補(bǔ)充

為抑制模型產(chǎn)生大框的傾向和糾正在部分情況下錯(cuò)誤產(chǎn)生部件框造成得定位難問(wèn)題,我們額外爬取659張Base類別商品圖片,利用訓(xùn)練好的模型打偽標(biāo)簽的形式構(gòu)建,選取置信度大于0.8的預(yù)測(cè)框并采用人工校驗(yàn)的方式進(jìn)行清洗過(guò)濾,去掉其中的局部框等,構(gòu)建了包含659張圖片的糾正數(shù)據(jù)子集,用于模型的微調(diào)。

2、目標(biāo)定位模塊

在商品目標(biāo)定位部分,考慮到在開(kāi)放詞匯目標(biāo)檢測(cè)任務(wù)下,檢測(cè)器首先應(yīng)當(dāng)定位出所有可能的物體,其中包括不具備檢測(cè)標(biāo)注的novel類別。因此,我們選擇將檢測(cè)器訓(xùn)練為二分類商品檢測(cè)器,用于提取圖片中可能存在的商品。我們選擇Cascade-RCNN訓(xùn)練二分類的商品檢測(cè)模型,利用多個(gè)級(jí)聯(lián)的回歸分支提升模型對(duì)于物體的識(shí)別與定位能力。為提高模型的特征提取能力,我們選擇以Swin-Transformer Small為骨干網(wǎng)絡(luò),Neck默認(rèn)使用了FPN融合高層語(yǔ)義特征與低層的細(xì)節(jié)特征,最后輸出物體得分大于0.1的候選框中選擇排名前100個(gè)檢測(cè)框。

3、用于目標(biāo)分類的數(shù)據(jù)補(bǔ)充

為解決低數(shù)據(jù)量下的噪聲和混淆問(wèn)題,在開(kāi)放詞匯任務(wù)設(shè)定的啟發(fā)下,我們分別采用關(guān)鍵字“類別名稱 商品圖片”搜索和相似圖片搜索的方式,從百度、谷歌、電商平臺(tái)等網(wǎng)絡(luò)數(shù)據(jù)中收集了70w的數(shù)據(jù)用于模型的微調(diào),并利用ChatGLM對(duì)類別和圖片生成描述,提高圖文對(duì)的語(yǔ)義豐富度,進(jìn)而增強(qiáng)模型的判別能力,如圖2所示。通過(guò)對(duì)微調(diào)方式的對(duì)比,我們對(duì)比了目前較優(yōu)的三種微調(diào)方式Finetune、Lora及LiT,如表1所示,發(fā)現(xiàn)Lora進(jìn)行微調(diào)時(shí)能夠更準(zhǔn)確的識(shí)別novel類別,當(dāng)采用全量微調(diào)時(shí)能夠,能夠獲得更好的base類別識(shí)別效果,因此在最終的模型中我們將這兩者進(jìn)行融合。

圖片

4、目標(biāo)分類模塊

在商品目標(biāo)分類部分,通過(guò)對(duì)當(dāng)前開(kāi)源的中文圖文模型的調(diào)研,我們選擇目前性能最優(yōu)的中文圖文模型Chinese-CLIP,該模型繼承于OpenCLIP,視覺(jué)分支采用ViT結(jié)構(gòu),文本分支采用RoBERTa結(jié)構(gòu),我們選擇ViT-H-224的模型進(jìn)行微調(diào)。

5推理優(yōu)化

在推理階段,我們將數(shù)據(jù)先驗(yàn)(單一類別、圖文并茂)以規(guī)則的形式加入其中,設(shè)計(jì)了全局概率融合、OCR輔助推理和類別一致性校正三條規(guī)則,進(jìn)一步解決數(shù)據(jù)的易混淆和主體判斷難問(wèn)題。我們將規(guī)則和模型整理為如下的推理流程:

  • RPN候選框推理:使用訓(xùn)練好的定位模型,對(duì)測(cè)試集中的每張圖進(jìn)行推理,得到每張圖的候選框;
  •  圖文特征提?。簩?duì)每一張圖,根據(jù)(1)中產(chǎn)生的候選框結(jié)果,截取對(duì)應(yīng)的感興趣區(qū)域,與全圖共同送入訓(xùn)練好的CLIP模型中提取區(qū)域特征和類別文本特征;
  • 全局特征融合:對(duì)每一個(gè)候選框產(chǎn)生的區(qū)域特征,按照8:2的比例與全局特征相加,校正得到最終的區(qū)域特征,與文本特征計(jì)算余弦相似度;
  • OCR輔助校正:對(duì)于每一個(gè)候選框的分類概率,結(jié)合全圖的OCR結(jié)果,根據(jù)所設(shè)計(jì)的OCR規(guī)則進(jìn)行類別概率校正;
  • 類別一致性校正:對(duì)所有的候選框的分類結(jié)果和全圖的分類結(jié)果進(jìn)行對(duì)比,若候選框中存在與全圖類別一致的候選框,則輸出一致候選框,若無(wú)則輸出所有框中分?jǐn)?shù)最高的候選框作為該圖片的最終結(jié)果。

6、測(cè)試結(jié)果

通過(guò)模型優(yōu)化和規(guī)則設(shè)計(jì),我們的方案在零樣本類別上實(shí)現(xiàn)了50.08%的AP50,在少樣本類別上實(shí)現(xiàn)了54.16%的AP50,最終識(shí)別效果如下:

圖片

責(zé)任編輯:姜華 來(lái)源: DataFunTalk
相關(guān)推薦

2021-08-30 11:47:20

數(shù)字化

2023-10-18 13:27:00

數(shù)據(jù)訓(xùn)練

2024-12-23 10:30:00

AI訓(xùn)練模型

2021-09-27 09:48:52

神經(jīng)網(wǎng)絡(luò)AI目標(biāo)檢測(cè)

2024-08-01 09:00:00

目標(biāo)檢測(cè)端到端

2014-06-30 13:49:00

2009-05-13 17:01:31

TheOpenGrou金蝶標(biāo)準(zhǔn)

2024-11-18 08:15:00

2024-07-01 13:12:45

銳捷網(wǎng)絡(luò)

2024-12-23 06:30:00

目標(biāo)檢測(cè)圖像分類YOLO

2025-08-21 09:29:18

2017-09-28 13:30:55

阿里巴巴

2024-10-31 10:29:28

2024-12-04 10:00:00

自動(dòng)駕駛3D檢測(cè)

2019-08-01 12:47:26

目標(biāo)檢測(cè)計(jì)算機(jī)視覺(jué)CV

2017-10-02 16:13:47

深度學(xué)習(xí)目標(biāo)檢測(cè)計(jì)算機(jī)視覺(jué)

2015-02-04 11:03:34

時(shí)代馬云阿里巴巴

2024-12-09 07:15:00

世界模型AILLM
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美女子与性| 免费一级特黄3大片视频| www.综合网.com| av免费网站在线观看| 日韩欧美高清| 欧美一区二区三区播放老司机| 成人性做爰片免费视频| 天天摸天天碰天天爽天天弄| 日韩国产欧美三级| 欧美激情综合亚洲一二区| 免费a级黄色片| 在线免费观看亚洲| 日韩欧美亚洲范冰冰与中字| 中国成人亚色综合网站 | 色美美综合视频| 中文字幕av日韩精品| 无码国产精品一区二区免费16| 久色婷婷小香蕉久久| 97激碰免费视频| 青青操在线视频观看| 日本午夜精品| 91精品国产色综合久久不卡电影 | 黑人巨大精品一区二区在线| 欧美调教在线| 91精品国产91热久久久做人人| 国产l精品国产亚洲区久久| www.欧美日本韩国| 中文文精品字幕一区二区| 国产在线精品一区二区中文| 国产肥老妇视频| 美女一区二区三区| 国产mv久久久| 日本一区二区三区免费视频| 亚洲五月综合| 最近2019中文字幕一页二页| xxxxx在线观看| 日韩精品丝袜美腿| 精品精品欲导航| 无码国产精品一区二区高潮| 久久久久久一区二区三区四区别墅 | 九色视频成人porny| 99久久一区二区| 精品一区二区免费| 国产精品一区二区性色av| 久久夜色精品国产噜噜亚洲av| 99精品免费网| 午夜精品久久久久久久白皮肤| 校园春色 亚洲| 欧美日韩免费观看一区=区三区| 久久精品国产视频| 国内毛片毛片毛片毛片毛片| 欧美一站二站| 中文字幕亚洲一区二区三区| 老头老太做爰xxx视频| 神马久久一区二区三区| 亚洲人成电影网| 熟女俱乐部一区二区| 国产99久久精品一区二区300| 疯狂欧洲av久久成人av电影| 日韩毛片高清在线播放| 中文字幕不卡每日更新1区2区| 日本中文字幕在线视频| 亚洲人吸女人奶水| 在线观看欧美一区| 二区三区在线观看| 亚洲影院在线观看| 国产96在线 | 亚洲| h片在线观看视频免费| 五月天激情综合| av片中文字幕| 欧美激情福利| 日韩免费电影网站| 日本少妇毛茸茸| 欧美呦呦网站| 成年人精品视频| 国产精品theporn动漫| 久久青草久久| 91免费欧美精品| 国 产 黄 色 大 片| 久久综合久久久久88| 日韩妆和欧美的一区二区| 日本蜜桃在线观看| 亚洲一二三专区| 国产97色在线 | 日韩| 日本a人精品| 日韩精品专区在线影院重磅| 免费看黄色aaaaaa 片| 日韩电影在线视频| 欧美另类99xxxxx| 黑人精品无码一区二区三区AV| 日本视频一区二区三区| 91精品免费| 嫩草精品影院| 亚洲欧美日韩一区二区 | 日本sm残虐另类| 亚洲一区亚洲二区| 色就是色亚洲色图| 亚洲视频一区二区在线观看| www.成年人视频| 欧美日韩视频免费观看| 欧美一卡二卡三卡四卡| 在线免费观看成年人视频| 久久av中文| 欧美国产日韩中文字幕在线| 久久久国产免费| 成人一区二区三区| 亚洲国产婷婷香蕉久久久久久99| 黄网站在线观| 欧美日韩亚洲综合一区| 久久久久麻豆v国产精华液好用吗| 日韩精品久久| 欧洲精品久久久| www.午夜激情| 国产精品久久午夜| 无码人妻丰满熟妇区毛片18| 日韩在线观看一区二区三区| 在线日韩精品视频| 天堂中文在线网| 成人黄色在线看| 亚洲一区二区免费视频软件合集 | 色婷婷免费视频| 天天综合一区| 国产ts人妖一区二区三区| 亚洲精品视频专区| 亚洲天堂精品视频| 麻豆一区二区三区视频| 亚洲精品456| 午夜免费日韩视频| 亚洲第一色网站| 亚洲欧美激情插| 亚洲天堂2018av| 九九精品在线| 亚洲91精品在线| 日韩专区第一页| 亚洲一区二区不卡免费| 一区二区三区人妻| 欧美gayvideo| 国产日韩亚洲欧美| 69xxxx欧美| 欧美偷拍一区二区| 高清国产在线观看| 葵司免费一区二区三区四区五区| 久久亚洲高清| 在线手机中文字幕| 日韩精品久久久久久久玫瑰园 | 久久av资源站| 黑人巨大精品欧美一区二区免费 | 久热在线观看视频| 精品久久久久久亚洲综合网| 免费中文字幕在线观看| 国产999精品久久久久久| 久久久天堂国产精品| 秋霞午夜一区二区三区视频| 欧美日韩xxx| 亚洲第一大网站| 午夜精品久久久久久| xxxx黄色片| 久久精品女人天堂| 天堂一区二区三区 | 日本在线观看大片免费视频| 欧美一区二区视频在线观看2020| 中文字幕在线2021| 高清日韩电视剧大全免费| www.欧美黄色| 国产精品中文字幕制服诱惑| 8x拔播拔播x8国产精品| 青青草超碰在线| 欧美图区在线视频| 久草综合在线视频| 不卡视频一二三| 激情六月丁香婷婷| 久久在线播放| www日韩av| 日本乱码一区二区三区不卡| 亚洲最大在线视频| 国产毛片在线视频| 亚洲一区二区av在线| 我和岳m愉情xxxⅹ视频| 美女一区二区视频| av在线观看地址| 精品产国自在拍| 91人成网站www| 啊啊啊久久久| 最好看的2019的中文字幕视频| 国产区精品在线| 疯狂蹂躏欧美一区二区精品| 成熟人妻av无码专区| 国产精品一二三| 成人羞羞国产免费网站| 亚洲自拍偷拍网| 成人黄页在线观看| 日本a级片久久久| 二区三区精品| 日韩免费观看在线观看| 国产一二三区在线观看| 亚洲精品成人网| 一区二区精品视频在线观看| 精品久久久久久中文字幕一区奶水| 国产真人真事毛片视频| 成人精品小蝌蚪| 亚洲一区日韩精品| 亚洲欧美日韩精品一区二区| 国产日本欧美在线| 亚洲人成亚洲精品| 97久久精品午夜一区二区| 在线观看精品| 欧美激情一区二区三区成人| youjizz在线播放| 亚洲精品福利在线| 国产人妖一区二区三区| 91国偷自产一区二区开放时间| 久久久久久久久艹| 国产精品国产三级国产专播品爱网 | 色乱码一区二区三在线看| 91蜜桃臀久久一区二区| 国产日韩在线视频| 日韩免费福利视频| 97婷婷大伊香蕉精品视频| 国产福利在线播放麻豆| 尤物99国产成人精品视频| 天堂中文在线资源| 欧美一级一区二区| 亚洲天堂视频在线| 欧美午夜电影网| 香蕉影院在线观看| 精品毛片网大全| 四虎永久在线精品| 一区二区在线观看不卡| 紧身裙女教师波多野结衣| 欧美激情一区二区三区全黄 | 性一交一乱一色一视频麻豆| 欧美日韩成人在线一区| 波多野结衣视频观看| 天天综合色天天综合| 国产在线综合网| 伊人一区二区三区| 日韩欧美综合视频| 中文字幕五月欧美| 任我爽在线视频| 中文字幕第一区| 9.1片黄在线观看| 国产人成亚洲第一网站在线播放| 国产三级视频网站| 91蜜桃婷婷狠狠久久综合9色| 久久精品女同亚洲女同13| 成人av在线影院| 东京热av一区| 不卡一二三区首页| 右手影院亚洲欧美 | www欧美com| 亚洲精品第一国产综合野| 丝袜 亚洲 另类 欧美 重口 | 日批视频免费在线观看| 色成年激情久久综合| 波多野结衣一区二区三区四区| 在线免费观看视频一区| 中文在线免费观看| 欧美精品日韩一区| 99久久精品国产色欲| 日韩欧美亚洲国产另类| 国产成人手机在线| 日韩高清a**址| 国产片在线观看| 日韩视频第一页| 日本aa在线| 国内精品小视频在线观看| 美女的胸无遮挡在线观看| 日韩美女免费视频| 中文成人激情娱乐网| 高清视频在线观看一区| 日韩影视高清在线观看| 蜜桃视频在线观看成人| 色一区二区三区四区| 欧美少妇一区二区三区| 一区二区三区四区五区精品视频| 18禁男女爽爽爽午夜网站免费 | 国产一区红桃视频| 一区二区三区四区视频免费观看| 狠狠综合久久av| 国产午夜一区| 超碰97在线看| 亚欧成人精品| 在线播放黄色av| 99久久免费视频.com| a级黄色免费视频| 一区二区三区四区乱视频| 国产精品人人人人| 欧美日韩免费高清一区色橹橹| 免费国产羞羞网站视频| 亚洲日本中文字幕免费在线不卡| 国产视频在线播放| 456亚洲影院| 国产 日韩 欧美| 噜噜噜噜噜久久久久久91| 99久久99久久精品国产片桃花| 久久99久久99精品| 久久精品国产久精国产爱| 欧美熟妇精品一区二区蜜桃视频| 国产蜜臀av在线一区二区三区| 国产亚洲第一页| 欧美图片一区二区三区| 色婷婷综合视频| 久久精品电影网站| 在线日韩影院| 91久色国产| 日韩电影免费网址| 99热成人精品热久久66| 国产精品一级二级三级| 老熟妇一区二区| 精品毛片三在线观看| 精品久久久久中文慕人妻 | 国产91在线视频蝌蚪| 热久久美女精品天天吊色| 91精品入口| 影音先锋男人的网站| 日韩在线播放一区二区| 五十路六十路七十路熟婆| 亚洲美女少妇撒尿| 亚洲一区 中文字幕| 亚洲人成人99网站| av资源网在线播放| 99视频在线| 在线一区电影| 中文字幕久久av| 国产精品婷婷午夜在线观看| 日本视频在线观看免费| 亚洲精品mp4| 都市激情国产精品| 99免费在线视频观看| 欧美不卡视频| 奇米777在线视频| 国产精品看片你懂得| 波多野结衣黄色| 在线中文字幕日韩| 卡通欧美亚洲| 欧洲亚洲一区| 日欧美一区二区| 小早川怜子久久精品中文字幕| 精品欧美激情精品一区| 囯产精品一品二区三区| 欧美激情一区二区三区久久久| 亚洲精品视频一二三区| 国产91在线亚洲| 国产精品资源在线观看| 欧美黑人性猛交xxx| 欧美一区中文字幕| 18视频在线观看| 9a蜜桃久久久久久免费| 国产在线不卡| 妖精视频一区二区| 黄色精品一区二区| 三级国产在线观看| 国产精品久久久久久久午夜| 成人动漫免费在线观看| 亚洲综合婷婷久久| 自拍偷拍欧美激情| 国产高清在线观看视频| 国内精品久久久| 四虎5151久久欧美毛片| 熟妇人妻va精品中文字幕| 久久精品人人做人人综合| 亚洲精品一区二区二区| 色阁综合伊人av| 亚洲日本va中文字幕| 欧洲精品在线播放| 91丨porny丨国产| 欧美在线视频精品| www亚洲精品| ccyy激情综合| 无码aⅴ精品一区二区三区浪潮| 中文字幕国产精品一区二区| 国产又粗又大又爽视频| 色综合久久悠悠| 欧美精品国产白浆久久久久| 能在线观看的av| 中文字幕五月欧美| 天堂网av2014| 国产中文日韩欧美| 激情久久久久| 亚洲av熟女国产一区二区性色| 91麻豆精品国产91久久久资源速度 | 亚洲视频免费看| 日本精品久久久久久| 国产精品美女在线| 欧美日韩精品一本二本三本| 亚洲午夜久久久久久久久红桃| 欧美喷潮久久久xxxxx| 成人高潮aa毛片免费| 日韩久久精品一区二区三区| 国产剧情av麻豆香蕉精品| 日本中文字幕在线免费观看| 色综合亚洲精品激情狠狠| 99re6热只有精品免费观看| 国产免费成人在线| 亚洲精品你懂的| 人妻无码一区二区三区久久99| 国产精品一区二区久久| 亚洲高清在线| 男女做暖暖视频| 亚洲一区www|