基于PyTorch、易上手,細(xì)粒度圖像識別深度學(xué)習(xí)工具庫Hawkeye開源
細(xì)粒度圖像識別 [1] 是視覺感知學(xué)習(xí)的重要研究課題,在智能新經(jīng)濟(jì)和工業(yè)互聯(lián)網(wǎng)等方面具有巨大應(yīng)用價值,且在諸多現(xiàn)實場景已有廣泛應(yīng)用…… 鑒于當(dāng)前領(lǐng)域內(nèi)尚缺乏該方面的深度學(xué)習(xí)開源工具庫,南京理工大學(xué)魏秀參教授團(tuán)隊用時近一年時間,開發(fā)、打磨、完成了 Hawkeye——細(xì)粒度圖像識別深度學(xué)習(xí)開源工具庫,供相關(guān)領(lǐng)域研究人員和工程師參考使用。本文是對 Hawkeye 的詳細(xì)介紹。
1.什么是 Hawkeye 庫
Hawkeye 是一個基于 PyTorch 的細(xì)粒度圖像識別深度學(xué)習(xí)工具庫,專為相關(guān)領(lǐng)域研究人員和工程師設(shè)計。目前,Hawkeye 包含多種代表性范式的細(xì)粒度識別方法,包括 “基于深度濾波器”、“基于注意力機制”、“基于高階特征交互”、“基于特殊損失函數(shù)”、“基于網(wǎng)絡(luò)數(shù)據(jù)” 以及其他方法。
Hawkeye 項目代碼風(fēng)格良好,結(jié)構(gòu)清晰易讀,可拓展性較強。對于剛接觸細(xì)粒度圖像識別領(lǐng)域的相關(guān)人員而言,Hawkeye 較易上手,便于其理解細(xì)粒度圖像識別的主要流程和代表性方法,同時也方便在本工具庫上快速實現(xiàn)自己的算法。此外,我們還給出了庫中各模型的訓(xùn)練示例代碼,自研方法也可按照示例快速適配并添加至 Hawkeye 中。
Hawkeye 開源庫鏈接:https://github.com/Hawkeye-FineGrained/Hawkeye
2.Hawkeye 支持的模型及方法
Hawkeye 目前支持細(xì)粒度圖像識別中主要學(xué)習(xí)范式的共 16 個模型與方法,具體如下:
基于深度濾波器
- S3N (ICCV 2019)
- Interp-Parts (CVPR 2020)
- ProtoTree (CVPR 2021)
基于注意力機制
- OSME+MAMC (ECCV 2018)
- MGE-CNN (ICCV 2019)
- APCNN (IEEE TIP 2021)
基于高階特征交互
- BCNN (ICCV 2015)
- CBCNN (CVPR 2016)
- Fast MPN-COV (CVPR 2018)
基于特殊損失函數(shù)
- Pairwise Confusion (ECCV 2018)
- API-Net (AAAI 2020)
- CIN (AAAI 2020)
基于網(wǎng)絡(luò)數(shù)據(jù)
Peer-Learning (ICCV 2021)
其他方法
NTS-Net (ECCV 2018)
CrossX (ICCV 2019)
DCL (CVPR 2019)
3.安裝 Hawkeye
安裝依賴
使用 conda 或者 pip 安裝相關(guān)依賴:
- Python 3.8
- PyTorch 1.11.0 or higher
- torchvison 0.12.0 or higher
- numpy
- yacs
- tqdm
克隆倉庫:
git clone https://github.com/Hawkeye-FineGrained/Hawkeye.git cd Hawkeye
準(zhǔn)備數(shù)據(jù)集
我們提供了 8 個常用的細(xì)粒度識別數(shù)據(jù)集及最新的下載鏈接:
- CUB200: https://data.caltech.edu/records/65de6-vp158/files/CUB_200_2011.tgz
- Stanford Dog: http://vision.stanford.edu/aditya86/ImageNetDogs/images.tar
- Stanford Car: http://ai.stanford.edu/~jkrause/car196/car_ims.tgz
- FGVC Aircraft: https://www.robots.ox.ac.uk/~vgg/data/fgvc-aircraft/archives/fgvc-aircraft-2013b.tar.gz
- iNat2018: https://ml-inat-competition-datasets.s3.amazonaws.com/2018/train_val2018.tar.gz
- WebFG-bird: https://web-fgvc-496-5089-sh.oss-cn-shanghai.aliyuncs.com/web-bird.tar.gz
- WebFG-car: https://web-fgvc-496-5089-sh.oss-cn-shanghai.aliyuncs.com/web-car.tar.gz
- WebFG-aircraft: https://web-fgvc-496-5089-sh.oss-cn-shanghai.aliyuncs.com/web-aircraft.tar.gz
首先,下載一個數(shù)據(jù)集(以 CUB200 為例):
我們提供了上述 8 個數(shù)據(jù)集的 meta-data 文件,能夠匹配庫中的 FGDataset 方便地加載訓(xùn)練集和測試集,訓(xùn)練集和測試集為各個數(shù)據(jù)集官方提供的劃分。使用不同數(shù)據(jù)集時,只需在實驗的 config 文件中修改 dataset 配置即可,方便切換。
在實驗的 config 文件中修改 dataset 配置,示例如下:
4.使用 Hawkeye 訓(xùn)練模型
對于 Hawkeye 支持的每個方法,我們均提供了單獨的訓(xùn)練模板和配置文件。例如訓(xùn)練 APINet 只需一條命令:
實驗的參數(shù)都在相應(yīng)的 yaml 文件中,可讀性高、便于修改,如:
實驗的主程序 Examples/APINet.py 中的訓(xùn)練器 APINetTrainer 繼承自 Trainer,不需要再寫復(fù)雜的訓(xùn)練流程、logger、模型保存、配置加載等代碼,只用按需修改部分模塊即可。我們也提供了訓(xùn)練階段的多個 hook 鉤子,可以滿足一些方法特別的實現(xiàn)方式。
日志文件、模型權(quán)重文件、訓(xùn)練使用的訓(xùn)練代碼以及當(dāng)時的配置文件都會保存在實驗輸出目錄 log_dir 中,備份配置和訓(xùn)練代碼便于日后對不同實驗進(jìn)行對比。
更多詳細(xì)示例可參考項目鏈接中的具體信息:https://github.com/Hawkeye-FineGrained/Hawkeye



























