計算機(jī)視覺領(lǐng)域非常好用的5個開源圖像標(biāo)注工具
本文介紹了 5 個很棒的標(biāo)注工具,我希望它們能幫助你創(chuàng)建計算機(jī)視覺數(shù)據(jù)集。
如果你是一名計算機(jī)視覺領(lǐng)域的數(shù)據(jù)科學(xué)家,你可能也意識到了你需要一個快速而簡單的標(biāo)注工具,其原因至少是以下兩個之一:
- PoC(譯者注:Proof of Concept)或研發(fā)實驗需要創(chuàng)建數(shù)據(jù)集
- 保證你的數(shù)據(jù)質(zhì)量,這樣它就不會影響你的深度學(xué)習(xí)算法的性能
我深入探究了計算機(jī)視覺標(biāo)注領(lǐng)域,發(fā)現(xiàn)它包含了大量令人印象深刻的工具(請看如下三個超級棒的工具清單:清單一,清單二,清單三,或者查看 這個博客)。我花了相當(dāng)多的時間比較最有前景的(和活躍的)項目,發(fā)現(xiàn)其中大部分工具都只能達(dá)到如下三個設(shè)計目標(biāo)中的其中一個:
1、如果你想在標(biāo)注行業(yè)展開業(yè)務(wù),你需要:
a. 先進(jìn)的項目管理功能
b. 足夠多的功能,以完成任何標(biāo)注任務(wù)
c. 提高效率的自動化工具
2、如果你屬于一家創(chuàng)業(yè)公司,你可能需要:
a. API,或者至少是將標(biāo)注工具連接到私有 API 的簡單方法
b. 直觀的用戶體驗(UX),使你臨時聘用的每個標(biāo)注人員都可以立即開始工作
3、如果你只是為自己工作,你:
a. 不用關(guān)心 API 或者項目管理
b. 只是想盡快開始標(biāo)注!
下面是我最喜歡的工具列表,這些工具允許為計算機(jī)視覺應(yīng)用標(biāo)注包圍框(用于物體檢測任務(wù))和多邊形框(用于分割任務(wù))。
如果你發(fā)現(xiàn)這些工具不能正常工作,請嘗試在 Chrome 中運(yùn)行它們。
計算機(jī)視覺標(biāo)注的簡要基礎(chǔ)知識 [可選]
在計算機(jī)視覺中,訓(xùn)練算法的數(shù)據(jù)主要有三種類型:
- 圖片 + 分類器訓(xùn)練標(biāo)簽(ResNets)
- 包圍框 + 檢測器標(biāo)簽(YOLOv3,F(xiàn)aster R-CNN……)
- 多邊形 + 用于分割應(yīng)用程序標(biāo)簽(Mask R-CNN)

注意分割數(shù)據(jù)(藍(lán)色)與檢測數(shù)據(jù)(紫色)的差異
正如你很可能已經(jīng)意識到的,對于 AI 項目來說,成功的最重要的影響因素之一是你可以使用的“優(yōu)質(zhì)數(shù)據(jù)”的數(shù)量。我所說的計算機(jī)視覺應(yīng)用的“優(yōu)質(zhì)數(shù)據(jù)”是指:
- 每個圖片 / 標(biāo)注都有一個恰當(dāng)?shù)臉?biāo)簽
- 每個邊界框或多邊形都緊致地包圍著要訓(xùn)練的物體。
即使后一種定義明顯缺乏客觀性,但我們希望我們的算法能夠達(dá)到人類的水平。因此,我們需要“人類水平”的標(biāo)注。
打標(biāo)公司的最佳開源標(biāo)注工具
計算機(jī)視覺標(biāo)注工具(CVAT)

計算機(jī)視覺標(biāo)注工具(CVAT)
在推出 OpenCV 近 20 年后,Intel 在計算機(jī)視覺領(lǐng)域再次發(fā)力,并發(fā)布了 CVAT,這是一個非常強(qiáng)大和完整的標(biāo)注工具。盡管它需要一些時間來學(xué)習(xí)和掌握,但它包含了大量的功能來標(biāo)注計算機(jī)視覺數(shù)據(jù)。
優(yōu)點(diǎn):
- 它很容易安裝和擴(kuò)展,因為它是一個運(yùn)行在 Docker 中的 Web 應(yīng)用程序
- 它包含了許多自動化工具(如使用 TensorFlow 物體檢測 API 的自動標(biāo)注、視頻插值……)
- 它允許協(xié)同工作管理,這樣團(tuán)隊中的不同成員就可以在同一個標(biāo)注任務(wù)上協(xié)同工作
缺點(diǎn):
- UI 相當(dāng)復(fù)雜。例如,對于初次設(shè)置標(biāo)注任務(wù)的用戶而言,這可能會非常棘手
- 一開始用起來不是很直觀,可能需要幾天的時間來掌握
- 只能運(yùn)行于 Chrome,所以如果你擔(dān)心谷歌……,你必須找到其他變通辦法
點(diǎn)擊這里查看在線演示:https://c.onepanel.io/onepanel-demo/projects/cvat-public-demo/workspaces!
創(chuàng)業(yè)公司的最佳開源標(biāo)注工具
可視化對象標(biāo)注工具(VoTT)

可視化對象標(biāo)注工具(VoTT)
VoTT 是由微軟開發(fā)的,它提供了非常棒的用戶體驗,這可能會在你標(biāo)注時為你節(jié)省大量的時間和精力。而且,創(chuàng)建項目也很直接,所以你可以不用深入閱讀其文檔就能使用它。
優(yōu)點(diǎn):
- 代碼寫得非常好(在 React 中),并且完美地定義了接口,因此獲取代碼和添加所需的額外功能都很容易
- 正如我所說的,UX 是完美的,它有一個黑色的主題和一個跟隨鼠標(biāo)的虛線網(wǎng)格,所以很容易知道從哪里開始標(biāo)注一個邊界框。這看起來像是一種額外嘉獎,但是相信我,這對于標(biāo)注來說真的很重要!
- 它提出使用深度學(xué)習(xí)算法來自動檢測對象(它附帶了在 COCO 數(shù)據(jù)集上訓(xùn)練的 SSD 模型)
- 它是一個 web 應(yīng)用程序和一個電子應(yīng)用程序。這使你可以將它作為一個重客戶端使用,也可以將它作為 web 瀏覽器中運(yùn)行的應(yīng)用程序來使用
缺點(diǎn):
- 要使用 web 應(yīng)用程序版本,你需要將數(shù)據(jù)托管在微軟的云計算服務(wù) Azure 上(然而,電子版應(yīng)用程序允許你在硬盤上使用數(shù)據(jù),但需要使用 npm 安裝程序)
- 它沒有提供一個內(nèi)置的 API(但是,通過調(diào)整代碼,使你的私有 API 能夠與之通信,這是非常容易的)
- 你不能給整張圖片貼標(biāo)簽:你只被允許繪制帶有相關(guān)標(biāo)簽的邊界框(或多邊形)。因此,它不適合創(chuàng)建 分類數(shù)據(jù)庫
點(diǎn)擊 https://vott.z5.web.core.windows.net/ 查看網(wǎng)頁應(yīng)用程序!
DataTurks

DataTurks
DataTurks 是一家成立于 2018 年的初創(chuàng)公司,提供圖片、視頻和文字的標(biāo)注服務(wù)。然而,直到最近它才成為開源軟件(這可能與沃爾瑪在 2019 年 2 月買下了它有關(guān)),此前你都必須向其付費(fèi)。盡管在那之后,他們幾乎沒有對外發(fā)聲,而且似乎已經(jīng)停止了任何開發(fā),但是這個標(biāo)注工具非常棒,而且現(xiàn)在是免費(fèi)的!
當(dāng)你使用它的時候,不用在意任何許可,也不用考慮隨處可見的任何非商業(yè)用途的限制條款。Dataturks 現(xiàn)在免費(fèi)啦,而且你可以使用它的所有功能(我已經(jīng)嘗試和測試過了)!
優(yōu)點(diǎn):
- 說起 CVAT,它是一個在 Docker 中運(yùn)行的 Web 應(yīng)用程序(查看 https://medium.com/@dataturks/dataturks-on-prem-a-fully-self-hosted-data-annotation-solution-86b455bf0634 獲取 Docker 圖像)
- 允許協(xié)作和異步工作:處理相同數(shù)據(jù)集的兩個隊友不會得到相同的圖像進(jìn)行標(biāo)注
- 提出一種用于創(chuàng)建和獲取標(biāo)注任務(wù)的 API
缺點(diǎn):
- DataTurks 似乎已經(jīng)停止了其產(chǎn)品的開發(fā)
- UX 還可以,但是一些小小的調(diào)整還可以讓它變得更好
- 點(diǎn)擊 https://dataturks.com/projects/Dataturks 查看在線演示!
自定義最好的開源圖像標(biāo)注工具
Make-Sense

MakeSense.ai
Make-sense 在 2019 年 6 月剛剛發(fā)布,并且已經(jīng)擁有了令人難以置信的用戶體驗。開始啟動打標(biāo)從來沒有這么快!進(jìn)入網(wǎng)站,拖放你的圖片,即可開始標(biāo)注。
優(yōu)點(diǎn):
- 快速,高效,但最重要的是,簡單!
- 很酷的用戶體驗
- 至于你上傳的圖片的隱私問題,不要擔(dān)心,因為他們說:“【我們】不會存儲你的圖片,因為我們不會把它們發(fā)送到任何地方。”
缺點(diǎn):
- 不提供任何項目管理功能
- 也不提供任何 API
點(diǎn)擊 https://www.makesense.ai/ 開始打標(biāo)!
我希望這篇文章能夠幫助你選擇一個適合你需要的打標(biāo)工具,如果你找到了更好的工具,請盡管在評論區(qū)告訴我們!
P.S. 以下是其他一些工具的簡短列表,這些工具盡管我沒有提到,但是都很酷。
- VGG VIA,一個非常容易使用的標(biāo)注器,其由牛津機(jī)器人實驗室開發(fā)。它被編碼在單個的 html/js 文件里,所以它很容易進(jìn)行開發(fā)!
- LabelMe,由麻省理工學(xué)院開發(fā)的。在 這里 可以看到一個在線版本,或者在 這里 可以運(yùn)行它。
- Coco-Annotator 似乎功能很齊全,但它是最近才出現(xiàn)的(用戶身份驗證系統(tǒng)、API 接入點(diǎn))。查看 這里 的演示(用戶名:admin 密碼:password)
































