吳恩達(dá)新動(dòng)作：建立新ML資源站，「以數(shù)據(jù)為中心的AI」大本營(yíng)

作者：行早 2022-02-17 14:41:45

吳恩達(dá)教授發(fā)推給大家推薦了一個(gè)新的資源站：Data-centric AI（DCAI）。

本文經(jīng)AI新媒體量子位（公眾號(hào)ID:QbitAI）授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請(qǐng)聯(lián)系出處。

很高興給大家介紹我們建立的一個(gè)新資源站Data-centric AI，這里有許多專家的文章和NeurIPS DCAI研討會(huì)的交流談話，來(lái)看看吧~

這個(gè)DCAI是什么來(lái)頭？

它代表了最近AI從“以模型為中心”到“以數(shù)據(jù)為中心”的轉(zhuǎn)變。

在過(guò)去幾十年間，大多數(shù)的AI研究都集中在“code”上面，也就是提升模型或者算法。

不過(guò)目前在很多應(yīng)用上，“code”已經(jīng)基本上能夠解決問(wèn)題了，花時(shí)間改善一下數(shù)據(jù)往往會(huì)更有用。

然而現(xiàn)在構(gòu)建、使用數(shù)據(jù)集這部分工作通常還是人工來(lái)做，費(fèi)時(shí)費(fèi)力，成本高昂，缺少高效的數(shù)據(jù)工具。

DCAI的出現(xiàn)就是為了解決這個(gè)問(wèn)題。

這個(gè)新的資源站匯總了在數(shù)據(jù)這塊最新的進(jìn)展和最好的實(shí)踐，目前共包含兩大塊內(nèi)容：交流話題和NeurIPS研討會(huì)資源。

其中交流話題現(xiàn)在共有3個(gè)：Labeling and Crowdsourcing（眾包數(shù)據(jù)標(biāo)注）、Data Augmentation（數(shù)據(jù)增強(qiáng)）、Data in Deployment（數(shù)據(jù)部署）。

分別由斯坦福計(jì)算機(jī)科學(xué)副教授Michael Bernstein、加州理工教授Anima Anandkumar和Google Brain研究負(fù)責(zé)人D. Sculley主導(dǎo)討論。

在每個(gè)話題下面都會(huì)有教授進(jìn)行介紹、舉例、提出解決方法。

例如在數(shù)據(jù)增強(qiáng)這個(gè)話題下，Anima教授就從數(shù)據(jù)增強(qiáng)要解決的問(wèn)題開始，給出解決方法，并介紹最新的研究成果：

在訓(xùn)練數(shù)據(jù)中僅使用邊框標(biāo)簽來(lái)訓(xùn)練模型進(jìn)行實(shí)例分割：

并在最后給出相關(guān)的資源以供參考。

DCAI包含的第二部分內(nèi)容就是NeurIPS研討會(huì)資源。

這里有各路大神在去年NeurIPS研討會(huì)上的發(fā)言和談話。

每個(gè)視頻還都配有同步的PPT：

除了這兩部分資源之外，你還可以成為DCAI社區(qū)的貢獻(xiàn)者，在這里分享DCAI的研究項(xiàng)目、工具或者提議等內(nèi)容：

自吳教授推文發(fā)布后，很快就收到了網(wǎng)友的熱情回應(yīng)。大伙紛紛希望加入社區(qū)，還有人表示會(huì)很快分享自己的成果：

如果有同學(xué)對(duì)“以數(shù)據(jù)為中心”的AI內(nèi)容感興趣，就趕快用起來(lái)吧~

DCAI地址：

https://datacentricai.org/

責(zé)任編輯：張燕妮來(lái)源：量子位