吳恩達(dá)新動(dòng)作:建立新ML資源站,「以數(shù)據(jù)為中心的AI」大本營(yíng)
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
很高興給大家介紹我們建立的一個(gè)新資源站Data-centric AI,這里有許多專家的文章和NeurIPS DCAI研討會(huì)的交流談話,來(lái)看看吧~

這個(gè)DCAI是什么來(lái)頭?
它代表了最近AI從“以模型為中心”到“以數(shù)據(jù)為中心”的轉(zhuǎn)變。
在過(guò)去幾十年間,大多數(shù)的AI研究都集中在“code”上面,也就是提升模型或者算法。
不過(guò)目前在很多應(yīng)用上,“code”已經(jīng)基本上能夠解決問(wèn)題了,花時(shí)間改善一下數(shù)據(jù)往往會(huì)更有用。

然而現(xiàn)在構(gòu)建、使用數(shù)據(jù)集這部分工作通常還是人工來(lái)做,費(fèi)時(shí)費(fèi)力,成本高昂,缺少高效的數(shù)據(jù)工具。
DCAI的出現(xiàn)就是為了解決這個(gè)問(wèn)題。
這個(gè)新的資源站匯總了在數(shù)據(jù)這塊最新的進(jìn)展和最好的實(shí)踐,目前共包含兩大塊內(nèi)容:交流話題和NeurIPS研討會(huì)資源。
其中交流話題現(xiàn)在共有3個(gè):Labeling and Crowdsourcing(眾包數(shù)據(jù)標(biāo)注)、Data Augmentation(數(shù)據(jù)增強(qiáng))、Data in Deployment(數(shù)據(jù)部署)。
分別由斯坦福計(jì)算機(jī)科學(xué)副教授Michael Bernstein、加州理工教授Anima Anandkumar和Google Brain研究負(fù)責(zé)人D. Sculley主導(dǎo)討論。
在每個(gè)話題下面都會(huì)有教授進(jìn)行介紹、舉例、提出解決方法。
例如在數(shù)據(jù)增強(qiáng)這個(gè)話題下,Anima教授就從數(shù)據(jù)增強(qiáng)要解決的問(wèn)題開始,給出解決方法,并介紹最新的研究成果:
在訓(xùn)練數(shù)據(jù)中僅使用邊框標(biāo)簽來(lái)訓(xùn)練模型進(jìn)行實(shí)例分割:


并在最后給出相關(guān)的資源以供參考。

DCAI包含的第二部分內(nèi)容就是NeurIPS研討會(huì)資源。
這里有各路大神在去年NeurIPS研討會(huì)上的發(fā)言和談話。

每個(gè)視頻還都配有同步的PPT:

除了這兩部分資源之外,你還可以成為DCAI社區(qū)的貢獻(xiàn)者,在這里分享DCAI的研究項(xiàng)目、工具或者提議等內(nèi)容:

自吳教授推文發(fā)布后,很快就收到了網(wǎng)友的熱情回應(yīng)。大伙紛紛希望加入社區(qū),還有人表示會(huì)很快分享自己的成果:

如果有同學(xué)對(duì)“以數(shù)據(jù)為中心”的AI內(nèi)容感興趣,就趕快用起來(lái)吧~
DCAI地址:
https://datacentricai.org/



























