掌握核心競爭力:五大數(shù)據(jù)科學(xué)類資格證書
本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)。
在數(shù)據(jù)科學(xué)職業(yè)生涯中,可能會有多種原因會讓你想要考取資格證書。一些證書較為直接,例如數(shù)據(jù)科學(xué)資格證書,另一些則具有更為間接的影響,例如Python編程能力資格證書。討論這一話題的文章已經(jīng)很多了,但筆者仍想就一些獨(dú)特且常用的程序、平臺及其相應(yīng)資格證書來聊一聊。
早在疫情席卷世界之前,面授教學(xué)模式的流行程度就已經(jīng)開始逐漸降低了,線上學(xué)習(xí)不再可有可無,而是成為數(shù)據(jù)科學(xué)家或者數(shù)據(jù)科學(xué)求職者成功的必要條件。線上項(xiàng)目和資格證書在過去曾飽受質(zhì)疑,如今則受到雇主的青睞,成為了衡量求職者技術(shù)上進(jìn)心的一大指標(biāo)。
其中一些證書可免費(fèi)考取,另一些則需要少量費(fèi)用,但不失為物有所值的投資,這取決于個(gè)人在數(shù)據(jù)科學(xué)領(lǐng)域的術(shù)業(yè)專攻和發(fā)展方向。
筆者已在南衛(wèi)理公會大學(xué)(SouthernMethodist University)取得了數(shù)據(jù)科學(xué)教育的理學(xué)碩士學(xué)位。即使它是遠(yuǎn)程在線碩士學(xué)位,雇主們也充分認(rèn)可其有效性。一些招聘經(jīng)理在筆者出示數(shù)據(jù)科學(xué)資格證書及非傳統(tǒng)教育形式的證書時(shí)驚嘆不已,贊賞有加。
筆者涉獵過多種學(xué)習(xí)形式,并且具有專業(yè)數(shù)據(jù)科學(xué)家的經(jīng)驗(yàn),因此大體了解雇主期望的工作技能,也十分熟悉真正有助于日常工作的一些工具與平臺。
下文是對數(shù)據(jù)科學(xué)工作者職業(yè)生涯有所助益的五大資格證書的介紹。
TensorFlow

TensorFlow是一個(gè)開源平臺,為數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師所廣泛使用,內(nèi)含功能強(qiáng)大的庫來推動機(jī)器學(xué)習(xí)的建模過程。使用TensorFlow的典型項(xiàng)目包括:
- 神經(jīng)網(wǎng)絡(luò)(neural networks)
- 生成對抗網(wǎng)絡(luò)(generativeadversarial networks)
- 圖像分類(image classification)
- 文本分類(text classification)
- 回歸(regression)
- 提升樹(boosted trees)
- 時(shí)間序列預(yù)測(time seriesforecasting)
TensorFlow資格認(rèn)證的正式名稱為“TensorFlow 開發(fā)者認(rèn)證計(jì)劃(TensorFlowDeveloper Certificate program)”。該認(rèn)證計(jì)劃要求掌握使用計(jì)算機(jī)視覺、卷積神經(jīng)網(wǎng)絡(luò)和自然語言處理(NLP)。該測試收費(fèi)100美元,并鼓勵(lì)學(xué)員向現(xiàn)雇主爭取教育津貼。
該證書對于專攻機(jī)器學(xué)習(xí)和深度學(xué)習(xí)兩者或其一的人來說尤為有益。這一認(rèn)證本身并非課程培訓(xùn),而僅僅是認(rèn)證受試者的TensorFlow學(xué)習(xí)成果的手段。不過,主辦方的確推薦了Coursera上的“TensorFlow 實(shí)戰(zhàn)專項(xiàng)課程(TensorFlowin Practice Specialization )”,其專項(xiàng)課程最大的優(yōu)點(diǎn)是涵蓋了TensorFlow的全部內(nèi)容,且不收取任何費(fèi)用。
那些相信報(bào)名費(fèi)物有所值,或是可以通過津貼方案得到報(bào)銷的人,更適合參加此測試。以下是一些關(guān)于該專項(xiàng)課程的數(shù)據(jù):
- 40%的人在課程結(jié)束后開啟了新的職業(yè)生涯
- 12%的人獲得了加薪或升職
如上所述,該認(rèn)證及其相應(yīng)資格證書依托一個(gè)常用且受眾廣泛的平臺,可有效展示個(gè)人技能,證明自身競爭力。
SAS

SAS可能是最數(shù)據(jù)科學(xué)家不常用的平臺之一了,但從另一方面看,這也意味著SAS的使用者擁有獨(dú)一無二的技能,能做到一些大多數(shù)數(shù)據(jù)科學(xué)家力所不能及的事情。
Python和R是數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師都使用的典型編程語言,而SAS則是另一種語言。它與SQL類似,都關(guān)注數(shù)據(jù)本身。筆者在攻讀理學(xué)碩士學(xué)位的初期,便首先使用了SAS來學(xué)習(xí)數(shù)據(jù)科學(xué)。
SAS的全稱是數(shù)據(jù)分析系統(tǒng)(Statistical Analysis System)。數(shù)據(jù)科學(xué)家有時(shí)會感覺身陷于機(jī)器學(xué)習(xí)的黑箱之中,學(xué)習(xí)SAS則能細(xì)化對數(shù)據(jù)的理解。在數(shù)據(jù)科學(xué)的面試中,如果招聘經(jīng)理問到無法用常見Python數(shù)據(jù)科學(xué)庫來解答的問題,此時(shí)對數(shù)據(jù)的細(xì)化理解就大有幫助。
SAS的顯著優(yōu)勢在于用Q-Q圖、直方圖和殘差圖來進(jìn)行正態(tài)分布檢驗(yàn),并進(jìn)行ANOVA和MANOVA(方差分析和多元方差分析)等測試。
該資格證書的正式名稱為“SAS程序員專業(yè)證書(SAS Programmer ProfessionalCertificate)”。該證書也可由Coursera發(fā)放,你可以免費(fèi)報(bào)名并付費(fèi)收取證書。不過盡管這些資格認(rèn)證和課程通常免費(fèi),考試或?qū)嶓w證書一般會收取費(fèi)用,但你仍可免費(fèi)學(xué)習(xí)大多或全部的課程。
你可從中學(xué)到SAS編程語言的技巧,探索不同的數(shù)據(jù)類型。這一證書及其課程對職業(yè)生涯有著深刻影響:
- 21%的人在課程結(jié)束后開啟了新的職業(yè)生涯
- 50%的人獲得加薪或升職
IBM Data Science — Python
上述的證書及其相應(yīng)課程主要涉及數(shù)據(jù)科學(xué)的某些特定方面,這一證書則涵蓋了數(shù)據(jù)科學(xué)的大部分整體流程。該資格證書的正式名稱為“IBM 數(shù)據(jù)科學(xué)專業(yè)證書(IBM Data Science ProfessionalCertificate )”。與 SAS證書類似,這一證書也可由Coursera發(fā)放。
該證書涵蓋內(nèi)容更為廣泛,下列是這一專業(yè)資格認(rèn)證所對應(yīng)的九個(gè)課程:
- 什么是數(shù)據(jù)科學(xué)?
- 數(shù)據(jù)科學(xué)工具(Jupyter Notebook、RStudio IDE等)
- 數(shù)據(jù)科學(xué)方法論(計(jì)算能力、部署等)
- 數(shù)據(jù)科學(xué)和AI中的Python(類型、變量、類、模塊等)
- 數(shù)據(jù)科學(xué)中的數(shù)據(jù)庫和SQL(結(jié)構(gòu)化查詢語言等)
- 使用Python進(jìn)行數(shù)據(jù)分析(Pandas、Numpy、Scipy等)
- 使用Python進(jìn)行數(shù)據(jù)可視化(Matplotlib、Seaborn等)
- 使用Python進(jìn)行機(jī)器學(xué)習(xí)(分類、聚類等)
- 應(yīng)用數(shù)據(jù)科學(xué)頂點(diǎn)課程(RESTfulAPI調(diào)用、Folium等)
如上所示,該資格認(rèn)證將近涵蓋了數(shù)據(jù)科學(xué)甚至是機(jī)器學(xué)習(xí)的方方面面。結(jié)合個(gè)人目標(biāo)和申請意愿,這一課程幾乎可以替代學(xué)位,有下列數(shù)據(jù)為證:
- 46%的人在課程結(jié)束后開啟了新的職業(yè)生涯
- 19%的人獲得加薪或升職
這些驚人數(shù)據(jù)使之成為了最有幫助的課程與資格證書之一。近100萬人瀏覽了該證書主頁,足以說明這一課程深受歡迎。筆者推薦那些想要建立數(shù)據(jù)科學(xué)整體觀的人參與這一課程。
Tableau

這一證書或許有些爭議,但仍值得認(rèn)真考慮。Tableau是一個(gè)用來描述指標(biāo)和數(shù)據(jù)的可視化工具,或許更接近數(shù)據(jù)分析或商業(yè)技術(shù)的范疇,但它仍能以多種方式為數(shù)據(jù)科學(xué)家所用。其中一些用途包括:
- 可視化呈現(xiàn)模型提取數(shù)據(jù)
- 探索性數(shù)據(jù)分析
- 變化與趨勢分析
- 為數(shù)據(jù)科學(xué)模型指標(biāo)創(chuàng)建出色的可視化
數(shù)據(jù)科學(xué)家通常需要展示自己的發(fā)現(xiàn),Tableau就是幫助數(shù)據(jù)科學(xué)家描述模型數(shù)據(jù)和指標(biāo)的簡便工具,這樣利益相關(guān)者們便可以隨時(shí)看到商業(yè)問題的處理情況,這就是一個(gè)應(yīng)用實(shí)例。
這一資格認(rèn)證有若干種,筆者個(gè)人重點(diǎn)推薦其中的“Tableau Desktop Specialist”。該認(rèn)證注重Tableau基礎(chǔ)知識,數(shù)據(jù)科學(xué)家需要擅長解決問題,在了解基礎(chǔ)之后,才能逐步學(xué)習(xí)更為復(fù)雜的功能。
該認(rèn)證收費(fèi)300美元。考試內(nèi)容包括選擇題、多選題和實(shí)踐題。考試為自動評分,共有30道題目,時(shí)長為60分鐘。Tableau也提供了多個(gè)課程以幫助你通過考試。
因?yàn)橐恍┱n程和資格認(rèn)證更注重直接的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí),該認(rèn)證意味著你掌握了用Tableau來呈現(xiàn)數(shù)據(jù)科學(xué)研究成果的能力,這將會幫助你在眾多數(shù)據(jù)科學(xué)家中脫穎而出。
Google Machine Learning

圖源:whizlabs
最后一個(gè)資格認(rèn)證來自谷歌,它也許是難度最大的一個(gè),更適合機(jī)器學(xué)習(xí)工程師。對于主攻模型的數(shù)據(jù)科學(xué)家來說,該認(rèn)證有助于你在部署和工程方面進(jìn)階。這一考試將主要考察以下復(fù)雜概念:
- 擬定機(jī)器學(xué)習(xí)問題(Frame ML problems)
- 開發(fā)機(jī)器學(xué)習(xí)模型(Develop ML models)
- 構(gòu)建機(jī)器學(xué)習(xí)解決方案(Architect MLsolutions)
- 自動化與協(xié)調(diào)機(jī)器學(xué)習(xí)工作流(Automate &orchestrate ML pipelines)
- 數(shù)據(jù)準(zhǔn)備與處理(Prepare and processdata)
- 監(jiān)控、優(yōu)化與維護(hù)機(jī)器學(xué)習(xí)解決方案(Monitor, optimize,and maintain ML solutions)
該認(rèn)證的全稱為“專業(yè)機(jī)器學(xué)習(xí)工程師BETA(Professional Machine Learning EngineerBETA)”。通過Beta版考試后,可獲取谷歌云認(rèn)證(Google Cloud Certified),能節(jié)約40%的開銷,并且還可獲得專屬谷歌定制服裝。
該認(rèn)證較為復(fù)雜,涵蓋了困難且極為重要的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)特性。考試的重點(diǎn)在于一些極為重要的概念的理解,這些概念對所有數(shù)據(jù)科學(xué)家或機(jī)器學(xué)習(xí)工程師都有益處。下列是其中一些重點(diǎn):
- 將商業(yè)問題轉(zhuǎn)化為機(jī)器學(xué)習(xí)應(yīng)用案例,從而擬定機(jī)器學(xué)習(xí)問題
- 構(gòu)建具有最佳軟件開發(fā)生命周期(SDLC)機(jī)器學(xué)習(xí)解決方案
- 運(yùn)用設(shè)計(jì)的機(jī)器學(xué)習(xí)工作流進(jìn)行數(shù)據(jù)準(zhǔn)備與處理
- 機(jī)器學(xué)習(xí)模型開發(fā)的產(chǎn)品化
- 采用持續(xù)集成/持續(xù)部署(CI/CD)測試與部署以進(jìn)行機(jī)器學(xué)習(xí)工作流的自動化與協(xié)調(diào)化
- 通過性能調(diào)整和再訓(xùn)練識別來進(jìn)行機(jī)器學(xué)習(xí)解決方案的監(jiān)控、優(yōu)化和維護(hù)
圖源:unsplash
成為最頂尖的數(shù)據(jù)科學(xué)家并不一定需要參與上述全部課程和認(rèn)證,但它們皆能以不同方式幫助你走向成功。世界上有不可計(jì)數(shù)的課程與資格認(rèn)證,最重要的不是知道它們而是通過它,努力成為更優(yōu)秀的數(shù)據(jù)科學(xué)家。
如果能夠取得TensorFlow、SAS、IBM Data Science、Tableau和Google Machine Learning的認(rèn)證,你一定會給現(xiàn)在和將來的雇主留下深刻印象。這些證書不僅能令你在面試當(dāng)中脫穎而出,也會幫助你在數(shù)據(jù)科學(xué)職業(yè)生涯中更上一層樓。學(xué)習(xí)是永無止境的,參與課程和取得認(rèn)證也不例外。
























