數(shù)據(jù)科學(xué)VS統(tǒng)計學(xué):你屬于哪種職業(yè),要不要轉(zhuǎn)行?
本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)。
21世紀初,也許數(shù)據(jù)科學(xué)家的頭銜在任何行業(yè)都不常見,但它迅速成為近幾年職業(yè)趨勢中爆發(fā)的熱詞。我們真的是第一次看到這樣的工作嗎?事實上,早在數(shù)據(jù)科學(xué)出現(xiàn)之前,我們已經(jīng)有了一個非常相似的職業(yè),現(xiàn)在也依然存在著——那就是統(tǒng)計學(xué)家。
兩者的區(qū)別是什么?它們有什么相似之處?本文就將來回答這些問題。
數(shù)據(jù)科學(xué)家
這個角色最近變得非常受歡迎是有原因的。當(dāng)你需要為公司招聘一位數(shù)據(jù)科學(xué)家時,你正在將多種角色融合到一個職位中。
成為一名數(shù)據(jù)科學(xué)家所需要的技能令人望而生畏,這個職業(yè)通常是跨職能的——需要同時掌握業(yè)務(wù)的技術(shù)技能和軟技能。僅僅懂得編碼技術(shù)還不夠,還要知道如何與非技術(shù)性的利益相關(guān)者和公司領(lǐng)導(dǎo)一起解決重要的業(yè)務(wù)問題。有一些直接的技能是數(shù)據(jù)科學(xué)家需要知道的,但是有一些與職業(yè)不相稱的技能,也必須在一些情況下通過一段時間的實踐來掌握。
這些技能技術(shù)含量較低,通常包括但不限于:形成一個問題,形成一個問題陳述,為回答該問題創(chuàng)建一個過程,向利益相關(guān)者展示發(fā)現(xiàn)并解釋結(jié)果。
數(shù)據(jù)科學(xué)所需的一些關(guān)鍵技能:機器學(xué)習(xí)庫、Python、R編程、SQL……
統(tǒng)計學(xué)家
統(tǒng)計學(xué)家這一職業(yè)比數(shù)據(jù)科學(xué)家早出現(xiàn)很多年,無數(shù)的行業(yè)都需要這個職位。如果你想在醫(yī)療保健、安全、學(xué)術(shù)、市場營銷、經(jīng)濟等多個領(lǐng)域工作,你一定要成為該領(lǐng)域的統(tǒng)計學(xué)家。
統(tǒng)計學(xué)家的主要職責(zé)包括但不限于:實驗設(shè)計、開展研究、估算和開展調(diào)查。你還需要有強大的數(shù)學(xué)和實驗設(shè)計背景。這個職位還需要軟技能,包括向利益相關(guān)者報告你的調(diào)查結(jié)果,以及根據(jù)這些統(tǒng)計結(jié)果所需要的相應(yīng)改變。
統(tǒng)計所需的一些關(guān)鍵技能:SAS編程、實驗、設(shè)計、數(shù)學(xué)……
相似性
如你所見,即使這兩個職業(yè)所需的一些技能并不完全相同,但有一些是相似的。以下是這兩個職業(yè)的一些相似之處:
- 對數(shù)學(xué)的理解力
- 調(diào)查問題
- 探索性數(shù)據(jù)分析
- 趨勢分析
- 預(yù)見性
- 可視化
- 向非技術(shù)用戶報告調(diào)查結(jié)果
當(dāng)然不止于此,這些僅僅是我在自己所了解到的職業(yè)以及各自的工作描述中遇到的一些相似之處。統(tǒng)計是否會隨著時間的推移變得更像數(shù)據(jù)科學(xué),還是反過來——或者它們是否會相互分化,這是一個有趣的問題。
差異性
現(xiàn)在,我們來討論一下這些職業(yè)之間的區(qū)別。首先,統(tǒng)計學(xué)家比數(shù)據(jù)科學(xué)家存在的時間要長得多,這意味著差異可能存在于新技術(shù)中。
統(tǒng)計主要包括:
- 一次性報告
- 使用SAS編程
- 關(guān)注線性回歸診斷圖
- 重視顯著性檢驗
- 注重t檢驗、方差分析和多元方差分析等
- 收集更多的人工數(shù)據(jù)(有時來自調(diào)查)
- 通常情況下,統(tǒng)計學(xué)家常見于醫(yī)療保健和經(jīng)濟領(lǐng)域
- 更學(xué)術(shù)化
數(shù)據(jù)科學(xué)主要包括:
- 自動化
- 使用SQL查詢收集數(shù)據(jù)
- 機器學(xué)習(xí)庫,如 sklearn和TensorFlow
- 使用Python和R編程語言
- 部署自動模型(用于應(yīng)用程序)
- 重視軟件工程實踐
以上描述的差異也可以從工作描述和個人經(jīng)驗中感受到。由于公司不同,你可能會發(fā)現(xiàn)這些技能有重疊的部分。
綜上所述,統(tǒng)計學(xué)家和數(shù)據(jù)科學(xué)家,數(shù)據(jù)科學(xué)研究和統(tǒng)計研究的區(qū)別是什么?可以用一個詞來概括——新技術(shù)帶來的自動化。
其中的一個職業(yè)比另一個更重要嗎?不,它們都是重要的角色。如果你想專注于顯著性、檢驗、實驗設(shè)計、正態(tài)分布和診斷性繪圖,那么去當(dāng)統(tǒng)計學(xué)家吧。如果你想練習(xí)更多的軟件工程,比如編碼和機器學(xué)習(xí)模型的自動化,就去當(dāng)數(shù)據(jù)科學(xué)家吧。你會發(fā)現(xiàn),這兩個職業(yè)的很多工作描述互相重疊,但很少發(fā)現(xiàn)統(tǒng)計學(xué)家需要使用機器學(xué)習(xí)庫。
希望這篇文章對正在考慮開始新職業(yè)或轉(zhuǎn)行的你有幫助。






















