大數據失敗案例之七宗罪
要實現大數據分析項目的***實踐并非易事。正因如此,Gartner研究總監Svetlana Sicular題為“大數據7大失敗案例”的報告吸引了思科工程師Karen Liu的注意。
“我們正處于開始階段,想了解下其他人正在做什么,有哪些成功案例。”Liu說:“而所有的失敗案例,也是我們必須學習并加以警惕的。”
很多人有著和Liu一樣的想法。Family Dollar Stores Inc.(美國知名折扣零售商,總部位于北卡羅來納的夏洛特,最近剛被另一家折扣連鎖店Dollar Tree Inc.收購)的企業架構總監David Kropman也基于同樣原因參加了這次會議。“我們剛開始大數據的探索,想了解正確的應用場景,同時防止自己重蹈其他公司的覆轍。”Kropman表示。
Sicular的報告給出了足夠明晰的信息,可以讓Kropman和Liu回去分享給各自的團隊,避免犯同樣的錯誤。Kropman說:“大數據項目的失敗不單單是因為某個原因,而是由多個因素一起導致的。”
對于大數據項目的失敗,Sicular總結出7個主要原因,并劃分為三個大類:戰略、技能和分析。
戰略方面的失敗
1.組織惰性。某家旅游公司系統通過web日志數據的挖掘來提升客戶洞察。結果證明,用戶在瀏覽網站之后,隨后的消費行為模式與管理層所認為的不一致。當團隊匯報此事時,管理層認為不值一提。但是,該團隊并沒有放棄,并通過嚴密的A/B測試,回擊了管理層的輕視。
這個案例的最終結果,不是每個CIO都能期盼的。但是,有一點是可以確定的:做好和管理層打交道的準備,讓他們充分理解大數據是什么以及相應的價值。要說對CIO們有什么建議的話,Sicular認為,不要在失敗的項目上過多糾纏,重新啟動一個新的。
2.選擇了錯誤的應用場景。一家保險公司想了解日常習慣和購買生命保險意愿之間的關聯性。由于隨后覺得習慣太過于寬泛,該公司將調查范疇限定到是否吸煙上。但是,工作仍然沒有實質進展。“不到半年,他們就終止了整個項目,因為一直未能發現任何有價值的信息。”Sicular說。
這個項目的失敗是由于問題的復雜性。在抽煙與否之間,該公司沒有注意到還有大片灰色地帶:很多人是先抽煙而后又戒煙了。在將問題簡單化動機的驅動下,這個部分被忽略了。“他們不是醫療健康方面的專家。”Sicular分析到。為此,她提醒聽眾要對應用案例排定優先級,先易后難,循序漸進。
技術層面的失敗
3.無法應對料想之外的問題。一家全球性公司的大數據團隊發現了很多深刻的洞察,并且計劃通過云讓全公司共享。“為此,他們啟動了一個云中的項目。”Sicular說。
Sicular認為,這樣做是有風險的 – 一個在受控的定制環境中獲得成功的項目,未必能適應于生產環境中。“這個團隊低估了效率方面的損耗。由于網絡擁塞的問題,無法滿足全球各個分支順暢提交數據運行分析的需求。”Sicular分析說。
該公司應該仔細思考下如何支撐大數據項目,梳理所需的技能并協調各IT分支的力量進行支持。“由于網絡、安全或基礎設施的問題,已經有太多的大數據項目栽了跟頭。你必須事先想清楚,需要哪些方面的人手加入到項目中來。”Sicular表示。
4.缺乏大數據分析技能。一家零售公司的***執行官不認同亞馬遜規模化、扁平化的服務模式,因此讓CIO構建一個客戶推薦引擎。項目最初的規劃是半年為期,但是團隊很快認識到諸如協同過濾(collaborative filtering)之類的概念無法實現。為此,一個團隊成員提出做一個“假的推薦引擎”,把床單作為唯一的推薦產品。
這個假引擎的工作邏輯是:買攪拌機的人會買床單,買野營書籍的人會買床單,買書的人會買床單。就是如此,床單是唯一的、默認的推薦品。
盡管可笑,這個主意其實并不壞,默認的推薦也能給企業帶來銷售上的提升。但是,由于大數據相關技能的缺失,真正意義上的引擎未能實現。Sicular表示,這是需要很長時間探索和積累的。盡管過程曲折而漫長,不過不用擔心,大數據的推進是有明確階段劃分的,對CIO們來說可以有針對性地加以應對。這些階段包括:
管理高層表示支持大數據戰略規劃形成進行各種測試和驗證流程上線并不斷完善(Sicular稱之為戰術階段)投資回報開始顯現,企業真正體會到大數據的價值(Sicular稱之為戰略階段)技術領先的企業開始構建真正的數據產品(Sicular稱之為轉型階段)
數據分析本身的失敗
5.對數據過于相信。2008年,Google***次開始預測流感就取得了很好的效果,比美國疾病預防控制中心(Centers for Disease Control and Prevention)提前兩禮拜預測到了流感的爆發。但是,幾年之后,Google的預測比實際情況(由防控中心根據全美就診數據推算得出)高出了50%。“媒體過于渲染了Google的成功,出于好奇目的而搜索相關關鍵詞的人越來越多,從而導致了數據的扭曲。”Sicular說。
因此,CIO在拿到數據之后,應該從不同角度進行加以審視,確保對數據的來源、驗證方法、控制手段以及是否有臟數據等問題都能胸有成竹。
6.提出了錯誤的問題。一家全球領先的汽車制造商決定開展一個情感分析項目,為期6個月,耗資1千萬美元。項目結束之后,該廠商將結果分享給經銷商并試圖改變銷售模式。然后,所得出的結果最終被證明是錯誤的。
“項目團隊沒有花足夠的時間去了解經銷商所面臨的問題或業務建議,從而導致相關的分析毫無價值。”Sicular說。
對此,Sicular提到了決策分析中的“滿意度(satisficing)”模型 -- 即放棄對***結果的偏執,基于具體的情境,找到足夠好的解決方案。“耐下性子,去真正理解問題以及企業可能從中獲得的收益。”Sicular解釋說。
7.應用了錯誤的模型。為了尋找可供借鑒的案例,一位在銀行工作的博士研究了其他行業的大數據成功應用。最終,他的目光落在了電信行業的客戶流失預測模型上。
該銀行從電信業聘請了一位專家,后者也很快構建了評估用戶是否即將流失的模型。Sicular表示,當時已進入評測驗證的***階段,模型很快就將上線,而銀行也開始準備給那些被認為即將流失的客戶發出信件加以挽留。但是,為了保險起見,一位內部專家被要求對模型進行評估。
這位銀行業專家很快發現了令人驚奇的事情:不錯,那些客戶的確即將流失,但并不是因為對銀行的服務不滿意。他們之所以轉移財產(有時是悄無聲息的),是因為感情問題 -- 正在為離婚做準備。
了解模型的適用性、數據抽象的級別以及模型中隱含的細微差別,這些都是非常具有挑戰性的。“這是大數據分析的關鍵之一。”Sicular表示。為了大數據項目的成功,CIO還必須從道德、倫理和心理的角度進行思考。





















