精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一文讀懂大數據:Hadoop,大數據技術及相關應用

數據庫 Hadoop
你想了解大數據,卻對生澀的術語毫不知情?你想了解大數據的市場和應用,卻又沒有好的案例和解說?

這是一本小書而不是一篇文章,因為它詳實細致的讓你從一個完全不了解大數據技術及相關應用的門外漢,變成一個熟知其概念和意義的“內行人”,所以它很棒!

主要內容

·1來自Wikibon社區的大數據宣言
·2數據處理與分析:傳統方式
·3大數據性質的變化
·4大數據處理和分析的新方法

4.1Hadoop
4.2NoSQL
4.3大規模并行分析數據庫

·5大數據方法的互補
·6大數據供應商發展狀況
·7大數據:實際使用案例
·8大數據技能差距
·9大數據:企業和供應商的下一步動作

來自Wikibon社區的大數據宣言

為公司提供有效的業務分析工具和技術是首席信息官的首要任務。有效的業務分析(從基本報告到高級的數據挖掘和預測分析)使得數據分析人員和業務人員都可以從數據中獲得見解,當這些見解轉化為行動,會給公司帶來更高的效率和盈利能力。

所有業務分析都是基于數據的。傳統意義上,這意味著企業自己創建和存儲的結構化數據,如CRM系統中的客戶數據,ERP系統中的運營數據,以及會計數據庫中的財務數據。得益于社交媒體和網絡服務(如Facebook,Twitter),數據傳感器以及網絡設備,機器和人類產生的網上交易,以及其他來源的非結構化和半結構化的數據的普及,企業現有數據的體積和類型以及為追求最大商業價值而產生的近實時分析的需求正在迅速增加。我們稱這些為大數據。

傳統的數據管理和業務分析工具及技術都面臨大數據的壓力,與此同時幫助企業獲得來自大數據分析見解的新方法不斷涌現。這些新方法采取一種完全不同于傳統工具和技術的方式進行數據處理、分析和應用。這些新方法包括開源框架Hadoop,NoSQL數據庫(如Cassandra和Accumulo)以及大規模并行分析數據庫(如EMC的Greenplum,惠普的Vertica和TeradataASTERData)。這意味著,企業也需要從技術和文化兩個角度重新思考他們對待業務分析的方式。

對于大多數企業而言,這種轉變并不容易,但對于接受轉變并將大數據作為業務分析實踐基石的企業來說,他們會擁有遠遠超過膽小對手的顯著競爭優勢。大數據助力復雜的業務分析可能為企業帶來前所未有的關于客戶行為以及動蕩的市場環境的深入洞察,使得他們能夠更快速的做出數據驅動業務的決策,從而比競爭對手更有效率。

從存儲及支持大數據處理的服務器端技術到為終端用戶帶來鮮活的新見解的前端數據可視化工具,大數據的出現也為硬件、軟件和服務供應商提供了顯著的機會。這些幫助企業過渡到大數據實踐者的供應商,無論是提供增加商業價值的大數據用例,還是發展讓大數據變為現實的技術和服務,都將得到茁壯成長。

大數據是所有行業新的權威的競爭優勢。認為大數據是曇花一現的企業和技術供應商很快就會發現自己需要很辛苦才能跟上那些提前思考的競爭對手的步伐。在我們看來,他們是非常危險的。對于那些理解并擁抱大數據現實的企業,新創新,高靈活性,以及高盈利能力的可能性幾乎是無止境的。

數據處理和分析:傳統方式

傳統上,為了特定分析目的進行的數據處理都是基于相當靜態的藍圖。通過常規的業務流程,企業通過CRM、ERP和財務系統等應用程序,創建基于穩定數據模型的結構化數據。數據集成工具用于從企業應用程序和事務型數據庫中提取、轉換和加載數據到一個臨時區域,在這個臨時區域進行數據質量檢查和數據標準化,數據最終被模式化到整齊的行和表。這種模型化和清洗過的數據被加載到企業級數據倉庫。這個過程會周期性發生,如每天或每周,有時會更頻繁。

大數據

圖1–傳統的數據處理/分析資料來源:Wikibon2011

在傳統數據倉庫中,數據倉庫管理員創建計劃,定期計算倉庫中的標準化數據,并將產生的報告分配到各業務部門。他們還為管理人員創建儀表板和其他功能有限的可視化工具。

同時,業務分析師利用數據分析工具在數據倉庫進行高級分析,或者通常情況下,由于數據量的限制,將樣本數據導入到本地數據庫中。非專業用戶通過前端的商業智能工具(SAP的BusinessObjects和IBM的Cognos)對數據倉庫進行基礎的數據可視化和有限的分析。傳統數據倉庫的數據量很少超過幾TB,因為大容量的數據會占用數據倉庫資源并且降低性能。

大數據性質的變化

Web、移動設備和其他技術的出現導致數據性質的根本性變化。大數據具有重要而獨特的特性,這種特性使得它與“傳統”企業數據區分開來。不再集中化、高度結構化并且易于管理,與以往任何時候相比,現在的數據都是高度分散的、結構松散(如果存在結構的話)并且體積越來越大。

具體來說:

  • ·體積-通過Web、移動設備、IT基礎設施和其他來源產生的企業內部和防火墻外的數據量每年都在成倍增加。

  • ·類型-數據類型的多樣性增加,包括非結構化文本數據以及半結構化數據(如社交媒體數據,基于位置的數據和日志文件數據)。

  • ·速度-得益于數字化交易、移動計算以及互聯網和移動設備的高用戶量,新數據被創建的速度以及實時分析的需求正在增加。

廣義地說,大數據由多個來源產生,包括:

  • ·社交網絡和媒體:目前有超過7億Facebook用戶,2.5億Twitter用戶和1.56億面向公眾開放的博客。Facebook上的每個更新、Tweet和博客上文章的發布及評論都會創建多個新的數據點(包含結構化、半結構化和非結構化的),這些數據點有時被稱為“數據廢氣”。

  • ·移動設備:全球有超過50億正在使用中的移動電話。每次呼叫、短信和即時消息都被記錄為數據。移動設備(尤其是智能手機和平板電腦)讓使用社交媒體等應用程序更容易,而社會媒體的使用會產生大量數據。移動設備也收集和傳送位置數據。

  • ·網上交易:數十億的網上購物、股票交易等每天都在發生,包括無數的自動交易。每次交易都產生了大量數據點,這些數據點會被零售商、銀行、信用卡、信貸機構和其他機構收集。

  • ·網絡設備和傳感器:各種類型的電子設備(包括服務器和其他IT硬件、智能電表和溫度傳感器)都會創建半結構化的日志數據記錄每一個動作。

大數據

圖2–傳統數據v.大數據資料來源:Wikibon2011

從時間或成本效益上看,傳統的數據倉庫等數據管理工具都無法實現大數據的處理和分析工作。也就是說,必須將數據組織成關系表(整齊的行和列數據),傳統的企業級數據倉庫才可以處理。由于需要的時間和人力成本,對海量的非結構化數據應用這種結構是不切實際的。此外,擴展傳統的企業級數據倉庫使其適應潛在的PB級數據需要在新的專用硬件上投資巨額資金。而由于數據加載這一個瓶頸,傳統數據倉庫性能也會受到影響。

因此,需要處理和分析大數據的新方法。

大數據處理和分析的新方法

存在多種方法處理和分析大數據,但多數都有一些共同的特點。即他們利用硬件的優勢,使用擴展的、并行的處理技術,采用非關系型數據存儲處理非結構化和半結構化數據,并對大數據運用高級分析和數據可視化技術,向終端用戶傳達見解。

Wikibon已經確定了三種將會改變業務分析和數據管理市場的大數據方法。

Hadoop

Hadoop是一個處理、存儲和分析海量的分布式、非結構化數據的開源框架。最初由雅虎的Doug Cutting創建,Hadoop的靈感來自于 MapReduce ,MapReduce是谷歌在2000年代初期開發的用于網頁索引的用戶定義函數。它被設計用來處理分布在多個并行節點的PB級和EB級數據。

Hadoop集群運行在廉價的商用硬件上,這樣硬件擴展就不存在資金壓力。Hadoop現在是Apache軟件聯盟(The Apache Software Foundation)的一個項目,數百名貢獻者不斷改進其核心技術。基本概念:與將海量數據限定在一臺機器運行的方式不同,Hadoop將大數據分成多個部分,這樣每個部分都可以被同時處理和分析。

Hadoop如何工作

客戶從日志文件、社交媒體供稿和內部數據存儲等來源獲得非結構化和半結構化數據。它將數據打碎成“部分”,這些“部分”被載入到商用硬件的多個節點組成的文件系統。Hadoop的默認文件存儲系統是Hadoop分布式文件系統。文件系統(如HDFS)善于存儲大量非結構化和半結構化數據,因為它們不需要將數據組織成關系型的行和列。

各“部分”被復制多次,并加載到文件系統。這樣,如果一個節點失效,另一個節點包含失效節點數據的副本。名稱節點充當調解人,負責溝通信息:如哪些節點是可用的,某些數據存儲在集群的什么地方,以及哪些節點失效。

一旦數據被加載到集群中,它就準備好通過MapReduce 框架進行分析。客戶提交一個“匹配”的任務( 通常是用Java編寫的查詢語句)給到一個被稱為作業跟蹤器的節點。該作業跟蹤器引用名稱節點,以確定完成工作需要訪問哪些數據,以及所需的數據在集群的存儲位置。一旦確定,作業跟蹤器向相關節點提交查詢。每個節點同時、并行處理,而非將所有數據集中到一個位置處理。這是Hadoop的一個本質特征。

當每個節點處理完指定的作業,它會存儲結果。客戶通過任務追蹤器啟動“Reduce”任務。匯總map階段存儲在各個節點上的結果數據,獲得原始查詢的“答案”,然后將“答案”加載到集群的另一個節點中。客戶就可以訪問這些可以載入多種分析環境進行分析的結果了。MapReduce 的工作就完成了。

一旦MapReduce 階段完成,數據科學家和其他人就可以使用高級數據分析技巧對處理后的數據進一步分析。也可以對這些數據建模,將數據從Hadoop集群轉移到現有的關系型數據庫、數據倉庫等傳統IT系統進行進一步的分析。

Hadoop

Hadoop的技術組件

Hadoop “棧”由多個組件組成。包括:

  • · Hadoop分布式文件系統(HDFS):所有Hadoop集群的默認存儲層;

  • · 名稱節點:在Hadoop集群中,提供數據存儲位置以及節點失效信息的節點。

  • · 二級節點:名稱節點的備份,它會定期復制和存儲名稱節點的數據,以防名稱節點失效。

  • · 作業跟蹤器:Hadoop集群中發起和協調MapReduce作業或數據處理任務的節點。

  • · 從節點:Hadoop集群的普通節點,從節點存儲數據并且從作業跟蹤器那里獲取數據處理指令。

除了上述以外,Hadoop生態系統還包括許多免費子項目。NoSQL數據存儲系統(如Cassandra和HBase)也被用于存儲Hadoop的MapReduce作業結果。除了​​Java,很多 MapReduce 作業及其他Hadoop的功能都是用Pig語言寫的,Pig是專門針對Hadoop設計的開源語言。Hive最初是由Facebook開發的開源數據倉庫,可以在Hadoop中建立分析模型。

請參閱文章:Hadoop組件和子項目指導手冊:HBase,Sqoop,Flume等:Apache Hadoop定義(http://wikibon.org/wiki/v/HBase,_Sqoop,_Flume_and_More:_Apache_Hadoop_Defined)

Hadoop:優點和缺點

Hadoop的主要好處是,它可以讓企業以節省成本并高效的方式處理和分析大量的非結構化和半結構化數據,而這類數據迄今還沒有其他處理方式。因為Hadoop集群可以擴展到PB級甚至EB級數據,企業不再必須依賴于樣本數據集,而可以處理和分析所有相關數據。數據科學家可以采用迭代的方法進行分析,不斷改進和測試查詢語句,從而發現以前未知的見解。使用Hadoop的成本也很廉價。開發者可以免費下載Apache的Hadoop 分布式平臺,并且在不到一天的時間內開始體驗Hadoop。

Hadoop及其無數組件的不足之處是,他們還不成熟,仍處于發展階段。就像所有新的、原始的技術一樣,實施和管理Hadoop集群,對大量非結構化數據進行高級分析,都需要大量的專業知識、技能和培訓。不幸的是,目前Hadoop開發者和數據科學家的缺乏,使得眾多企業維持復雜的Hadoop集群并利用其優勢變得很不現實。此外,由于Hadoop的眾多組件都是通過技術社區得到改善,并且新的組件不斷被創建,因此作為不成熟的開源技術,也存在失敗的風險。最后,Hadoop是一個面向批處理的框架,這意味著它不支持實時的數據處理和分析。

好消息是,一些聰明的IT人士不斷對Apache Hadoop項目做出貢獻,新一代的Hadoop開發者和數據科學家們正在走向成熟。因此,該技術的發展日新月異,逐漸變得更加強大而且更易于實施和管理。供應商(包括Hadoop的初創企業Cloudera和Hortonworks)以及成熟的IT中堅企業(如IBM和微軟)正在努力開發企業可用的商業Hadoop分布式平臺、工具和服務,讓部署和管理這項技術成為傳統企業可用的實際現實。其他初創企業正在努力完善NoSQL(不僅僅是SQL)數據系統,結合Hadoop提供近實時的分析解決方案。

NoSQL

一種稱為NoSQL的新形式的數據庫(Not Only SQL)已經出現,像Hadoop一樣,可以處理大量的多結構化數據。但是,如果說Hadoop擅長支持大規模、批量式的歷史分析,在大多數情況下(雖然也有一些例外),NoSQL 數據庫的目的是為最終用戶和自動化的大數據應用程序提供大量存儲在多結構化數據中的離散數據。這種能力是關系型數據庫欠缺的,它根本無法在大數據規模維持基本的性能水平。

在某些情況下,NoSQL和Hadoop協同工作。例如,HBase是流行的NoSQL數據庫,它仿照谷歌的BigTable,通常部署在HDFS(Hadoop分布式文件系統)之上,為Hadoop提供低延遲的快速查找功能。

目前可用的NoSQL數據庫包括:

  • · HBase

  • · Cassandra

  • · MarkLogic

  • · Aerospike

  • · MongoDB

  • · Accumulo

  • · Riak

  • · CouchDB

  • · DynamoDB

目前大多數NoSQL數據庫的缺點是,為了性能和可擴展性,他們遵從ACID(原子性,一致性,隔離性,持久性)原則。許多NoSQL數據庫還缺乏成熟的管理和監控工具。這些缺點在開源的NoSQL社區和少數廠商的努力下都在克服過程中,這些廠商包括DataStax,Sqrrl,10gen,Aerospike和Couchbase,他們正在嘗試商業化各種NoSQL數據庫。

大規模并行分析數據庫

不同于傳統的數據倉庫,大規模并行分析數據庫能夠以必需的最小的數據建模,快速獲取大量的結構化數據,可以向外擴展以容納TB甚至PB級數據。

對最終用戶而言最重要的是,大規模并行分析數據庫支持近乎實時的復雜SQL查詢結果,也叫交互式查詢功能 ,而這正是Hadoop顯著缺失的能力。大規模并行分析數據庫在某些情況下支持近實時的大數據應用。大規模并行分析數據庫的基本特性包括:

大規模并行處理的能力: 就像其名字表明的一樣,大規模并行分析數據庫采用大規模并行處理同時支持多臺機器上的數據采集、處理和查詢。相對傳統的數據倉庫具有更快的性能,傳統數據倉庫運行在單一機器上,會受到數據采集這個單一瓶頸點的限制。

無共享架構: 無共享架構可確保分析數據庫環境中沒有單點故障。在這種架構下,每個節點獨立于其他節點,所以如果一臺機器出現故障,其他機器可以繼續運行。對大規模并行處理環境而言,這點尤其重要,數百臺計算機并行處理數據,偶爾出現一臺或多臺機器失敗是不可避免的。

列存儲結構: 大多數大規模并行分析數據庫采用列存儲結構,而大多數關系型數據庫以行結構存儲和處理數據。在列存儲環境中,由包含必要數據的列決定查詢語句的“答案”,而不是由整行的數據決定,從而導致查詢結果瞬間可以得出。這也意味著數據不需要像傳統的關系數據庫那樣構造成整齊的表格。

強大的數據壓縮功能: 它們允許分析數據庫收集和存儲更大量的數據,而且與傳統數據庫相比占用更少的硬件資源。例如,具有10比1的壓縮功能的數據庫,可以將10 TB字節的數據壓縮到1 TB。數據編碼(包括數據壓縮以及相關的技術)是有效的擴展到海量數據的關鍵。

商用硬件: 像Hadoop集群一樣,大多數(肯定不是全部)大規模并行分析數據庫運行在戴爾、IBM等廠商現成的商用硬件上,這使他們能夠以具有成本效益的方式向外擴展。

在內存中進行數據處理: 有些(肯定不是全部)大規模并行分析數據庫使用動態RAM或閃存進行實時數據處理。有些(如SAP HANA和 Aerospike)完全在內存中運行數據,而其他則采用混合的方式,即用較便宜但低性能的磁盤內存處理“冷”數據,用動態RAM或閃存處理“熱”數據。

然而,大規模并行分析數據庫確實有一些盲點。最值得注意的是,他們并非被設計用來存儲、處理和分析大量的半結構化和非結構化數據。

大數據方法的互補

Hadoop,NoSQL 和大規模并行分析數據庫不是相互排斥的。相反的,Wikibon 認為這三種方法是互補的,彼此可以而且應該共存于許多企業。Hadoop擅長處理和分析大量分布式的非結構化數據,以分批的方式進行歷史分析。NoSQL 數據庫擅長為基于Web的大數據應用程序提供近實時地多結構化數據存儲和處理。而大規模并行分析數據庫最擅長對大容量的主流結構化數據提供接近實時的分析。

例如,Hadoop完成的歷史分析可以移植到分析數據庫供進一步分析,或者與傳統的企業數據倉庫的結構化數據進行集成。從大數據分析得到的見解可以而且應該通過大數據應用實現產品化。企業的目標應該是實現一個靈活的大數據架構,在該架構中,三種技術可以盡可能無縫地共享數據和見解。

很多預建的連接器可以幫助Hadoop開發者和管理員實現這種數據集成,同時也有很多廠商(包括Pivotal Initiative-原EMC的Greenplum,CETAS-和Teradata Aster)提供大數據應用。這些大數據應用將Hadoop、分析數據庫和預配置的硬件進行捆綁,可以達到以最小的調整實現快速部署的目的。另外一種情況,Hadapt提供了一個單一平臺,這個平臺在相同的集群上同時提供SQL和Hadoop/MapReduce的處理功能。Cloudera也在Impala和Hortonworks項目上通過開源倡議推行這一策略。

但是,為了充分利用大數據,企業必須采取進一步措施。也就是說,他們必須使用高級分析技術處理數據,并以此得出有意義的見解。數據科學家通過屈指可數的語言或方法(包括SAS和R)執行這項復雜的工作。分析的結果可以通過Tableau這樣的工具可視化,也可以通過大數據應用程序進行操作,這些大數據應用程序包括自己開發的應用程序和現成的應用程序。其他廠商(包括 Platfora和Datameer)正在開發商業智能型的應用程序,這種應用程序允許非核心用戶與大數據直接交互。

大數據

圖3 – 現代數據架構  資料來源:Wikibon 2013

底層的大數據方法(如Hadoop,NoSQL和大規模并行分析數據庫)不僅本身是互補的,而且與大部分大型企業現有的數據管理技術互補。Wikibon并不建議企業CIO們為了大數據方法而“淘汰并更換”企業現有的全部的數據倉庫、數據集成和其他數據管理技術。

相反,Wikibon認為首席信息官必須像投資組合經理那樣思考,重新權衡優先級,為企業走向創新和發展奠定基礎,同時采取必要的措施減輕風險因素。用大數據方法替換現有的數據管理技術,只有當它的商業意義和發展計劃與現有的數據管理基礎設施盡可能無縫地整合時才有意義。最終目標應該是轉型為現代數據架構(見圖3和文章鏈接)。

大數據供應商發展狀況

大數據供應商正在迅速發展。參見圖4對一個細分市場的概述,對于大數據市場的詳細分析,包括市場規模(現狀及到2017年的五年預測)和供應商之間的大數據收入數字,詳情參考 大數據供應商收入和市場預測2012-2017。

大數據

圖4 – 大數據供應商發展狀況   資料來源:Wikibon 2012

大數據:實際使用案例 

讓Hadoop和其他大數據技術如此引人注目的部分原因是,他們讓企業找到問題的答案,而在此之前他們甚至不知道問題是什么。這可能會產生引出新產品的想法,或者幫助確定改善運營效率的方法。不過,也有一些已經明確的大數據用例,無論是互聯網巨頭如谷歌,Facebook和LinkedIn還是更多的傳統企業。它們包括:

推薦引擎:網絡資源和在線零售商使用Hadoop根據用戶的個人資料和行為數據匹配和推薦用戶、產品和服務。LinkedIn使用此方法增強其“你可能認識的人”這一功能,而亞馬遜利用該方法為網上消費者推薦相關產品。

情感分析: Hadoop與先進的文本分析工具結合,分析社會化媒體和社交網絡發布的非結構化的文本,包括Tweets和Facebook,以確定用戶對特定公司,品牌或產品的情緒。分析既可以專注于宏觀層面的情緒,也可以細分到個人用戶的情緒。

風險建模: 財務公司、銀行等公司使用Hadoop和下一代數據倉庫分析大量交易數據,以確定金融資產的風險,模擬市場行為為潛在的“假設”方案做準備,并根據風險為潛在客戶打分。

欺詐檢測: 金融公司、零售商等使用大數據技術將客戶行為與歷史交易數據結合來檢測欺詐行為。例如,信用卡公司使用大數據技術識別可能的被盜卡的交易行為。

營銷活動分析:各行業的營銷部門長期使用技術手段監測和確定營銷活動的有效性。大數據讓營銷團隊擁有更大量的越來越精細的數據,如點擊流數據和呼叫詳情記錄數據,以提高分析的準確性。

客戶流失分析: 企業使用Hadoop和大數據技術分析客戶行為數據并確定分析模型,該模型指出哪些客戶最有可能流向存在競爭關系的供應商或服務商。企業就能采取最有效的措施挽留欲流失客戶。

社交圖譜分析: Hadoop和下一代數據倉庫相結合,通過挖掘社交網絡數據,可以確定社交網絡中哪些客戶對其他客戶產生最大的影響力。這有助于企業確定其“最重要”的客戶,不總是那些購買最多產品或花最多錢的,而是那些最能夠影響他人購買行為的客戶。

用戶體驗分析: 面向消費者的企業使用Hadoop和其他大數據技術將之前單一 客戶互動渠道(如呼叫中心,網上聊天,微博等)數據整合在一起, ,以獲得對客戶體驗的完整視圖。這使企業能夠了解客戶交互渠道之間的相互影響,從而優化整個客戶生命周期的用戶體驗。

網絡監控:Hadoop 和其他大數據技術被用來獲取,分析和顯示來自服務器,存儲設備和其他IT硬件的數據,使管理員能夠監視網絡活動,診斷瓶頸等問題。這種類型的分析,也可應用到交通網絡,以提高燃料效率,當然也可以應用到其他網絡。

研究與發展: 有些企業(如制藥商)使用Hadoop技術進行大量文本及歷史數據的研究,以協助新產品的開發。

當然,上述這些都只是大數據用例的舉例。事實上,在所有企業中大數據最引人注目的用例可能尚未被發現。這就是大數據的希望。

大數據技能差距

企業運用大數據的最大障礙是缺乏相關的技能,如Hadoop管理技能、大數據分析技能或數據科學。為了讓大數據真正被大量采用,并且實現其全部潛力,縮小技能上的差距就至關重要了。這需要從兩條戰線進行攻擊:

首先,這意味著開源社區和商業大數據廠商必須開發易于使用的大數據管理和分析工具和技術,為傳統的IT和商業智能專業人士降低進入的門檻。這些工具和技術,必須從底層數據處理框架抽象掉盡可能多的復雜性。可以通過圖形用戶界面,類似于向導的安裝功能和日常任務自動化的組合方式實現。

其次,社會必須開發更多的教育資源,培養現有的IT和商業智能專業人士以及高中生和大學生成為我們未來所需要的大數據從業者。

據麥肯錫公司研究,到2018年僅美國就有可能面臨14萬~19萬具備專業分析技能的人才,以及懂得使用大數據分析做出有效決策的150萬經理和分析師的短缺。造成短缺的部分原因是數據科學本身的規律導致的,因為數據科學要求各種綜合技能。

[[112295]]

具體來說,數據科學家必須具備的技術技能側重于統計、計算機科學和數學。但他們還必須具有商業頭腦,即了解現有業務,并且能找到大數據可以業務提供最大價值的方向。或許同樣重要的是,數據科學家必須具備專業的溝通技巧,以及通過大數據的可視化,向業務同事講故事的能力。

正如本報告中提到的,一些大數據廠商開始提供大數據培訓課程。IT從業者具有極好的機會,利用這些培訓和教育活動的優勢磨練自己的數據分析技能,并可以在企業內部確定新的職業道路。同樣,在南加州大學、北卡羅來納州立大學、紐約大學和其他地方,幾門關于大數據和高級分析技術的大學級別的課程也應運而生。但大數據的發展和普及還是需要更多的課程。

只有通過兩條戰線-更好的工具和技術,更好的教育和培訓-才能克服大數據技術差距。

大數據:企業和供應商的后續動作
對企業和為他們服務的供應商雙方而言,大數據都具有很大的潛力,但首先必須先采取行動。Wikibon的建議如下。

行動項目:各個行業的企業應評估現有和潛在的大數據用例,參與大數據社區了解最新的技術發展。與大數據社區里志趣相投的企業和供應商一起識別大數據能夠提供商業價值的領域。接下來,考慮企業內部的大數據技術水平,確定是否開始大數據方法,如Hadoop的試驗。如果是這樣,與IT部門和業務部門一起制定計劃,將大數據工具、技術和方法整合到企業現有的IT基礎架構。

最重要的是,首先要在所有工作人員中培養數據驅動的文化,鼓勵數據實驗。當這個基礎已經奠定,開始使用大數據的技術和方法提供最大的業務價值,并不斷地重新評估新成熟的大數據方法。

IT供應商應該幫助企業找出最有利可圖、最實用的大數據用例,開發使大數據技術更易于部署、管理和使用的產品和服務。擁有開放而不專有的心態,給予客戶嘗試新的大數據技術和工具所需要的靈活性。同樣地,開始建立大數據服務,幫助企業發展部署和管理大數據方法(如Hadoop)所需要的技能。最重要的是,隨著大數據部署方案的成熟和成長,及時傾聽和回應客戶的反饋

責任編輯:彭凡 來源: 大數據觀察
相關推薦

2018-04-03 13:08:31

2015-03-17 11:28:03

大數據黃色小象Hadoop

2019-01-30 09:30:50

大數據互聯網人工智能

2019-11-29 17:26:56

大數據分布式計算技術

2017-05-05 12:59:00

大數據物聯網安全

2021-07-05 10:48:42

大數據實時計算

2024-05-07 08:49:36

Hadoop數據存儲-分布式存儲

2018-03-17 09:00:21

大數據 區塊鏈

2024-12-27 14:45:59

2020-12-21 10:38:07

大數據大數據組件大數據生態

2021-09-17 13:34:57

大數據Redis 應用

2020-10-08 14:32:57

大數據工具技術

2022-10-20 08:01:23

2023-01-14 15:32:00

云原生大數據架構

2018-01-31 18:10:15

數據庫HBase

2023-11-20 13:51:00

泛型函數TypeScript

2021-01-21 14:26:56

大數據互聯網大數據應用

2022-06-14 09:01:06

TypeScript泛型

2022-08-27 10:37:48

電子取證信息安全

2017-12-21 14:48:43

數據安全數據泄漏檢測技術
點贊
收藏

51CTO技術棧公眾號

性欧美在线看片a免费观看| 欧美喷潮久久久xxxxx| 精品久久久久久乱码天堂| 国产又色又爽又黄的| 国产影视一区| 日韩一区二区免费在线观看| 成熟丰满熟妇高潮xxxxx视频| 久久久久久女乱国产| 国精产品一区一区三区mba桃花| 欧美激情视频免费观看| 精品人妻无码一区| 91精品国产自产精品男人的天堂| 色婷婷综合激情| 日韩一级片一区二区| 国产小视频在线观看| 国产美女精品一区二区三区| 日本人成精品视频在线| 免费无遮挡无码永久在线观看视频| 免费一区二区三区视频导航| 日韩免费成人网| 日韩av片网站| 涩涩视频在线| 一个色在线综合| 无遮挡亚洲一区| 手机看片一区二区| 国产麻豆精品久久一二三| 国产脚交av在线一区二区| 久久久综合久久久| 午夜激情久久| 国产小视频国产精品| 亚洲久久久久久| 久久丁香四色| 欧美日韩在线综合| 国产精品人人妻人人爽人人牛| 国产在线拍揄自揄拍视频| 国产精品国产a级| 日韩精品久久久毛片一区二区| 天天干天天操av| 国产高清视频一区| 成人免费视频网址| 中文字幕黄色av| 日韩精品国产欧美| 国产va免费精品高清在线| 久久精品视频9| 欧美精品播放| 色综合导航网站| 草视频在线观看| 亚洲欧美网站在线观看| 精品国内自产拍在线观看| 又色又爽的视频| 日韩欧美视频| 中文字幕亚洲字幕| 国产一区二区三区视频播放| 热久久天天拍国产| 中日韩美女免费视频网址在线观看 | 91精品国产91久久综合桃花| 亚洲视频一二三四| 欧美成人福利| 91精品福利在线一区二区三区 | 亚洲国产精品传媒在线观看| 欧美一区二区影视| 国产玉足榨精视频在线观看| 国产亚洲精品超碰| 香蕉久久免费影视| 黄色在线论坛| 亚洲影院理伦片| 日韩 欧美 视频| 麻豆免费在线| 91福利国产成人精品照片| 国产 porn| 91视频成人| 精品女同一区二区| av网页在线观看| 国产欧美日韩视频在线| 在线日韩av观看| 国产精品 欧美激情| 亚洲手机视频| 清纯唯美亚洲综合| 中文字幕日日夜夜| 国产成人精品在线看| 精品国产乱码一区二区三区四区| 日本福利片在线| 99久久夜色精品国产网站| 国产精品久久久一区二区三区| 五月婷婷六月激情| 国产精品久久看| 97碰在线视频| 成人午夜一级| 日韩精品最新网址| 精品人伦一区二区三电影 | 最新日韩中文字幕| 九九热精品在线观看| 日韩视频精品在线观看| 国产精品美女免费| 成人免费公开视频| 国产日本一区二区| 日产精品久久久久久久蜜臀| 欧美日韩精品免费观看视完整| 在线电影院国产精品| a天堂视频在线观看| 日韩视频在线观看| 午夜精品三级视频福利| 一级特黄aaa大片在线观看| 高清不卡一区二区| 亚洲人体一区| 国产夫妻在线播放| 欧美日韩1234| 成人影视免费观看| 综合久久婷婷| 国产z一区二区三区| 精品人妻无码一区二区色欲产成人| 91麻豆视频网站| 六月婷婷激情网| 国产精品高清乱码在线观看| 亚洲第一国产精品| 波多野结衣家庭教师| 老司机午夜精品视频在线观看| 不卡一卡2卡3卡4卡精品在| 成人高清免费观看mv| 午夜亚洲福利老司机| 亚洲av无日韩毛片久久| 精品理论电影| 午夜精品久久久久久久久久久久久| 中文字幕在线播出| 99久久免费国产| 欧美中文字幕在线观看视频| 色综合.com| 中文字幕欧美日韩| 欧美黄色一级大片| 97久久久精品综合88久久| 欧美美女黄色网| 91精品亚洲一区在线观看| 在线电影av不卡网址| 国产一级片毛片| 99精品久久只有精品| 妞干网在线观看视频| 日韩高清一区| 另类色图亚洲色图| 99久久精品日本一区二区免费| 国产精品美女一区二区三区 | 国产国产一区| 国产午夜精品视频免费不卡69堂| 精品美女久久久久| 9l国产精品久久久久麻豆| 国产曰肥老太婆无遮挡| 97视频一区| 欧美激情一区二区三级高清视频 | 国产成人一区二区三区影院在线 | 亚洲色成人网站www永久四虎| 午夜在线精品偷拍| 美女黄毛**国产精品啪啪| 亚洲风情在线资源| 亚洲精品自产拍| 四虎影院在线免费播放| 久久精品人人做人人爽人人| 国产精彩免费视频| 国精一区二区| 国产欧美精品在线| 黄网页免费在线观看| 91麻豆精品久久久久蜜臀 | 疯狂做受xxxx高潮欧美日本| 亚洲第一黄色网址| 久久在线精品| 一级二级三级欧美| 国产成人视屏| 久久免费国产视频| 三级国产在线观看| 欧美综合在线视频| 亚洲一区电影在线观看| 国产高清视频一区| 国产aaa一级片| 不卡日本视频| 69174成人网| 精精国产xxxx视频在线播放| 亚洲色图15p| 一个人看的www日本高清视频| 亚洲男女毛片无遮挡| 又黄又爽的网站| 老牛影视一区二区三区| 一区中文字幕在线观看| 成人h动漫免费观看网站| 欧美一级淫片播放口| 91电影在线播放| 精品女同一区二区| 潘金莲一级淫片aaaaaa播放| 亚洲视频一区在线观看| 无遮挡aaaaa大片免费看| 免费av网站大全久久| 国产精品无码免费专区午夜| 欧美日韩国产高清电影| 亚洲一区亚洲二区| 亚洲最大网站| 美日韩在线视频| 欧美日韩视频精品二区| 欧美一区二区人人喊爽| 欧美国产成人精品一区二区三区| 国产精品国产自产拍高清av| 男人的天堂影院| 精品影视av免费| 欧美女人性生活视频| 91精品婷婷色在线观看| 欧美二区三区| 香蕉大人久久国产成人av| 国产成+人+综合+亚洲欧洲| 乱人伦中文视频在线| 亚洲人成电影网站色| 性一交一乱一乱一视频| 精品视频在线免费观看| 国产三级av片| 夜夜精品视频一区二区| 无码少妇一区二区| 99视频精品在线| 日韩精品国产一区| 久久国产精品免费| aaaaaa亚洲| 亚洲国产裸拍裸体视频在线观看乱了中文 | 国产精品久线在线观看| 国产精品成人一区二区三区电影毛片 | 黄网站色欧美视频| 国产精品国产精品88| 欧美韩国日本不卡| 美国黄色一级毛片| 99久久久精品| 国产51自产区| 国产成人在线网站| www.污网站| 久久99这里只有精品| 丁香婷婷激情网| 午夜亚洲福利在线老司机| 色欲色香天天天综合网www| 欧美精品九九| 在线观看av的网址| 久久精品国内一区二区三区水蜜桃| 日日骚一区二区网站| 亚洲区小说区图片区qvod| 九九九九九精品| 美女av一区| 国产欧美欧洲| 欧美日韩一区二区三区不卡视频| 国产在线欧美日韩| 国语一区二区三区| 极品日韩久久| 一区二区三区日本久久久| 久久精品欧美| 中文精品一区二区| 欧美大香线蕉线伊人久久| 婷婷成人影院| 日本午夜精品一区二区三区| 国产精品亚洲人成在99www| 欧洲久久久久久| 欧美丝袜丝交足nylons172| 四虎一区二区| 婷婷中文字幕一区| 国产欧美久久久久| 亚洲高清av| 久久久久久久激情| 热久久久久久久| 亚洲怡红院在线| 国产一区二区三区在线看麻豆| 性生活一级大片| 成人夜色视频网站在线观看| av网页在线观看| 国产午夜精品久久久久久久| 日韩视频在线观看免费视频| 日韩理论片在线| 久久亚洲国产成人精品性色| 欧美日韩国产激情| 中文字幕在线播| 欧美日韩精品一区二区在线播放 | 99re久久| 91久久偷偷做嫩草影院| 国产福利资源一区| 日本黄网免费一区二区精品| 婷婷色综合网| 国产毛片视频网站| 日日噜噜夜夜狠狠视频欧美人 | 欧美 日韩 亚洲 一区| 新67194成人永久网站| 日韩一区二区三区久久| 国产高清亚洲一区| 成人免费毛片糖心| 综合久久久久久| 日本一级一片免费视频| 欧美无乱码久久久免费午夜一区| 99热这里只有精品9| 日韩成人激情视频| 乱人伦中文视频在线| 欧美亚洲成人精品| 亚洲三级在线| 乱一区二区三区在线播放| 国产精品99视频| 国产成人黄色片| 国产综合色精品一区二区三区| 黄色激情在线观看| 国产精品国产三级国产| www.av麻豆| 欧美一区二区在线视频| 久久经典视频| 欧美极品第一页| 成人在线视频www| 久久久亚洲综合网站| 中文字幕日韩欧美精品高清在线| 无码人妻丰满熟妇区毛片18 | 精品人妻无码一区二区三区换脸| 亚洲欧美国产高清| 免费精品一区二区| 亚洲国产日韩欧美在线99| 国内精品久久久久国产| 国产精品久久不能| 欧美精品国产白浆久久久久| 亚洲国产一二三精品无码| 日韩国产精品久久久久久亚洲| 亚洲乱妇老熟女爽到高潮的片| 国产精品伦一区| 小泽玛利亚一区二区三区视频| 亚洲国产精品网站| 欧美人体视频xxxxx| 成人www视频在线观看| 深夜福利久久| 久久精品国产精品亚洲色婷婷| 国产激情偷乱视频一区二区三区 | 国产九九在线| 91av视频导航| 欧美激情15p| 亚洲美免无码中文字幕在线 | 6080yy午夜一二三区久久| 国产在线免费观看| 欧亚精品在线观看| 久久人人爽人人爽人人片av不| 欧美日韩中文字幕在线播放| 国内精品久久久久影院薰衣草| 国产三级黄色片| 欧美亚州韩日在线看免费版国语版| 午夜视频福利在线观看| 韩国欧美亚洲国产| 超碰地址久久| 国产一二三在线视频| 成人黄页毛片网站| 国产亚洲精品久久777777| 日韩一级大片在线| a在线免费观看| 成人免费视频视频在| 欧美精品国产一区二区| 色综合久久久无码中文字幕波多| 亚洲欧美欧美一区二区三区| a级片在线免费看| 欧美日韩成人免费| 99久久香蕉| 成人免费观看cn| 久久综合成人精品亚洲另类欧美| 日韩特级黄色片| 国产亚洲欧美日韩美女| 欧美性片在线观看| 亚洲欧洲精品一区| 精品一区二区三区的国产在线播放| 日本激情视频一区二区三区| 欧美一卡二卡在线| 欧美草逼视频| 久草一区二区| 日韩在线一二三区| 欧美人与禽zoz0善交| 9191久久久久久久久久久| 午夜dj在线观看高清视频完整版| 国产女主播一区二区| 久久久久免费| 制服丨自拍丨欧美丨动漫丨| 欧美一区二区三区视频在线观看| 新版中文在线官网| 久久riav二区三区| 丝袜诱惑制服诱惑色一区在线观看 | 日韩精品一区中文字幕| 中文字幕在线不卡视频| www五月婷婷| 欧美最顶级的aⅴ艳星| 久久久综合色| 亚洲黄色小说在线观看| 一本大道久久a久久精二百 | 中文字幕一区二区三区在线观看| av网站在线免费看| 91国产美女视频| 日韩影院二区| 亚洲少妇18p| 在线观看av不卡| 久草在线视频网站| 欧美一区二区三区在线免费观看| 国产乱子伦一区二区三区国色天香 | 欧美熟妇精品一区二区| 欧美日韩中文字幕综合视频| 日本免费视频在线观看| 91中文精品字幕在线视频| 国产精品毛片一区二区三区| 精品少妇一区二区三区密爱| 亚洲第一男人av| 免费日韩成人| 精品国产免费av| 亚洲精品久久久蜜桃| 国产高清在线观看| 国产精品国产精品国产专区蜜臀ah | 色综合久久中文综合久久97 | 91中文字幕精品永久在线|