專家談大數(shù)據(jù)來(lái)自何方 價(jià)值雖高但管理太難
原創(chuàng)數(shù)據(jù)的爆炸式增長(zhǎng)為企業(yè)帶來(lái)了機(jī)遇與挑戰(zhàn)。社交計(jì)算、移動(dòng)計(jì)算、云計(jì)算等新型計(jì)算模式的出現(xiàn)讓數(shù)據(jù)的產(chǎn)生方式跟傳統(tǒng)相比有了很大的不同。一方面數(shù)據(jù)的總量在變大,產(chǎn)生數(shù)據(jù)的來(lái)源也更加分散,不再像以往僅僅是產(chǎn)生自企業(yè)內(nèi)部的IT系統(tǒng);另一方面非結(jié)構(gòu)化數(shù)據(jù)在增多,這些數(shù)據(jù)不同于擁有一定關(guān)系的可以在數(shù)據(jù)表中逐行記錄的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)通常存在于影像、郵件、文檔、社交平臺(tái)中,他們的體積龐大,而使有價(jià)值的信息不易被發(fā)現(xiàn)。
了解大數(shù)據(jù)來(lái)自何處,能夠幫助我們更好的進(jìn)行數(shù)據(jù)集成和抓取,用以分析出結(jié)論后優(yōu)化業(yè)務(wù)決策。在今天舉辦的第二屆大數(shù)據(jù)論壇上,F(xiàn)orrester的分析師曹宇欽認(rèn)為大數(shù)據(jù)來(lái)源于企業(yè)內(nèi)部、外部、產(chǎn)業(yè)生態(tài)鏈的上下游客戶、社交媒體、移動(dòng)終端等等地方。

大數(shù)據(jù)來(lái)自企業(yè)內(nèi)部/外部/客戶/社交媒體
Oracle全球副總裁喻思成認(rèn)為,“大數(shù)據(jù)來(lái)自于泛互聯(lián)網(wǎng)數(shù)據(jù),機(jī)器產(chǎn)生的數(shù)據(jù),以及行業(yè)內(nèi)容的數(shù)據(jù)。這些數(shù)據(jù)可以用4個(gè)‘V’表示,即巨大的數(shù)據(jù)量、多結(jié)構(gòu)化數(shù)據(jù)、增長(zhǎng)速度很快、價(jià)值很大但是密度低。處理這些大數(shù)據(jù)最核心的兩項(xiàng)技術(shù)便是Hadoop、NoSQL?!?/P>

管理和處理大數(shù)據(jù)有難度
本屆大會(huì)上,Intel公司行業(yè)合作與解決方案中國(guó)區(qū)總監(jiān)凌琦對(duì)大數(shù)據(jù)進(jìn)行了比較形象的解讀,他通過(guò)兩個(gè)維度來(lái)描述數(shù)據(jù),一條維度是數(shù)據(jù)類型,另一條維度是數(shù)據(jù)規(guī)模。通過(guò)維度交叉的區(qū)間可以看出相應(yīng)的數(shù)據(jù)特點(diǎn)。

大數(shù)據(jù)的時(shí)代正在到來(lái)
如圖所示。小規(guī)模的非關(guān)系型數(shù)據(jù)集僅可以為我們提供有限的分析價(jià)值;小規(guī)模的關(guān)系型數(shù)據(jù)也僅能作為傳統(tǒng)商業(yè)智能的分析對(duì)象;大規(guī)模的關(guān)系型數(shù)據(jù)提供的擴(kuò)展性和參考性非常有限。而大規(guī)模的非關(guān)系型數(shù)據(jù)集將是真正為企業(yè)帶來(lái)價(jià)值的數(shù)據(jù)信息,這便是大數(shù)據(jù)。凌琦先生表示,“根據(jù)IDC的預(yù)測(cè),全球的數(shù)據(jù)使用量到2020年會(huì)增長(zhǎng)44倍,達(dá)到35.2ZB(1ZB=10億TB)?!北ㄊ降臄?shù)據(jù)增長(zhǎng)趨勢(shì)證明了大數(shù)據(jù)的時(shí)代正在到來(lái)。
凌琦列舉了大數(shù)據(jù)來(lái)源的一些場(chǎng)景:
•社交網(wǎng)絡(luò)
•移動(dòng)網(wǎng)絡(luò)和各種智能終端
•商業(yè)數(shù)據(jù)與信息
•傳感器、RFID閱讀器、導(dǎo)航終端等非傳統(tǒng)IT設(shè)備
•視頻(醫(yī)療影像、地理信息、監(jiān)控等)
通過(guò)上面大數(shù)據(jù)來(lái)源場(chǎng)景的描述,我們發(fā)現(xiàn)這些數(shù)據(jù)內(nèi)容正是來(lái)自我們身邊的信息系統(tǒng)和網(wǎng)絡(luò)平臺(tái)。但是有了這些大數(shù)據(jù)應(yīng)該怎么來(lái)使用和分析?怎樣通過(guò)計(jì)算出的結(jié)論來(lái)優(yōu)化業(yè)務(wù)決策,這些是我們?cè)趯?shí)現(xiàn)了大數(shù)據(jù)的捕獲和收集后更需要集中注意力來(lái)做的事情。






















