大數(shù)據(jù)也要可視化!盤點六家主力初創(chuàng)公司
盡管可視化不是數(shù)據(jù)分析中最有技術(shù)挑戰(zhàn)的一部分,但無疑它是最重要的。
存儲、數(shù)據(jù)庫、查詢處理和算法都是非常重要的,但是在以數(shù)據(jù)為驅(qū)動的世界中,他們都是基礎(chǔ)層。如果你要從大量高度復(fù)雜的數(shù)據(jù)集中發(fā)現(xiàn)新東西,或者給人們提供分析即使是最簡單數(shù)據(jù)的能力,那么展現(xiàn)這些數(shù)據(jù)和展現(xiàn)這些數(shù)據(jù)如何被利用,就是很關(guān)鍵的。
以下是筆者認(rèn)為從根本上改變了數(shù)據(jù)可視化方式的六家初創(chuàng)公司,有些在表面之下是高度復(fù)雜的,有些是并不完美的,但是他們都在通過自己的行動讓我們重新思考數(shù)據(jù)、通過圖表的方式讓我們看到事實。
Ayasdi
網(wǎng)絡(luò)圖表的想法并不新鮮,但是Ayasdi的方法倒是挺新鮮的。在后臺,有一個HBase數(shù)據(jù)庫,一項被成為拓?fù)鋽?shù)據(jù)分析的技術(shù),數(shù)百臺機器學(xué)習(xí)算法以處理復(fù)雜的數(shù)據(jù)集,找到數(shù)據(jù)點之間的相似性。不過對于終端用戶來說,有一個數(shù)據(jù)集的地圖,看上去很像是網(wǎng)絡(luò)圖表,突出相關(guān)數(shù)據(jù)點的集群,讓分析師可能進行進一步研究。
BeyondCORE實際是在和Ayasdi相同的前提下運行的——為用戶展示重要的相關(guān)性,這樣他們就不必思考沒有覆蓋到的查詢——但那是他采用一些不同的技術(shù)去達到目的。BeyondCORE采用一個不同的可視化方法,它堅持使用標(biāo)準(zhǔn)圖表,但通過軟件發(fā)現(xiàn)的相關(guān)性,提供在虛擬實境中互動地呈現(xiàn)一個談話用戶的選項。
ClearStory
ClearStory有一款非常特別的產(chǎn)品——盡管他們對很多細節(jié)秘而不宣,而且在發(fā)布前所有截屏都是帶鎖的。不過,從本質(zhì)上講,它試圖通過可視化展現(xiàn)一切細節(jié),顯示大量數(shù)據(jù)來源,當(dāng)源數(shù)據(jù)改變的時候自動更新,并且調(diào)用協(xié)作和社交理念。
Datahero
與很多初創(chuàng)數(shù)據(jù)公司不同的是,Datahero并沒有試圖招攬那些已經(jīng)對業(yè)務(wù)智能軟件或者從Hadoop數(shù)據(jù)中心獲得見解已經(jīng)厭倦了的人們。相反,Datahero讓那些有簡單的業(yè)務(wù)數(shù)據(jù)或者個人數(shù)據(jù)的人們獲得一些簡單的表格,既不用安裝Excell功能,也不用過多地?fù)?dān)心表格的格式對不對。在早期,Datahero的可視化仍然是相當(dāng)普遍的,但它的易用性是很獨特的。
Platfora

Platfora試圖分析保存在Hadoop集群中的大量數(shù)據(jù),像分析自己Stripe數(shù)據(jù)那樣簡單。這是基于Hadoop和大規(guī)模并行隊列處理的,但是以一種類似HTML5的方式展現(xiàn),例如有拖拽、刪除、視覺切割和數(shù)據(jù)切割等操作。后者的能力,實際上在擁有比以往更多數(shù)據(jù)點的大數(shù)據(jù)世界中是很關(guān)鍵的。
Zoomdata
Zoomdata不是唯一一家支持移動設(shè)備的分析公司,但是筆者所知的少數(shù)幾家專門為移動設(shè)備而設(shè)計的公司之一。Zoomdata連接到標(biāo)準(zhǔn)業(yè)務(wù)數(shù)據(jù)源,但是利用觸摸屏和D3.js可視化來提供可視化的圖表,而且這些圖表的設(shè)計就像是藝術(shù)家的調(diào)色板一樣有趣。






















