想成為數(shù)據(jù)可視化高手,先來看完這篇極速入門教程
說起數(shù)據(jù)分析的必備技能,就不得不提一個(gè)很火的詞語,那就是數(shù)據(jù)可視化,究竟什么是可視化?怎么才能學(xué)會(huì)數(shù)據(jù)可視化呢?
我們先來說一說,什么叫做可視化:
簡(jiǎn)單來說,可視化就是把看起來較枯燥的文字、報(bào)表用易于觀看的圖片形式表達(dá)出來。
大家都知道公司數(shù)據(jù)非常多,尤其是互聯(lián)網(wǎng)金融公司和地產(chǎn)公司,從周報(bào)、月報(bào)、季報(bào)到年終總結(jié),其實(shí)都是對(duì)過去工作數(shù)據(jù)的歸納和總結(jié)的過程。
因此,很多人都被迫變成了處理數(shù)據(jù)的機(jī)器,而雜亂無章的數(shù)據(jù)非常難以進(jìn)行分析和統(tǒng)計(jì),此時(shí)數(shù)據(jù)可視化應(yīng)運(yùn)而生。

Anscombe 的四重奏
這就是一個(gè)非常典型的數(shù)據(jù)可視化例子。
上面的數(shù)據(jù)通過人眼很難看出其規(guī)律性,大家只認(rèn)為這是一組雜亂的數(shù)據(jù),而將其可視化之后就發(fā)現(xiàn)了其中非常明顯的規(guī)律性,方便人腦記憶。
可視化分類
簡(jiǎn)而言之,可視化在實(shí)際業(yè)務(wù)層面上可以分為兩類:信息可視化、數(shù)據(jù)可視化。
但是信息可視化與數(shù)據(jù)可視化的區(qū)別還是很大的,很大的區(qū)別就在于數(shù)據(jù)可視化的”數(shù)據(jù)是可變的、不固定的、可更改的、具象的“,信息可視化的“信息是固定的、不變的、不可更改的、抽象的”。
1、數(shù)據(jù)可視化
舉個(gè)簡(jiǎn)單的實(shí)際例子,公司老板想要監(jiān)控一下公司銷售部門的情況,這時(shí)候我們就需要從數(shù)據(jù)庫或者數(shù)據(jù)平臺(tái)中取出銷售部門的數(shù)據(jù),然后通過數(shù)據(jù)可視化的方法制作一張駕駛艙,然后交到老板手里;或者很多公司都會(huì)做大屏項(xiàng)目,比如生產(chǎn)項(xiàng)目進(jìn)展大屏:

這時(shí)候我們所取的數(shù)據(jù)都是具象的結(jié)構(gòu)化數(shù)據(jù),比如銷售額情況、毛利率情況等等,這些結(jié)構(gòu)化數(shù)據(jù)我們可以通過程序或者BI工具生成各種圖形圖像,并且這些程序和工具可以應(yīng)用不同的數(shù)據(jù),也就是說當(dāng)數(shù)據(jù)變化之后,數(shù)據(jù)可視化的結(jié)果也是會(huì)變化的。
所以,數(shù)據(jù)是可變的、不固定的、可更改的、具象的。這時(shí)候這張可視化展示的都是一個(gè)個(gè)的“數(shù)據(jù)”,比如“銷售額下降了50%“、”成本上升了20%“,我們能從數(shù)據(jù)可視化中得到的結(jié)果也一定是數(shù)據(jù)。
2、信息可視化
如果我們想要展示一下近幾年北極冰層的消融情況,這個(gè)時(shí)候我們用結(jié)構(gòu)化的數(shù)據(jù)非常難以表達(dá),因此對(duì)于地理信息、音頻視頻數(shù)據(jù)、文字等非結(jié)構(gòu)化數(shù)據(jù),我們展示的只能是”信息“,而非數(shù)據(jù)。
所以一般認(rèn)為,信息可視化囊括了數(shù)據(jù)可視化、信息圖形、知識(shí)可視化、科學(xué)可視化、視覺設(shè)計(jì)方面的所有發(fā)展與進(jìn)步。

這時(shí)候信息可視化的基礎(chǔ)仍然還是數(shù)據(jù),但是他處理的對(duì)象是抽象數(shù)據(jù)集合,因此信息可視化實(shí)際上既有統(tǒng)計(jì)圖形學(xué)的基礎(chǔ),又與信息圖形、視覺設(shè)計(jì)等現(xiàn)代技術(shù)相關(guān)。
其表現(xiàn)形式通常在二維空間,因此關(guān)鍵問題是在有限的展現(xiàn)空間中以直觀的方式傳達(dá)大量的抽象信息。
除此之外,很多人都覺得只要是用了柱狀圖、餅狀圖、折線圖之類的圖表,就叫做數(shù)據(jù)可視化;用藝術(shù)設(shè)計(jì)手法繪制的圖表,就叫做信息可視化。其實(shí)這是很片面的,雖然這兩個(gè)特點(diǎn)的確存在。

大家眼中的數(shù)據(jù)可視化(來源:finebi)

大家眼中的信息可視化(來源:CANSIFEN)
我們先從整體上看一下可視化的定義:
可視化:是利用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像在屏幕上顯示出來,并進(jìn)行交互處理的理論、方法和技術(shù)。
因此無論是數(shù)據(jù)可視化、還是信息可視化,二者的對(duì)象都是最原始的數(shù)據(jù),而圖形和圖表只是數(shù)據(jù)的表現(xiàn)形式,也就是載體,因此不能作為二者的區(qū)分要素,因?yàn)樾畔⒖梢暬幕A(chǔ)圖表也是柱狀圖、折線圖、餅狀圖這種簡(jiǎn)單圖表類型,比如下面這張信息可視化作品,其實(shí)也是最簡(jiǎn)單的柱狀圖變形而已。

數(shù)據(jù)可視化的工具
1、D3
D3.js 是一個(gè)基于數(shù)據(jù)操作文檔的 JavaScript 庫。D3 可以將強(qiáng)大的可視化組件和數(shù)據(jù)驅(qū)動(dòng)的 DOM 操作方法優(yōu)秀結(jié)合。

評(píng)價(jià):強(qiáng)大的 SVG 操作能力,可以非常容易的將數(shù)據(jù)映射為 SVG 屬性,還集成了大量數(shù)據(jù)處理、布局算法和計(jì)算圖形的工具方法,有著強(qiáng)大的社區(qū)和豐富的 demo,但是API 太底層,復(fù)用性低,學(xué)習(xí)與使用成本高。
2、FineBI
一款國產(chǎn)的商業(yè)智能軟件,主打的是數(shù)據(jù)分析,操作非常簡(jiǎn)便,拖拽就能自動(dòng)生成圖表,還帶有智能圖表推薦功能,而且內(nèi)置的可視化圖表很豐富,用來制作可視化儀表板或者可視化大屏很方便。
除了數(shù)據(jù)可視化功能之外,它還包含了數(shù)據(jù)分析過程中的數(shù)據(jù)處理、建模、甚至是SQL的優(yōu)化,對(duì)于數(shù)據(jù)分析來說也是一款很好的工具。

3、FineReport
FineReport報(bào)表軟件是一款純Java編寫的、集數(shù)據(jù)展示(報(bào)表)和數(shù)據(jù)錄入(表單)功能于一身的企業(yè)級(jí)web報(bào)表工具,僅需簡(jiǎn)單的拖拽操作便可以設(shè)計(jì)復(fù)雜的中國式報(bào)表,搭建數(shù)據(jù)決策分析系統(tǒng)。

可以直連數(shù)據(jù)庫,方便快捷的定制各種復(fù)雜表樣,用來做出固定格式的周報(bào)、月報(bào)等。
它的格式類似于excel界面,特色功能報(bào)表制作,報(bào)表權(quán)限分配,報(bào)表管理還有填報(bào),支持多種數(shù)據(jù)庫。
4、Flourish
可以說是最好用的免費(fèi)可視化在線flash網(wǎng)站,在國外很有名,提供了非常多的數(shù)據(jù)可視化模板,你只要把數(shù)據(jù)導(dǎo)入到模板里,設(shè)置好相應(yīng)的速度、顏色、圖標(biāo)等信息,可視化圖表就完成了,繪制完成的可視化圖表可以發(fā)布并且嵌入到網(wǎng)頁或者PPT中。

5、Tableau
全球知知名度很高的數(shù)據(jù)可視化工具,用戶群體龐大,操作界面很靈多,圖表設(shè)計(jì)簡(jiǎn)潔明了、個(gè)性化程度高,易用性和交互體驗(yàn)優(yōu)秀。
傻瓜式入門,適合新手,隨著經(jīng)驗(yàn)增多,也有更多專業(yè)功能的可以循序漸進(jìn)的學(xué)習(xí)使用,進(jìn)行更加高階的可視化分析,是很多可視化愛好者的選擇。




























