這篇文章把數(shù)據(jù)講透了(五):數(shù)據(jù)可視化(下)
編輯導(dǎo)讀:隨著“數(shù)智化”時(shí)代的到來(lái),我們生活中的方方面面都離不開(kāi)數(shù)據(jù),而你真的了解數(shù)據(jù)嗎?本文作者將為大家重新解讀數(shù)據(jù)的概念和價(jià)值,以及數(shù)據(jù)的價(jià)值是如何在“數(shù)智化”時(shí)代下一步一步得到運(yùn)用與升華的,一起來(lái)看看~
一、前言
上幾期文章中,我們已經(jīng)了解到“數(shù)據(jù)”是一個(gè)龐大的體系(如下圖所示),并用了菜市場(chǎng)的例子,為大家講解數(shù)據(jù)來(lái)源的含義;用買(mǎi)菜的例子,為大家講解數(shù)據(jù)采集的步驟;用洗菜、擇菜的例子,為大家講解數(shù)據(jù)清洗的方法…
而今天小陳主要給大家講解,我們學(xué)會(huì)做菜以后,怎樣把烹飪方法簡(jiǎn)單易懂的傳授給他人,即數(shù)據(jù)可視化的過(guò)程。
二、可視化圖表的選用原則(參考麥肯錫系列書(shū)目——《用圖表說(shuō)話》)
先上圖表選取原則干貨(見(jiàn)下圖),下面我們?cè)?strong>針對(duì)每個(gè)表格的使用進(jìn)行逐一講解!
圖片來(lái)源——公眾號(hào)【高端商務(wù)報(bào)告】
1. 成分類
(1)餅類
一般情況下,我們會(huì)選擇餅圖來(lái)呈現(xiàn)成分的對(duì)比關(guān)系。而餅圖使用也存在下面這些“潛規(guī)則”
a.遵循閱讀習(xí)慣,餅圖成分重要性需要呈順時(shí)針順序
在閱讀餅圖時(shí),人們都會(huì)下意識(shí)的從12點(diǎn)鐘方向,順時(shí)針讀下去。所以,為了迎合人們的閱讀習(xí)慣,我們需要將數(shù)據(jù)的占比大小、重要性按照順時(shí)針?lè)较蚯衅故尽?/p>
b.切片數(shù)量不要超過(guò)7個(gè),如果餅圖類別很細(xì),對(duì)于受眾而言,對(duì)比起來(lái)是非常困難的。所以,當(dāng)你發(fā)現(xiàn)切片數(shù)量將超過(guò)6個(gè)時(shí),將其余不那么重要的分支整合歸為“其他”項(xiàng)。
c.盡量避免使用立體餅圖,除非你真的有信心避免視覺(jué)錯(cuò)覺(jué)。
如下圖所示,從受眾的角度看這張立體餅圖,是不是很難分清楚兩個(gè)占比最小的扇形究竟誰(shuí)大誰(shuí)???而如果我們采用“俯視”的視角看這張餅圖,就會(huì)好區(qū)分很多!
2. 項(xiàng)類對(duì)比
首先,我們需要明確項(xiàng)類對(duì)比的含義是什么,以及它指的對(duì)比維度是什么?一般來(lái)說(shuō),常見(jiàn)的維度對(duì)比無(wú)外乎數(shù)據(jù)大小、占比這兩類。而就圖表類型而言,項(xiàng)類對(duì)比最常用圖表類型為條形圖,下面我們來(lái)談一談條形圖使用的原則。
(1)符合嘗試的默認(rèn)排序(從大到小、從高到低、從好到差),除非你需要遵循其他邏輯排序
一般來(lái)說(shuō),人們看條形圖比較想要獲取的是頭部項(xiàng)類對(duì)比訊息,沒(méi)有人會(huì)特別注意尾部項(xiàng)類的占比和對(duì)比。所以為了迎合人們的閱讀習(xí)慣,我們需要按照從大到小、從高到低、從好到差的默認(rèn)條形圖排序?qū)崿F(xiàn)繪制。
當(dāng)然,遵循其他特定的邏輯排序也是可取的。例如,某公司對(duì)比業(yè)內(nèi)競(jìng)爭(zhēng)者市場(chǎng)占比時(shí),特意按照進(jìn)入市場(chǎng)的時(shí)間長(zhǎng)短進(jìn)行條形圖排序。如下所示,是按照品牌邏輯對(duì)條形圖進(jìn)行展示。
(2)條形圖間隔<條形圖本身寬度
麥肯錫條形圖的分類間距一般設(shè)置為本身寬度的20%-50%;而經(jīng)濟(jì)學(xué)人的分類間距則為50%-80%,保潔等大型公司的報(bào)表中也呈現(xiàn)10%-30%不等。如下所示,是經(jīng)濟(jì)學(xué)人一篇文章中的散點(diǎn)圖和條形圖。
雖然,間距不一,但不難發(fā)現(xiàn),業(yè)內(nèi)幾乎沒(méi)有分類間距>條形寬度本身的。
3. 時(shí)間序列、頻率分布
時(shí)間序列,顧名思義,就是一條時(shí)間線下數(shù)據(jù)類別、變量的變化;而頻率分布可能會(huì)稍微難懂一點(diǎn),但我相信看到下面這個(gè)例子,你就不陌生了!
相信大家大學(xué)上《概率論》的時(shí)候,都看過(guò)這個(gè)函數(shù)!概率密度函數(shù),沒(méi)錯(cuò),他就表示了頻率分布!
時(shí)間序列、頻率分布制圖時(shí),通常選取柱形圖、折線圖兩類,而這兩類值間應(yīng)該怎樣進(jìn)行選取呢?
在麥肯錫的《用圖表說(shuō)話》一書(shū)中,建議以8個(gè)時(shí)間點(diǎn)為區(qū)分界限,當(dāng)時(shí)間點(diǎn)>8時(shí),采用折線圖,減少視覺(jué)對(duì)比疲勞,當(dāng)時(shí)間點(diǎn)<8時(shí),選取柱形圖。以下是柱狀圖、折線圖兩種圖表的使用規(guī)則。
其次,柱狀圖和折線圖的選擇還和數(shù)據(jù)特征有關(guān),當(dāng)你想凸顯特定時(shí)間段內(nèi)產(chǎn)量、銷量等數(shù)據(jù)指標(biāo)的時(shí)間序列變化,用柱狀圖比較合適,因?yàn)樗€能夠凸顯程度、數(shù)量;而折線圖則更注重變化、變化趨勢(shì),在表現(xiàn)數(shù)據(jù)發(fā)展趨勢(shì)和時(shí)間序列預(yù)測(cè)分析中較為常用。
(1)柱形圖
a.柱形圖間隔<柱形圖本身寬度
這一點(diǎn)其實(shí)和條形圖類似,此處就不做贅述了
b.堆積柱狀圖使用有度,避免對(duì)比混亂
堆積柱狀圖適用于對(duì)比多個(gè)項(xiàng)目、類別的成分關(guān)系,是表達(dá)成分對(duì)比關(guān)系的重要方式。
但需要特別注意,百分比堆積圖盡量不要對(duì)比每個(gè)類項(xiàng)超出3個(gè)細(xì)分成分,否則會(huì)帶來(lái)對(duì)比混亂。如下所示,堆積柱狀圖的類項(xiàng)已然超過(guò)3個(gè),對(duì)比起來(lái)就會(huì)很混亂。
(2)折線圖
a.趨勢(shì)線要突出(顏色、粗細(xì)等)
折線圖是以上圖表中,最能夠直觀展示上升、下降、波動(dòng)、維持原狀趨勢(shì)的圖表,它側(cè)重于勾勒變化和變化趨勢(shì),用于表達(dá)數(shù)據(jù)的發(fā)展趨勢(shì)。
但,趨勢(shì)線作為折線圖中的主體,一定要突出。而這個(gè)突出,可以是顏色上的突出,使用紅色等重點(diǎn)色;也可以是粗細(xì)上的突出,比如,我們一定要注意到折線圖趨勢(shì)線比網(wǎng)格線、刻度線粗!
4. 相關(guān)性
相關(guān)性分析中,我們常使用散點(diǎn)圖直觀地顯示變量間的相關(guān)強(qiáng)度、相關(guān)方向,并用于探索性數(shù)據(jù)分析,做出擬合曲線和回歸方程,對(duì)未來(lái)趨勢(shì)進(jìn)行探索性預(yù)測(cè)。
(1)散點(diǎn)、氣泡圖
a.散點(diǎn)、氣泡大小需要直觀
人都是視覺(jué)動(dòng)物,而圖表需要做到就是把人的視覺(jué)利用到極致!散點(diǎn)圖、氣泡圖中,每一個(gè)散點(diǎn)、氣泡就代表著一個(gè)樣本個(gè)體,而散點(diǎn)、氣泡的大小就能只管的展示出該樣本的大小。所以,我們?cè)谥谱鲌D表時(shí),需要充分利用這一點(diǎn),用散點(diǎn)、氣泡大小直觀的展示樣本間的關(guān)系。
三、結(jié)語(yǔ)
以上,就是本期可視化圖表選取原則的全部?jī)?nèi)容!我們【這篇文章把數(shù)據(jù)講透了】系列到這里也就完結(jié)了!撒花!!
接下來(lái),你想看哪方面的文章呢?
#相關(guān)閱讀#
這篇文章把數(shù)據(jù)講透了(一):數(shù)據(jù)來(lái)源
這篇文章把數(shù)據(jù)講透了(二):數(shù)據(jù)采集
這篇文章把數(shù)據(jù)講透了(三):數(shù)據(jù)清洗
這篇文章把數(shù)據(jù)講透了(四):數(shù)據(jù)挖掘
這篇文章把數(shù)據(jù)講透了(五):數(shù)據(jù)可視化(上)
這篇文章把數(shù)據(jù)講透了(五):數(shù)據(jù)可視化(中)
本文由 @小陳同學(xué)ing. 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!