七種常見的數(shù)據(jù)分析方法拆解,打工人必備|6000字解析
編輯導語:數(shù)據(jù)分析是用適當?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行分析,將它們加以匯總和理解并消化,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。本文作者分享了七種常見的數(shù)據(jù)分析方法拆解。推薦工作中需要數(shù)據(jù)分析的用戶閱讀。
數(shù)據(jù)分析一直是我們互聯(lián)網(wǎng)人辨別方向的不二法門,我們通過對數(shù)據(jù)的觀測來判斷事物的發(fā)展趨勢,也常常利用數(shù)據(jù)的思維來辯證的為決策做參考。
下面就給大家詳細拆解七種常見的數(shù)據(jù)分析,讓我們的數(shù)據(jù)分析少走彎路。
一、象限分析法
從這張圖,你能分析出來什么呢?
X軸從左到右是點擊率的高低,Y軸從下到上是轉(zhuǎn)化率的高低,形成了4個象限,這就是我們要說的象限分析法。針對每次營銷活動的點擊率和轉(zhuǎn)化率找到相應的數(shù)據(jù)標注點,然后將這次營銷活動的效果歸到每個象限,4個象限分別代表了不同的效果評估。
- 象限一:高點擊高轉(zhuǎn)化,點擊高代表營銷創(chuàng)意打動了受眾,轉(zhuǎn)化高代表被打動的受眾是產(chǎn)品的目標用戶;
- 象限二:高轉(zhuǎn)化低點擊,同樣的,高點擊代表被打動的受眾是產(chǎn)品的目標用戶,但低點擊代表的是營銷創(chuàng)意沒有打動用戶;
- 象限三:低點擊低轉(zhuǎn)化,這個象限是最糟糕的營銷活動了,投放廣告點擊少,點擊用戶轉(zhuǎn)化低,創(chuàng)意無效,用戶不精準;
- 象限四:高點擊低轉(zhuǎn)化,這個象限的營銷活動要給策劃和文案加雞腿,但就要給渠道扣績效了。這種象限的營銷活動一定程度上有標題黨的嫌疑。
1. 象限分析法的作用
(1)找到問題的共性原因
通過象限分析法,將有相同特征的事件進行歸因分析,總結(jié)其中的共性原因。例如案例中第一象限的事件可以提煉出有效的推廣渠道與推廣策略,第三和第四象限可以排除一些無效的推廣渠道;
(2)建立分組優(yōu)化策略
針對投放的象限分析法可以針對不同象限建立優(yōu)化策略,例如提升象限二的投放創(chuàng)意,象限四的投放渠道。
二、公式拆解法
1. 什么是公式拆解分析法
所謂公式拆解法就是針對某項指標,用公式表現(xiàn)該指標的影響因素,例如日銷售額的影響因素是各商品的銷售額,找到影響因素后,需要對影響因素的影響因素進行拆解。
看這張圖,以日銷售額為例做了一次公式拆解分析,這次拆解一共包括了5層,最后一層是對推廣效果的衡量。
第一層:找到日銷售額的影響因素:
日銷售額=各商品的銷售額之和,也可以拆解為各渠道的銷售額之和、各銷售人員的銷售業(yè)績之和。公式拆解分析法的第一步是需要確定要分析的指標,然后找到這個指標的直接影響因素。
第二層:找到各商品銷售額的影響因素:
各商品銷售額=銷售數(shù)量*單價。
第二層拆解需要找到影響目標指標的影響因素,例如各商品銷售額的影響因素是商品的銷量和單價,這里是簡單舉例算法,在實際分析中,還需要計算優(yōu)惠政策等因素。
第三層:找到銷售數(shù)量的構(gòu)成因素:
銷售數(shù)量=店鋪新客購買數(shù)量+店鋪老客購買數(shù)量+復購用戶購買數(shù)量。
這里對銷售數(shù)量的拆解是針對購買人群的特征來劃分的,這樣分析的目的在于找出不同客群的購買影響因素。而在實際應用中,因分析目的的不同,對指標影響因素的拆解也不同,例如銷售數(shù)量可以拆解為渠道A銷量+渠道B銷量+渠道C銷量。
第四層:找到新客的來源:
店鋪新客購買數(shù)量=渠道A轉(zhuǎn)化新客購買數(shù)量+渠道B轉(zhuǎn)化新客購買數(shù)量+渠道C轉(zhuǎn)化新客購買數(shù)量+……
這樣拆分的目的在于找出不同渠道來源用戶的后續(xù)轉(zhuǎn)化特征,從而找到購買力高的用戶來源渠道。
第五層:計算渠道推廣回報:
渠道推廣回報的計算方式就是A渠道新客銷售額-推廣成本。
從日銷售額拆解到最后一步,是拆解出了對渠道推廣效果的分析,這是對店鋪新客的拆解,那么同樣,也可以對店鋪老客或者復購客戶進行拆解,例如復購用戶可以拆解出復購周期、復購次數(shù)、累計復購數(shù)量等因素,對復購用戶給予特殊購買通道或提供有約束力的購買政策,例如年卡之類的。
公式拆解法是針對問題的層級式解析,在拆解之前,不能盲目拆解,需要有目的性的找方向,從而挖掘原因。例如在上文案例的拆解過程中,拆解方向可以分為兩種,一種是對績優(yōu)指標的拆解,找出銷售額上漲的原因,另一種是對績劣指標的拆解,找出銷售額下降的原因。
三、對比分析法
1. 什么是對比分析法
上面這張圖表是一個常見的柱狀圖,而柱狀圖的作用在于直觀對比各項數(shù)據(jù)之間的差異。
上面這張柱狀圖是針對9月份各渠道獲客統(tǒng)計的一個對比分析圖表,針對各渠道的下載量、訪問量、注冊量進行對比。
對比要點一:對比建立在同一標準維度上。
在這張圖中,首先要關(guān)注到的對比要點是各項數(shù)據(jù)的對比要基于同一維度。這張圖是針對9月份的渠道推廣效果的對比統(tǒng)計,9月份就是第一個對比標準,也就是時間維度。
在時間維度下,后續(xù)對比的結(jié)果都是基于這個標準產(chǎn)生的,也就是在9月份這個時間范圍內(nèi)的數(shù)據(jù)對比,并不能用10月份的數(shù)據(jù)與這個圖表中的數(shù)據(jù)對比。當然,除了時間維度,也可以使用空間維度,例如渠道A在1-12月每月的數(shù)據(jù)對比。無論用什么維度,對比要建立在一個大的標準下。
對比要點二:拆分出相關(guān)影響因素。
在時間這個大維度下,我們對各渠道的獲客效果進行了拆分,也就是將獲客效果衡量分為了訪問量、下載量和注冊量。這三個維度的數(shù)據(jù)作為判斷渠道獲客的標準,從對比中找出各渠道的優(yōu)劣。
例如通過這個圖表可以看出,渠道A的訪問量最高,渠道B的下載量最高,渠道A的注冊量最高,那么這樣的對比結(jié)果能夠說明什么問題呢?我們能夠看到,渠道A從訪問到下載的流失比較嚴重,渠道B從下載到注冊的流失比較嚴重,而渠道C在訪問量、下載量都低于其他渠道的基礎(chǔ)上,渠道C的注冊量與渠道A并沒有相差太多。
也就是說,我們可以提出一個假設(shè),渠道C的獲客效果更好,為了印證這個假設(shè),我們可以在影響因素中再加入渠道投放花費這個維度,如果渠道A的高訪問是因為高花費,渠道C的低訪問是因為低花費,那么基本可以印證這個假設(shè)。
對比要點三:各項數(shù)據(jù)對比需要建立數(shù)據(jù)標準。
在這張圖中能夠看到一個比較奇怪的現(xiàn)象,渠道B的下載量比訪問量還要高,為什么會這樣呢?
我們在這張圖表中加入了一個中間標準數(shù)據(jù),對各項數(shù)據(jù)進行了一次標準換算。假設(shè)訪問量的真實數(shù)據(jù)為1萬是,標準數(shù)據(jù)為1,下載量的真實數(shù)據(jù)為1千時,標準數(shù)據(jù)為1,注冊量的真實數(shù)據(jù)為100時,標準數(shù)據(jù)為1。
經(jīng)過標準數(shù)據(jù)的換算,我們將各項數(shù)據(jù)放在一張圖表上時,對比的差異化會更明顯。
對比分析法的維度可以分為同比、環(huán)比、定基比等不同的對比方法:對比分析在于看出基于相同數(shù)據(jù)標準下,由其他影響因素所導致的數(shù)據(jù)差異,而對比分析的目的在于找出差異后進一步挖掘差異背后的原因,從而找到優(yōu)化的方法。
四、可行域分析
1. 什么是可行域分析
上方左側(cè)圖是一張福格模型的圖,福格大哥將影響用戶行為動機的因素拆分為mat三個因素。
m是付出行動的動機,a是付出行動的能力,t是觸發(fā)行動的條件,簡單理解就是大眾只對自己感興趣并且有能力滿足的事物會產(chǎn)生下一步行為。
比如新iphone賣1萬,大多數(shù)人是買的起的,這就有了付出行動的能力,而產(chǎn)生行為的動機就取決于新iphone的創(chuàng)新能力,當喬布斯從文件袋里掏出ipad的時候,將大家的動機調(diào)動到了最高點,但價格限制了一部分人付出行動的能力。
動機越高,需要付出的能力越低,形成的有效觸發(fā)區(qū)域就越廣,福格模型的觸發(fā)有效區(qū),我們就將其稱之為可行域。
2. 可行域分析的應用
看上方右側(cè)圖表是針對推廣創(chuàng)意做的一次象限分析,橫軸代表點擊量的從低到高,縱軸代表轉(zhuǎn)化率的從低到高。
而點擊率代表的營銷創(chuàng)意的有效性,轉(zhuǎn)化率代表的是推廣渠道的精準性,在這張圖表上我們分成了4個象限,但同樣是高點擊、高轉(zhuǎn)化的象限中,也有具體數(shù)據(jù)的差別。諸葛io-專注于用戶行為分析首先我們看到2條紅色的曲線,在高點擊和高轉(zhuǎn)化的區(qū)域中我們畫了一條紅色曲線,這條曲線上方是“高可行域”,曲線下方是低可行域;而在低轉(zhuǎn)化與低點擊的象限中我們也畫了一條曲線,這條紅色曲線的下方是最不可行域。
什么意思呢?
其實就是對點擊率和轉(zhuǎn)化率的高低做了一個細化分層,點擊率和轉(zhuǎn)化率是每一次推廣創(chuàng)意的數(shù)據(jù)化表現(xiàn),而畫出一個可行域,是對營銷活動的歸類。
那么這條曲線到底要畫在什么樣的數(shù)據(jù)標簽上?
這需要在實際分析工作中做總結(jié),也就是說,可行域分析實際上是一種自己建立的數(shù)據(jù)分析模型,根據(jù)具體數(shù)據(jù)不斷修正調(diào)整可行域的范圍,對業(yè)務(wù)指標進行有效評價。
除了兩條紅色曲線外,還有兩條藍色曲線,一條是渠道可行域,另一條是創(chuàng)意可行域,這兩條曲線是對渠道有效性和創(chuàng)意有效性的評價,滿足相應區(qū)域條件的事件即可作為有效事件經(jīng)驗,為后續(xù)的運營增長提供支持。
五、二八分析法
經(jīng)濟學定律中說80%的財富掌握在20%的人手中,而在運營中可以發(fā)現(xiàn),80%的貢獻度來自于20%的用戶。
這張圖中體現(xiàn)了2個法則,也就是二八法則和長尾理論,在數(shù)據(jù)分析中,建議將這個兩個理論合起來用。
但實際上呢,二八法則和長尾理論是相對的,二八法則告訴我們說,你要重視頭部用戶,也就是能產(chǎn)生80%收益的那20%的用戶或商品,而長尾理論告訴我們說要重視長尾效應,也就是剩余那20%的收益。
1. 在數(shù)據(jù)分析中二八法則的應用
在數(shù)據(jù)分析中,二八法則和長尾理論和應用于用戶分析和業(yè)務(wù)分析2個方面:
(1)20%的頭部用戶:憑什么那么優(yōu)秀
在用戶分析上,通過二八法則建立用戶分群,將所有用戶切割成一個又一個的實驗組,對實驗組的用戶進行單體特征分析,目的只有一個,同樣都是用戶,憑什么你們那么優(yōu)秀?
在數(shù)據(jù)分析中,單體分析與群體特征分析同樣重要,然而我們不可能對上萬的用戶進行個體分析,可能的是對頭部用戶進行個體行為分析,建立群體樣本。
在運營數(shù)據(jù)分析中,可以針對核心指標分別找到20%的用戶:
- 購買數(shù)量前20%的用戶
- 購物金額前20%的用戶
- 日訪問次數(shù)前20%的用戶
- 訪問頁面數(shù)量前20%的用戶
- 轉(zhuǎn)發(fā)次數(shù)前20%的用戶
- ……
也就是說,你想提升什么指標,就找到這個指標表現(xiàn)優(yōu)秀的用戶。那么20%的用戶也很多怎么辦呢?可以主動設(shè)置數(shù)據(jù)區(qū)間。
例如想要提升用戶的訪問時長,我們可以對頭部用戶的訪問內(nèi)容、路徑進行分析找到原因,20%的頭部用戶訪問時長從10分鐘到30分鐘不等,那么我們可以將頭部用戶的訪問市場切分為10分鐘、15分鐘、20分鐘、25分鐘、30分鐘,獲得不同的用戶組,從這個用戶組中找到相應的20%的用戶進行特征分析。
這里需要注意的是,同組20%用戶的特征提升只對同組剩余80%的用戶有效,例如訪問時長10-15分鐘的用戶中,頭部20%的用戶的行為特征可以對剩余80%的用戶起效,但對日訪問5分鐘的用戶效果并不大。
(2)20%的頭部業(yè)務(wù):帶頭大哥的應有覺悟
針對業(yè)務(wù)分析的目的在于找到爆款內(nèi)容的特征。
例如資訊類產(chǎn)品中對閱讀量頭部文章的分析,一方面是對文章的特征進行分析,另一方面,是對閱讀用戶的分析。
爆款文章或商品背后,代表的是對大多數(shù)用戶興趣的滿足,充分喚起了用戶的行為動機,而在用戶分析中,我們需要進一步找到這部分用戶日常閱讀的頭部內(nèi)容,進行特征的延展分析。
六、假設(shè)分析法
1. 什么是假設(shè)分析法
舉個栗子:
“小明和媽媽買了10本書,正好花了100塊錢,書的單價有8塊錢和13塊錢2種,那么8塊錢的書和13塊錢的書各買了幾本?
解題思路:
首先,假設(shè)這10本書都是8塊錢買的,那么10本書一共是80塊錢,那還多出來20塊錢,是算錯賬了么?不是,顯然多出來那20是13塊錢1本的書多出來的。13塊錢的書比8塊錢的書每本多了5塊錢,20塊錢可以買4本,那么可以得出結(jié)論了,13塊錢的書有4本,那么8塊錢的書有幾本呢?
對了,6本。
這道6年級的數(shù)學題里就用到了假設(shè)法,假設(shè)所有書都是8塊錢,那么在數(shù)據(jù)分析中,什么是假設(shè)法呢?簡單理解,假設(shè)法是在已知結(jié)果數(shù)據(jù),在影響結(jié)果的多個變量中假設(shè)一個定量,對過程反向推導的數(shù)據(jù)分析方法。
2. 假設(shè)法在運營分析中的應用
假設(shè)法在運營分析中最常見的有2種場景:
場景一:已知結(jié)果找原因,做過程變量假設(shè)。
例如:某內(nèi)容社區(qū)在11月份的發(fā)帖數(shù)相比10月份下降了20%,針對這個結(jié)果,該如何分析原因?
面對這樣一個無厘頭的問題,該怎么分析呢?結(jié)果數(shù)據(jù)是發(fā)帖數(shù)下降了20%,那么影響發(fā)帖數(shù)的有哪些因素呢?
我們可以將發(fā)帖數(shù)量按照用戶分層進行拆分,例如老用戶發(fā)帖數(shù)量和新用戶發(fā)帖數(shù)量,也可以按照具體發(fā)帖篇數(shù)進行拆分,例如發(fā)帖5篇以上的用戶,發(fā)帖3-5篇的用戶,發(fā)帖1-3篇的用戶,拆分后將11月與10月份相同維度的數(shù)據(jù)進行對比,找出變量。
例如經(jīng)過拆解后發(fā)現(xiàn),發(fā)帖1-3篇的用戶相比10月份減少了40%,其他篇數(shù)的用戶量還高于10月份,那么問題就出在了發(fā)帖1-3篇的用戶身上。
那么發(fā)帖1-3篇的用戶為什么減少了呢?我們可以提出2個假設(shè):
- 假設(shè)10月份發(fā)帖1-3篇的用戶成長為更加活躍的用戶了,造成發(fā)帖3-5篇的用戶增加,1-3篇的用戶減少;
- 假設(shè)10月份發(fā)帖1-3篇的用戶流失率比較高,同時11月份新用戶轉(zhuǎn)化少,導致這一群組用戶數(shù)量變少。
那么針對這2個假設(shè),需要對10月份發(fā)帖1-3篇的用戶與11月份發(fā)帖3-5篇及5篇以上的用戶進行追蹤分析,同時分析11月份新增用戶與10月份新增用戶在留存和活躍上的對比。
場景二:已知目標找過程,做結(jié)果假設(shè)。
例如:12月份的銷售KPI為1000萬,環(huán)比11月份上升20%,該如何做一份銷售方案?
這是在做工作計劃時最常見的需求,以12月份需要達成1000萬的銷售KPI為例,拆分銷售KPI的相關(guān)影響因素,同樣有2個拆解維度:
(1)從商品角度做拆分
要達成1000萬的銷售額,有多種假設(shè)方式,例如假設(shè)現(xiàn)有商品銷售額與11月相同,新品銷售額達到200萬,那么為了實現(xiàn)這個結(jié)果假設(shè),去做能夠支持200萬銷售額的的過程方案,例如在推廣渠道預算上、倉儲物流上、人力配置上等方面做計劃;還可以針對幾款產(chǎn)品提出銷售額增長的假設(shè);
(2)從人群角度做拆分
要達成1000萬的銷售額,一方面挖掘老客戶的購買力,另一方面增加新客戶的來源渠道,假設(shè)老用戶復購銷售500萬,那么針對老用戶設(shè)計營銷活動。
假設(shè)分析法是在現(xiàn)實應用中常用的數(shù)據(jù)分析思路之一,數(shù)據(jù)分析的過程是不斷的提出假設(shè)、驗證假設(shè)的過程,通常我們遇到的不知道如何下手的數(shù)據(jù)分析,可以通過假設(shè)法來破局。
七、同期群分析
簡單來說,就是將?戶進?同期群劃分后,對?不同同期群組?戶的相同指標就叫同期群分析。
1. 同期群分析的作用
例如:9月份新增用戶10萬人,10月份新增用戶15萬人,但9月份新增用戶的30日留存用戶為1萬人,10月份新增用戶的30日留存用戶也為1萬人,哪個月的運營業(yè)績更好呢?
通過同期群分析,我們可以發(fā)現(xiàn)9月份和10月份新增用戶的留存用戶是相同的,那么9月份的留存率更高,從用戶質(zhì)量角度考慮,9月份的運營成果更好,從有效用戶角度考慮,2個月的運營成果相同,從新增用戶角度考慮,10月份的運營成果更好。
同期群分析的目的在于透過現(xiàn)象找到結(jié)果,以時間維度建立同期群,除按時間維度考慮,也可以對來源渠道等維度建立同期群。
以上是七種比較常見的數(shù)據(jù)分析法,只是一些基本的入門概念,希望有一點點幫助。
至于在實際工作中如何運用,是一件很復雜很困難的事,需要將這些方法適配到自己所在的業(yè)務(wù),甚至需要根據(jù)實際業(yè)務(wù)進行一些修改,這都需要很多的實踐和思考。
我國的互聯(lián)網(wǎng)時代剛剛完成野蠻生長的階段,大家對流量的獲取已經(jīng)有所理解和應用,但在互聯(lián)時代的后半場,對數(shù)據(jù)的理解和應用將成為制勝的關(guān)鍵。
我始終認為互聯(lián)網(wǎng)行業(yè)的未來在運營,運營的未來則在精細化運營和有效的數(shù)據(jù)分析管理,持續(xù)學習,讓我們工作用數(shù)據(jù)說話。
本文由 @諸葛io 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
有個疑問哦,復購用戶不就是老客嗎?
二八法則和長尾理論是相對的,文章解釋的很到位