分析如烹飪:讓我們一起做數(shù)據(jù)大廚吧!
?編輯導(dǎo)語(yǔ):數(shù)據(jù)分析是有組織有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過(guò)程,整個(gè)過(guò)程比較復(fù)雜且繁瑣。本文作者巧妙地把數(shù)據(jù)分析的步驟類比為烹飪的每一步,以烹飪的形式來(lái)為大家講解一份數(shù)據(jù)分析報(bào)告。感興趣的朋友來(lái)看看吧。
還記得,指引我數(shù)據(jù)分析入門的那本書,它將數(shù)據(jù)分析的步驟類比為烹飪的每一步,形象而生動(dòng),讓我印象深刻。
選擇數(shù)據(jù)分析,是基于自己所在的行業(yè)以及自己與職業(yè)發(fā)展的契合度,一路走來(lái),踩過(guò)很多坑,但也收獲很多成功的喜悅,感謝遇見的每一位天使!
下面就請(qǐng)讓我以烹飪的形式來(lái)帶你做一份數(shù)據(jù)分析報(bào)告吧!
一、分析背景&數(shù)據(jù)來(lái)源(備料)
阿里作為國(guó)內(nèi)電商巨頭之一,其在快速發(fā)展的同時(shí)也面臨著諸多殘酷的競(jìng)爭(zhēng)。
電商平臺(tái)作為一個(gè)復(fù)雜的生態(tài)系統(tǒng),上有不斷入駐的品牌商家,下有體量龐大的消費(fèi)群體,身為銜接者,平臺(tái)肩挑重任并砥礪前行。
母嬰大類是平臺(tái)的重點(diǎn)類目,具有消費(fèi)者和使用者分離和購(gòu)買決策周期長(zhǎng)等特點(diǎn),本次分析以阿里母嬰大類的數(shù)據(jù)為主,通過(guò)SWOT分析確定本次分析背景,具體見下:
基于如上SWOT分析,我們需要進(jìn)一步用數(shù)據(jù)來(lái)論證平臺(tái)母嬰發(fā)展的現(xiàn)狀及其機(jī)遇,洞察機(jī)遇后該如何抓住風(fēng)口。
數(shù)據(jù)來(lái)源:阿里巴巴天池
https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
包含2張報(bào)表:產(chǎn)品信息表和消費(fèi)者信息表
報(bào)表的具體字段如下圖所示:
- 了解每一列的含義
- 數(shù)據(jù)分類,分為3大類:用戶、行為和產(chǎn)品
用戶數(shù)據(jù):用戶id、出生日期、性別;
行為數(shù)據(jù):用戶id、購(gòu)買數(shù)量、購(gòu)買時(shí)間;
產(chǎn)品數(shù)據(jù):物品編號(hào)、一級(jí)分類、二級(jí)分類、商品屬性。
二、分析目的
通過(guò)分析2012年7月至2015年2月的母嬰產(chǎn)品用戶數(shù)據(jù),能夠洞察母嬰大類發(fā)展現(xiàn)狀,找到現(xiàn)狀背后的原因,為平臺(tái)2015年的進(jìn)一步發(fā)展提出有效建議。
三、分析思路
首先,分析手頭2張報(bào)表:
- 根據(jù)報(bào)表的字段含義和記錄行數(shù)可以看出”產(chǎn)品信息表”是主表,”用戶信息表”是副表;
- 從整體與部分來(lái)看,”用戶信息表”中的用戶ID是”產(chǎn)品信息表”中用戶ID的部分,側(cè)面說(shuō)明用戶信息表是一個(gè)小的樣本集。
因此,本文的分析側(cè)重點(diǎn)在于”產(chǎn)品信息表”,”用戶信息表”可以起佐證作用。
其次,觀察”產(chǎn)品信息表”的統(tǒng)計(jì)周期起于2012年7月至2015年2月,以自然年作為篩選條件,12年和15年因數(shù)據(jù)信息不全,所以重點(diǎn)分析年份鎖定13年和14年。
再次,進(jìn)一步查看”產(chǎn)品信息表”的各個(gè)字段,可發(fā)現(xiàn)核心字段是【購(gòu)買數(shù)量】,由此可衍生出系列指標(biāo):年成交量和年成交量增速。
綜上,在分析的時(shí)間段和核心指標(biāo)確立后,可以針對(duì)【購(gòu)買數(shù)量】提出如下問(wèn)題:
- 2013年和2014年的年成交量是多少?
- 對(duì)比2013年,2014年的年成交量增速是多少?
通過(guò)初步數(shù)據(jù)驗(yàn)證,得出如下圖:
最后,明確問(wèn)題:
通過(guò)觀察產(chǎn)品信息表的2012年7月至2015年2月的母嬰大類銷售數(shù)據(jù),可發(fā)現(xiàn)與2013年相比,2014年年成交量增速達(dá)到49%,那么14年增長(zhǎng)的原因有哪些?
如果15年要持續(xù)增長(zhǎng),需從在哪些方面進(jìn)一步提升?
?由此,形成分析思路腦圖,見如下:
四、分析內(nèi)容(切配+烹飪+打荷)
根據(jù)年成交量=成交用戶數(shù)*人均成交量這個(gè)公式,對(duì)公式的組成元素進(jìn)行一步步拆解。
提出假設(shè)1:人均成交量的提升帶動(dòng)14年整體的成交量。
收集證據(jù):下圖是13年和14年的人均成交量隨時(shí)間變化的折線圖。
得出結(jié)論:從圖表可以看出,13和14年的人均成交量相減差值為0.05,幾乎可以忽略不計(jì),所以人均成交量提升帶動(dòng)年成交量的假設(shè)不成立。
提出假設(shè)2:成交用戶數(shù)的提升帶動(dòng)14年整體的成交量。
收集證據(jù):下圖是13年和14年的成交用戶數(shù)的柱形圖。
得出結(jié)論:從圖表可以看出,14年的成交用戶數(shù)的增速和14年的年成交量的增速趨勢(shì)相近,由此可以得出14年年成交量的提升來(lái)源于成交用戶數(shù)的增加,該假設(shè)成立。
緊接結(jié)論,進(jìn)一步分析【成交用戶數(shù)】的組成部分,即成交單筆用戶數(shù)和成交復(fù)購(gòu)用戶數(shù)。
因數(shù)據(jù)統(tǒng)計(jì)周期并不完整,為嚴(yán)謹(jǐn)起見,故本文沒有將單筆用戶數(shù)簡(jiǎn)單定義為新客。通過(guò)數(shù)據(jù)整理,得出下圖:
綜上,14年年成交總量的上升源于成交用戶數(shù)中單筆成交用戶數(shù)的貢獻(xiàn)。
由此引出,單筆用戶數(shù)增長(zhǎng)的原因有哪些?
?提出假設(shè)1:平臺(tái)提供的活動(dòng)促銷力度吸引大批具有折扣心智的用戶,并促使其轉(zhuǎn)化
收集證據(jù):活動(dòng)檔期可以通過(guò)月成交用戶數(shù)的波動(dòng)趨勢(shì)來(lái)挖掘,從而進(jìn)一步鎖定突出點(diǎn)的5月和11月,對(duì)比分析2年在相同月份上類似活動(dòng)的成交用戶數(shù)的差異是否明顯。
得出結(jié)論:活動(dòng)對(duì)用戶的吸引力確實(shí)很強(qiáng),比如上圖14年雙十一當(dāng)天的用戶數(shù)接近13年的2倍,也可以從側(cè)面說(shuō)明,具有活動(dòng)心智的人群更容易在活動(dòng)中被平臺(tái)轉(zhuǎn)化。
如有2013年和2014年的具體活動(dòng)檔期的話,可以進(jìn)一步論證假設(shè)成立。
提出假設(shè)2:平臺(tái)提供的產(chǎn)品種類更豐富,不斷上新能夠吸引大批用戶,并促使其轉(zhuǎn)化。
收集證據(jù):下面2圖基于產(chǎn)品信息表中的產(chǎn)品ID這一字段進(jìn)行分類統(tǒng)計(jì)對(duì)比,以確定平臺(tái)對(duì)產(chǎn)品種類的擴(kuò)充或迭代更新是否能吸引到有此需求的用戶人群。
14年成交種類數(shù)量=13年與14年共有產(chǎn)品種類+14新增成交種類
得出結(jié)論:產(chǎn)品種類的豐富能體現(xiàn)平臺(tái)運(yùn)營(yíng)能力的強(qiáng)弱,滿足更多用戶的需求是用戶數(shù)池子蓄水的必要條件。通過(guò)數(shù)據(jù)驗(yàn)證,假設(shè)成立,因分析數(shù)據(jù)時(shí)間段集中于13和14年,所以結(jié)論還需后續(xù)更多數(shù)據(jù)集進(jìn)行驗(yàn)證。
緊接產(chǎn)品豐富度的結(jié)論,下圖是對(duì)產(chǎn)品豐富度的進(jìn)一步拆分,見如下圖:
即將如何提升產(chǎn)品的豐富度拆解為如下2個(gè)問(wèn)題:
- 如何將產(chǎn)品系列做精?
- 如何將產(chǎn)品帶做寬?
無(wú)論是二級(jí)大類數(shù)量的不斷擴(kuò)充還是同一類別下子產(chǎn)品數(shù)量的增多,兩者都有利于擴(kuò)充平臺(tái)產(chǎn)品的豐富度,那么如果平臺(tái)在現(xiàn)有資源下只能優(yōu)先選擇一個(gè)方向的話,那么哪一個(gè)方向效果更佳呢?采用相關(guān)性分析,見下:
1. 產(chǎn)品水平方向擴(kuò)充(一級(jí)類目下二級(jí)類目數(shù)量增加)
2. 產(chǎn)品垂直體系擴(kuò)充(同一類別下產(chǎn)品數(shù)量增多)
綜上,相關(guān)系數(shù)對(duì)比顯示,擴(kuò)充產(chǎn)品垂直體系對(duì)于吸引更多用戶數(shù),促進(jìn)其轉(zhuǎn)化更為有效。
另外,由上述散點(diǎn)圖觀察可以發(fā)現(xiàn)存在部分異常值,如下圖:
分析可發(fā)現(xiàn),異常值與成交總量中存在批發(fā)訂單相關(guān),即存在小部分購(gòu)買數(shù)量超過(guò)10件以上的單筆訂單,具體占比見如下:
根據(jù)如上分析,可以明確”人”是一個(gè)關(guān)鍵要素,那么針對(duì)如何獲取更多的“人”,作為平臺(tái)方,2015年的持續(xù)增長(zhǎng)動(dòng)力來(lái)源于哪些方面?
接下來(lái),我開始重點(diǎn)分析開篇說(shuō)的副表:用戶信息表,通過(guò)拆解如何獲取更精準(zhǔn)的人這個(gè)問(wèn)題,可以產(chǎn)生如下子問(wèn)題:
消費(fèi)主力軍是誰(shuí)?
消費(fèi)能力怎么樣?
不同性別和年齡段對(duì)一級(jí)類目的傾向如何?
五、結(jié)論
對(duì)產(chǎn)品信息表分析,可得出如下結(jié)論:
14年年成交量增幅達(dá)到49%,其指標(biāo)上升源于用戶人數(shù)增加,對(duì)用戶人數(shù)進(jìn)一步分析可發(fā)現(xiàn)平臺(tái)具有拉新能力強(qiáng),復(fù)購(gòu)率低的顯著特征;
因現(xiàn)有數(shù)據(jù)報(bào)表較少,不足以論證復(fù)購(gòu)率低的原因,根據(jù)人均銷量可猜測(cè)復(fù)購(gòu)率與平臺(tái)銷售商品相關(guān),比如商品十分耐用,或者在使用上更趨向于一次性;
拉新能力強(qiáng)體現(xiàn)在單筆成交用戶占比99%+,通過(guò)對(duì)單筆用戶數(shù)的購(gòu)買行為數(shù)據(jù)分析,可發(fā)現(xiàn)受活動(dòng)吸引力度和產(chǎn)品豐富度的有效影響;
具體分析13和14年的活動(dòng)特征顯著月份,以5月和11月的2個(gè)活動(dòng)高峰點(diǎn)為佐證,發(fā)現(xiàn)用戶數(shù)在14年活動(dòng)當(dāng)天的成交人數(shù)遠(yuǎn)遠(yuǎn)高于13年同時(shí)間段,甚至達(dá)到翻倍的效果,可見具有聚劃算等活動(dòng)心智的用戶更容易被平臺(tái)獲取轉(zhuǎn)化;
產(chǎn)品豐富度是一個(gè)平臺(tái)持續(xù)擴(kuò)張運(yùn)營(yíng)的核心指標(biāo),通過(guò)相關(guān)性分析,平臺(tái)招募更多商家或開發(fā)更多產(chǎn)品系列都能促進(jìn)用戶的下單轉(zhuǎn)化。相關(guān)分析顯示,平臺(tái)在一個(gè)細(xì)分類目下提供更多產(chǎn)品數(shù)量,可以減少用戶的跳失。
六、建議
根據(jù)以上結(jié)論,在利用AARRR模型和回歸分析的基礎(chǔ)上,分別提出如下的建議:
1. AARRR模型
找對(duì)人,多留人,提收入,擴(kuò)規(guī)模。
獲取精準(zhǔn)客群:
在較低成本下大量獲取的人群畫像是:
0-3歲之間的男童和女童,女童優(yōu)先級(jí)更高,精準(zhǔn)人群獲取方式上可采用推送高相關(guān)性類目的銷量Top3產(chǎn)品來(lái)吸引,比如對(duì)0-3的女童,推送”50014815”的Top3銷量產(chǎn)品廣告圖來(lái)投放吸引。
激活&留存:
活動(dòng)是吸引拉新和刺激復(fù)購(gòu)的有效措施,平臺(tái)可以通過(guò)增加活動(dòng)檔期和活動(dòng)的互動(dòng)玩法等形式。
推薦:
平臺(tái)可以鼓勵(lì)商家采用會(huì)員制或者老帶新的措施,增強(qiáng)用戶黏性。
2. 回歸分析
可以預(yù)測(cè)2015的銷量,從而調(diào)整和優(yōu)化各部門的KPI指標(biāo)。
圖片來(lái)源于網(wǎng)絡(luò)
如上圖,可以根據(jù)2015年的總成交量目標(biāo)拆解到各個(gè)一級(jí)類目的目標(biāo),同時(shí)也可以從產(chǎn)品角度確定研發(fā)和迭代多少款產(chǎn)品。
以上是我做的數(shù)據(jù)分析報(bào)告,歡迎交流探討!
作者:鯨歌,電商行業(yè)數(shù)據(jù)分析師,為頭部品牌提供數(shù)據(jù)咨詢服務(wù),熱衷學(xué)習(xí)與分析,“數(shù)據(jù)人創(chuàng)作者聯(lián)盟”成員。
本文由@一個(gè)數(shù)據(jù)人的自留地 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Pexels,基于CC0協(xié)議。
寫的很專業(yè)