做好數(shù)據(jù)分析的6步曲
本文將圍繞實(shí)際的數(shù)據(jù)分析步驟,細(xì)化地來講講具體是如何進(jìn)行分析。
美國前郵政部長,美國百貨商店之父,約翰·華納梅克(John Wanamaker)感嘆到:“我在廣告上的投資有一半是無用的,但是問題是我不知道是哪一半。”
這種類似的感嘆現(xiàn)在也經(jīng)常發(fā)生我們身邊。
小A同學(xué):在項(xiàng)目結(jié)束后,拿到了項(xiàng)目數(shù)據(jù),看看自己的方案是否有帶來數(shù)據(jù)上的增長,但面對一堆面前Excel表里一堆密密麻麻的數(shù)字,卻不知從何下手了……
小B同學(xué):拿到了自己花大精力投入的項(xiàng)目數(shù)據(jù),滿懷期待的想來驗(yàn)證自己在項(xiàng)目中推動落地的好幾個(gè)方案,還把項(xiàng)目過往數(shù)據(jù)也找來進(jìn)行對比,一頓操作猛如虎之后,看到整體數(shù)據(jù)上漲了,但因?yàn)橛绊懸蛩靥貏e多,具體是哪些方案產(chǎn)生了作用卻無從知曉……
我們更常遇到的情況是不知道該如何去運(yùn)用數(shù)據(jù),讓數(shù)據(jù)帶來實(shí)際上的作用。在上一篇文章《如何用數(shù)據(jù)指導(dǎo)設(shè)計(jì)?》中,已經(jīng)闡述了設(shè)計(jì)師看數(shù)據(jù)的價(jià)值、數(shù)據(jù)是什么、何時(shí)看數(shù)據(jù)、以及數(shù)據(jù)指導(dǎo)設(shè)計(jì)的一些基本思路。本文將圍繞實(shí)際的數(shù)據(jù)分析步驟,更細(xì)化地來講講具體是如何進(jìn)行下去的。
一、數(shù)據(jù)分析6步曲
數(shù)據(jù)分析主要分為6大步驟:構(gòu)建X問題 – 提出假設(shè)&選擇指標(biāo) – 數(shù)據(jù)采集與整理 – 數(shù)據(jù)分析 – 數(shù)據(jù)呈現(xiàn) – 提出后續(xù)建議。
下文將圍繞這6步詳細(xì)講解每一步具體是如何做的:
1.1 構(gòu)建X問題
從本質(zhì)上來說,數(shù)據(jù)分析的最終目的在于解決問題。帶著不同的出發(fā)點(diǎn)得到的數(shù)據(jù)結(jié)果可能會很不一樣。所以,一切分析的開始必須要先識別要解決的重要問題是什么,以及這個(gè)問題為什么是最重要的。這兩個(gè)問題將引導(dǎo)我們進(jìn)入構(gòu)建問題的過程,也就是明確數(shù)據(jù)分析的目的。
(1)從哪入手:
①有預(yù)判類的分析,可以從已有的策略方案出發(fā),尋找相應(yīng)定量衡量方法。例如:嘗試通過強(qiáng)化某促銷A頁面利益點(diǎn)等相關(guān)信息,從而促進(jìn)用戶購買,此案例則可以直接預(yù)設(shè)X問題為:“強(qiáng)化利益信息是否可以提升轉(zhuǎn)化率”。
②而無預(yù)判類(發(fā)現(xiàn)問題或機(jī)會)的分析,構(gòu)建問題的起點(diǎn)往往是業(yè)務(wù)角度的商業(yè)目標(biāo),通過指標(biāo)拆解、經(jīng)驗(yàn)判斷、橫向?qū)Ρ取⑦壿嬐茖?dǎo)等方式來尋找有效的實(shí)現(xiàn)方式。例如:某電商促銷頁面B的核心目標(biāo)是“提升GMV(銷售額)”,而GMV=流量*轉(zhuǎn)化率*客單價(jià),就可以圍繞提升轉(zhuǎn)化率、客單價(jià)等指標(biāo)出發(fā)去尋找解決方案。
(2)判斷是否重要
①有預(yù)判類的的問題,可以直接尋找指標(biāo)評估驗(yàn)證結(jié)果是否可靠即可。
②無預(yù)判類(發(fā)現(xiàn)問題或機(jī)會)的則可以通過評估該問題解決后,能夠?qū)ψ钪匾纳虡I(yè)目標(biāo)帶來的增益會有多大。例如,上述提升GMV的案例中,通過橫向?qū)Ρ认嗤愴撁娴臄?shù)據(jù),發(fā)現(xiàn)此頁面的轉(zhuǎn)化率為1.8%,明顯低于同類頁面4.7%的轉(zhuǎn)化率,而流量和客單價(jià)與同類頁面基本持平,故判斷轉(zhuǎn)化率極有可能是“提升GMV(銷售額)”的關(guān)鍵點(diǎn),所以可定義“提升轉(zhuǎn)化率的關(guān)鍵因素是什么”為此頁面數(shù)據(jù)分析的重要問題。
(3)定義X問題
可以根據(jù)不同的類型用一個(gè)問句來表達(dá),如何/哪種/是否/原因是什么……。根據(jù)經(jīng)驗(yàn),細(xì)化之后的常見問題有以下幾類,每類都可以用一個(gè)X問題來描述。
- 實(shí)驗(yàn)驗(yàn)證類,已經(jīng)有了假設(shè)和方案,待驗(yàn)證效果,如ABC三種策略,哪種效果更有利于提升轉(zhuǎn)化率或策略A是否有助于提升轉(zhuǎn)化率。
- 尋找原因類,看到了某現(xiàn)象,希望尋找背后的原因,如導(dǎo)致跳失率急劇上升的原因是什么。
- 結(jié)果呈現(xiàn)類,不帶預(yù)判的呈現(xiàn)事實(shí),如通過數(shù)據(jù)呈現(xiàn)項(xiàng)目D的轉(zhuǎn)化與售賣情況。
- 預(yù)測類,通過尋找事物發(fā)生的規(guī)律,來預(yù)測接下來可能發(fā)生的事件,如一年之中用戶購買美妝用品是否存在時(shí)間上的購買規(guī)律,美妝類目運(yùn)營可依據(jù)此規(guī)律來制定年度活動計(jì)劃。
(4)注意,問題的范圍不可過于寬泛
往往要得出一個(gè)可靠且明確的結(jié)論,會需要收集數(shù)據(jù)并將數(shù)據(jù)應(yīng)用到一個(gè)可檢驗(yàn)的假設(shè)身上。如果問題太寬泛,數(shù)據(jù)收集就會變得非常困難,舉個(gè)反例:“項(xiàng)目D的數(shù)據(jù)效果是否有變好”,這個(gè)例子中,“是否有變好”可能的方向有拉新效果是否有變好/銷售是否有變好/跳失情況有變好……
非常多種方向,每個(gè)方向都做探索將使你本次分析駛?cè)霟o邊大海迷失方向。但也不要過早地限制問題范圍,剛開始時(shí),可以開放性地思考問題,在腦中形成一些可供選擇的方向。例如:“可能帶來D項(xiàng)目的銷售變好的可能情況是1、2、3,通過初步數(shù)據(jù)來看3的可能性會更高一些”,然后就可以往3的方向深入分析下去了。
1.2 提出假設(shè),選擇指標(biāo)
在上一步中,我們已經(jīng)明確了X問題,即數(shù)據(jù)分析的目標(biāo)。接下來,我們將圍繞X問題,提出該問題的結(jié)論假設(shè),并建立模型(選擇衡量指標(biāo))來驗(yàn)證假設(shè)是否成立。
1.2.1 提出假設(shè)
針對有預(yù)設(shè)的問題,假設(shè)可以直接來源于問題,如方案A有助于提升轉(zhuǎn)化率。對于沒有實(shí)現(xiàn)預(yù)設(shè)的問題,則需要我們圍繞問題進(jìn)行窮舉可能的假設(shè),如頁面E的跳失率急劇下降,可能原因有:
- 流量來源的用戶質(zhì)量變差了;
- 流量入口放錯了信息,導(dǎo)致用戶進(jìn)入后預(yù)期不符;
- 首屏商品選品問題;
- 首屏信息設(shè)計(jì)用戶無法理解/無吸引力;
- 頁面加載出現(xiàn)問題等。
1.2.2 根據(jù)假設(shè),選擇衡量指標(biāo)
不同類型的假設(shè),衡量方式會不一樣,有些假設(shè)可能還需要定性調(diào)研配合來驗(yàn)證。在電商定量數(shù)據(jù)范圍來看,可以參考以下思路:
- 關(guān)于流量的假設(shè),可選取流量相關(guān)的指標(biāo)如瀏覽UV/PV、各渠道流量來源UV/PV。
- 關(guān)于銷售類的假設(shè),可選取訂單相關(guān)的指標(biāo),如引入訂單金額、引入訂單數(shù)量、轉(zhuǎn)化率、UV價(jià)值。
- 關(guān)于用戶行為的假設(shè),可以選取頁面操作相關(guān)的指標(biāo),如點(diǎn)擊UV/PV、頁面點(diǎn)擊率、曝光點(diǎn)擊率、人均點(diǎn)擊次數(shù)、瀏覽深度等。
- 關(guān)于用戶人群的假設(shè),可以選取用戶畫像數(shù)據(jù),如:性別、年齡、城市線級、新老用戶等,且可同時(shí)結(jié)合頁面操作數(shù)據(jù)進(jìn)行細(xì)化人群行為分析。
1.3 數(shù)據(jù)采集與整理
數(shù)據(jù)源分為定量數(shù)據(jù)和定性數(shù)據(jù),定性數(shù)據(jù)更偏用研方法,本文將注重講定量數(shù)據(jù)的采集與整理。
1.3.1 數(shù)據(jù)采集
各平臺的原始數(shù)據(jù)正在進(jìn)入指數(shù)級爆炸的階段,僅從電商平臺來看,各類數(shù)據(jù)指標(biāo)都非常的多而復(fù)雜。在采集之前的一個(gè)階段,必不可少的是與數(shù)據(jù)產(chǎn)品或開發(fā)人員明確:
- 數(shù)據(jù)指標(biāo)的計(jì)算規(guī)則。
- 需要的數(shù)據(jù)指標(biāo)列表(包括對應(yīng)的時(shí)間段、平臺端),防止等到要提數(shù)的時(shí)候結(jié)果發(fā)現(xiàn)沒有數(shù)據(jù) 或者數(shù)據(jù)計(jì)算方式不合理。
1.3.2 數(shù)據(jù)整理
數(shù)據(jù)整理的第一步是數(shù)據(jù)清洗,原始的數(shù)據(jù)表往往含有不少臟數(shù)據(jù),如測試數(shù)據(jù)、異常值、空缺等等,直接用來計(jì)算分析可能會導(dǎo)致數(shù)據(jù)結(jié)論有偏差或無法計(jì)算。數(shù)據(jù)清洗就是要將原始數(shù)據(jù)表處理成可方便計(jì)算分析的干凈整潔的數(shù)據(jù)表。
主要包括:
- 刪除重復(fù)數(shù)據(jù),可通過Excel的COUNTIF函數(shù)或者篩選排序來進(jìn)行操作;
- 檢查數(shù)據(jù)格式,原始數(shù)據(jù)里可能會有特殊格式如N/A、####、性別為數(shù)值等情況,可根據(jù)實(shí)際情況判斷如何處理;
- 檢查異常數(shù)據(jù),可以著重關(guān)注極小值和極大值,小數(shù)點(diǎn),負(fù)數(shù)等,明顯不符合實(shí)際情況的,可以排查原因,選擇刪除或重新提取數(shù)據(jù);
- 處理缺失數(shù)據(jù),這個(gè)最常見的情況,一般情況可接受的標(biāo)準(zhǔn)是缺失值在10%以下,超過就需要酌情看是否有辦法重新提取了;
- 檢查數(shù)據(jù)邏輯錯誤,可以抽樣選取數(shù)據(jù)進(jìn)行計(jì)算檢查,如計(jì)算頁面點(diǎn)擊率=點(diǎn)擊UV/頁面瀏覽UV,假如算出頁面點(diǎn)擊率大于100%,就可能是有數(shù)據(jù)異常了,需要重新排查指標(biāo)統(tǒng)計(jì)方式是否正確等。
1.3.3 數(shù)據(jù)加工計(jì)算
數(shù)據(jù)整理好之后,可以進(jìn)行初始的數(shù)據(jù)加工了。因?yàn)樵紨?shù)據(jù)可能并不符合我們的分析需求,比如:我們想看的是某模塊的數(shù)據(jù),但原始數(shù)據(jù)是拆成每一個(gè)點(diǎn)擊位的數(shù)據(jù),我們就需要把每個(gè)點(diǎn)擊位的數(shù)據(jù)進(jìn)行求和等操作,轉(zhuǎn)化成模塊數(shù)據(jù)。
還有一些常見的情況是利用標(biāo)準(zhǔn)的行業(yè)計(jì)算公式,將某幾個(gè)指標(biāo)進(jìn)行數(shù)理計(jì)算得到另一個(gè)指標(biāo),如單UV價(jià)值=GMV/頁面UV、訂單轉(zhuǎn)化率=引入訂單數(shù)/頁面UV、人均點(diǎn)擊次數(shù)=點(diǎn)擊PV/點(diǎn)擊UV……通過這一步的操作,我們將能初步看到要驗(yàn)證假設(shè)需要的一些基本指標(biāo)的數(shù)據(jù)了。
1.4 數(shù)據(jù)分析
數(shù)據(jù)整理完之后就到了真正的重頭戲——數(shù)據(jù)分析了,也是含金量最高的一步。做數(shù)據(jù)分析有一個(gè)非?;A(chǔ)但又及其重要的思路,那就是對比,基本上90%以上的分析都離不開對比。
沿著2.2假設(shè)及衡量指標(biāo)的思路,我們有了一個(gè)假設(shè)“X策略可以提升A頁面轉(zhuǎn)化率”,且定義了此假設(shè)的衡量指標(biāo)為“頁面轉(zhuǎn)化率”,當(dāng)我們拿到頁面轉(zhuǎn)化率指標(biāo)后,轉(zhuǎn)化率需要達(dá)到多少才算好呢?是否是因?yàn)閄策略帶來的提升,還是可能是時(shí)間規(guī)律上的自然上漲?這時(shí)就可以通過對比來分析了。
- 縱比:在時(shí)間維度上,對比頁面A在使用X策略后,頁面轉(zhuǎn)化率是否提升了?
- 橫比:選取同時(shí)期的同類頁面-頁面B,橫向?qū)Ρ壤享撁鍭、新頁面A、B三個(gè)頁面的轉(zhuǎn)化率對比情況。
- 與經(jīng)驗(yàn)值對比:可以拉取更長的時(shí)間段,看A頁面的轉(zhuǎn)化率變化規(guī)律,看使用X策略是否高于時(shí)間規(guī)律上的預(yù)期值;可以選取更多同類頁面,選取同時(shí)期的轉(zhuǎn)化率對比,看A的轉(zhuǎn)化率處于哪個(gè)位置?
- 與業(yè)務(wù)目標(biāo)對比:假如的大的業(yè)務(wù)目標(biāo)其實(shí)是GMV為2000w,在頁面瀏覽UV和UV價(jià)值穩(wěn)定的情況下,計(jì)算目標(biāo)轉(zhuǎn)化率=目標(biāo)GMV/頁面瀏覽UV/UV價(jià)值,然后對比目標(biāo)轉(zhuǎn)化和目前轉(zhuǎn)化的差距。
各個(gè)角度的對比都能幫助你更清晰的理解目前指標(biāo)的情況,然后就可以據(jù)此繼續(xù)做下一步計(jì)劃啦~
二、系列預(yù)告
因單篇文章篇幅限制,本文只介紹了6步取的前3步,及簡單拋一些基本分析思路出來,后續(xù)系列文章將針對后3步——數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)、及提出后續(xù)建議做更加細(xì)致詳盡的介紹。
參考資料:
張文霖 劉夏璐 狄松《誰說菜鳥不會做數(shù)據(jù)分析》電子工業(yè)出版社
托馬斯·達(dá)文波特;(美)金鎮(zhèn)浩《成為數(shù)據(jù)分析師》浙江人民出版社
(美)米爾頓(Milton,M.)《深入淺出數(shù)據(jù)分析》電子工業(yè)出版社
作者:胡瑤,公眾號:京東設(shè)計(jì)中心JDC(ID:JDCdesign)
來源:https://mp.weixin.qq.com/s/zurv3PejUz0DlrUgsSb84w
本文由 @京東設(shè)計(jì)中心JDC 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
可以
總結(jié)的非常完善和清晰,感謝!