如何七周成為數(shù)據(jù)分析師08:如何建立數(shù)據(jù)分析的思維框架?
本文是《如何七周成為數(shù)據(jù)分析師》的第八篇教程,如果想要了解寫作初衷,可以先行閱讀七周指南。溫馨提示:如果您已經(jīng)熟悉數(shù)據(jù)分析思維,大可不必再看這篇文章,或只挑選部分。
曾經(jīng)有人問過我,什么是數(shù)據(jù)分析思維?如果分析思維是一種結(jié)構(gòu)化的體現(xiàn),那么數(shù)據(jù)分析思維在它的基礎(chǔ)上再加一個(gè)準(zhǔn)則:
不是我覺得,而是數(shù)據(jù)證明。
這是一道分水嶺,“我覺得”是一種直覺化經(jīng)驗(yàn)化的思維,工作不可能處處依賴自己的直覺,公司發(fā)展更不可能依賴于此。數(shù)據(jù)證明則是數(shù)據(jù)分析的最直接體現(xiàn),它依托于數(shù)據(jù)導(dǎo)向型的思維,而不是技巧,前者是指導(dǎo),后者只是應(yīng)用。
作為個(gè)人,應(yīng)該如何建立數(shù)據(jù)分析思維呢?
建立你的指標(biāo)體系
在我們談?wù)撝笜?biāo)之前,先將時(shí)間倒推幾十年,現(xiàn)代管理學(xué)之父彼得·德魯克說過一句很經(jīng)典的話:
如果你不能衡量它,那么你就不能有效增長它。
所謂衡量,就是需要統(tǒng)一標(biāo)準(zhǔn)來定義和評價(jià)業(yè)務(wù)。這個(gè)標(biāo)準(zhǔn)就是指標(biāo)。假設(shè)隔壁老王開了一家水果鋪?zhàn)?,你問他每天生意怎么樣,他可以回答賣的不錯(cuò),很好,最近不景氣。這些都是很虛的詞,因?yàn)樗J(rèn)為賣的不錯(cuò)也許是賣了50個(gè),而你認(rèn)為的賣的不錯(cuò),是賣了100。
這就是“我覺得”造成的認(rèn)知陷阱。將案例放到公司時(shí),會遇到更多的問題:若有一位運(yùn)營和你說,產(chǎn)品表現(xiàn)不錯(cuò),因?yàn)槊刻於加泻芏嗳嗽u價(jià)和稱贊,還給你看了幾個(gè)截圖。而另外一位運(yùn)營說,產(chǎn)品有些問題,推的活動商品賣的不好,你應(yīng)該相信誰呢?
其實(shí)誰都很難相信,這些眾口異詞的判斷都是因?yàn)槿狈?shù)據(jù)分析思維造成的。
老王想要描述生意,他應(yīng)該使用銷量,這就是他的指標(biāo),互聯(lián)網(wǎng)想要描述產(chǎn)品,也應(yīng)該使用活躍率、使用率、轉(zhuǎn)化率等指標(biāo)。
如果你不能用指標(biāo)描述業(yè)務(wù),那么你就不能有效增長它。
了解和使用指標(biāo)是數(shù)據(jù)分析思維的第一步,接下來你需要建立指標(biāo)體系,孤立的指標(biāo)發(fā)揮不出數(shù)據(jù)的價(jià)值。和分析思維一樣,指標(biāo)也能結(jié)構(gòu)化,也應(yīng)該用結(jié)構(gòu)化。
我們看一下互聯(lián)網(wǎng)的產(chǎn)品,一個(gè)用戶從開始使用到離開,都會經(jīng)歷這些環(huán)節(jié)步驟。電商APP還是內(nèi)容平臺,都是雷同的。想一想,你會需要用到哪些指標(biāo)?
而下面這張圖,解釋了什么是指標(biāo)化,這就是有無數(shù)據(jù)分析思維的差異,也是典型的數(shù)據(jù)化運(yùn)營,有空可以再深入講這塊。
指標(biāo)體系沒有放之四海而皆準(zhǔn)的模板,不同業(yè)務(wù)形態(tài)有不同的指標(biāo)體系。移動APP和網(wǎng)站不一樣,SaaS和電子商務(wù)不一樣,低頻消費(fèi)和高頻消費(fèi)不一樣。好比一款婚慶相關(guān)的APP,不需要考慮復(fù)購率指標(biāo);互聯(lián)網(wǎng)金融,必須要風(fēng)控指標(biāo);電子商務(wù),賣家和買家的指標(biāo)各不一樣。
這些需要不同行業(yè)經(jīng)驗(yàn)和業(yè)務(wù)知識去學(xué)習(xí)掌握,那有沒有通用的技巧和注意事項(xiàng)呢?
好指標(biāo)與壞指標(biāo)
不是所有的指標(biāo)都是好的。這是初出茅廬者常犯的錯(cuò)誤。我們繼續(xù)回到老王的水果鋪?zhàn)樱瑏硭伎家幌?,銷量這個(gè)指標(biāo)究竟是不是好的?
最近物價(jià)上漲,老王順應(yīng)調(diào)高了水果價(jià)格,又不敢漲的提高,雖然水果銷量沒有大變化,但老王發(fā)現(xiàn)一個(gè)月下來沒賺多少,私房錢都不夠存。
老王這個(gè)月的各類水果銷量有2000,但最后還是虧本了,仔細(xì)研究后發(fā)現(xiàn),雖然銷量高,但是水果庫存也高,每個(gè)月都有幾百單位的水果滯銷最后過期虧本。
這兩個(gè)例子都能說明只看銷量是一件多不靠譜的事情。銷量是一個(gè)衡量指標(biāo),但不是好指標(biāo)。老王這種個(gè)體經(jīng)營戶,應(yīng)該以水果鋪?zhàn)拥睦麧櫈楹诵囊亍?/p>
好指標(biāo)應(yīng)該是核心驅(qū)動指標(biāo)。雖然指標(biāo)很重要,但是有些指標(biāo)需要更重要。就像銷量和利潤,用戶數(shù)和活躍用戶數(shù),后者都比前者重要。
核心指標(biāo)不只是寫在周報(bào)的數(shù)字,而是整個(gè)運(yùn)營團(tuán)隊(duì)、產(chǎn)品團(tuán)隊(duì)乃至研發(fā)團(tuán)隊(duì)都統(tǒng)一努力的目標(biāo)。
核心驅(qū)動指標(biāo)和公司發(fā)展關(guān)聯(lián),是公司在一個(gè)階段內(nèi)的重點(diǎn)方向。記住是一個(gè)階段,不同時(shí)期的核心驅(qū)動指標(biāo)不一樣。不同業(yè)務(wù)的核心驅(qū)動指標(biāo)也不一樣。
互聯(lián)網(wǎng)公司常見的核心指標(biāo)是用戶數(shù)和活躍率,用戶數(shù)代表市場的體量和占有,活躍率代表產(chǎn)品的健康度,但這是發(fā)展階段的核心指標(biāo)。在產(chǎn)品1.0期間,我們應(yīng)把注意力放到打磨產(chǎn)品上,在大推廣前提高產(chǎn)品質(zhì)量,這時(shí)留存率是一個(gè)核心指標(biāo)。而在有一定用戶基數(shù)的產(chǎn)品后期,商業(yè)化比活躍重要,我們會關(guān)注錢相關(guān)的指標(biāo),比如廣告點(diǎn)擊率、利潤率等。
核心驅(qū)動指標(biāo)一般是公司整體的目標(biāo),若從個(gè)人的崗位職責(zé)看,也可以找到自己的核心指標(biāo)。比如內(nèi)容運(yùn)營可以關(guān)注閱讀數(shù)和閱讀時(shí)長。
核心驅(qū)動指標(biāo)一定能給公司和個(gè)人帶來最大優(yōu)勢和利益,記得二八法則么?20%的指標(biāo)一定能帶來80%的效果,這20%的指標(biāo)就是核心。
另外一方面,好的指標(biāo)還有一個(gè)特性,它應(yīng)該是比率或者比例。
拿活躍用戶數(shù)說明就懂了,我們活躍用戶有10萬,這能說明什么呢?這說明不了什么。如果產(chǎn)品本身有千萬級別的注冊用戶,那么10萬用戶說明非常不健康,產(chǎn)品在衰退期。如果產(chǎn)品只擁有四五十萬用戶,那么說明產(chǎn)品的粘性很高。
正因?yàn)閱渭兊幕钴S用戶數(shù)沒有多大意義,所以運(yùn)營和產(chǎn)品會更關(guān)注活躍率。這個(gè)指標(biāo)就是一個(gè)比率,將活躍用戶數(shù)除以總用戶數(shù)所得。所以在設(shè)立指標(biāo)時(shí),我們都盡量想它能不能是比率。
壞指標(biāo)有哪些呢?
其一是虛榮指標(biāo),它沒有任何的實(shí)際意義。
產(chǎn)品在應(yīng)用商店有幾十萬的曝光量,有意義嗎?沒有,我需要的是實(shí)際下載。下載了意義大嗎?也不大,我希望用戶注冊成功。曝光量和下載量都是虛榮指標(biāo),只是虛榮程度不一樣。
新媒體都追求微信公眾號閱讀數(shù),如果靠閱讀數(shù)做廣告,那么閱讀數(shù)有意義,如果靠圖文賣商品,那么更應(yīng)該關(guān)注轉(zhuǎn)化率和商品銷量,畢竟一個(gè)夸張的標(biāo)題就能帶來很高的閱讀量,此時(shí)的閱讀量是虛榮指標(biāo)??上Ш芏嗬习暹€是孜孜不倦的追求10W+,哪怕刷量。
虛榮指標(biāo)是沒有意義的指標(biāo),往往它會很好看,能夠粉飾運(yùn)營和產(chǎn)品的工作績效,但我們要避免使用。
第二個(gè)壞指標(biāo)是后驗(yàn)性指標(biāo),它往往只能反應(yīng)已經(jīng)發(fā)生的事情。
比如我有一個(gè)流失用戶的定義:三個(gè)月沒有打開APP就算做流失。那么運(yùn)營每天統(tǒng)計(jì)的流失用戶數(shù),都是很久沒有打開過的,以時(shí)效性看,已經(jīng)發(fā)生很久了,也很難通過措施挽回。我知道曾經(jīng)因?yàn)槟硞€(gè)不好的運(yùn)營手段傷害了用戶,可是還有用嗎?
活動運(yùn)營的ROI(投資回報(bào)率)也是后驗(yàn)性指標(biāo),一個(gè)活動付出成本后才能知道其收益??墒浅杀疽呀?jīng)支出,活動的好與壞也注定了?;顒又芷陂L,還能有調(diào)整余地?;顒佣唐诘脑挘@指標(biāo)只能用作復(fù)盤,但不能驅(qū)動業(yè)務(wù)。
第三個(gè)壞指標(biāo)是復(fù)雜性指標(biāo),它將數(shù)據(jù)分析陷于一堆指標(biāo)造成的陷阱中。
指標(biāo)能細(xì)分和拆解,比如活躍率可以細(xì)分成日活躍率、周活躍率、月活躍率、老用戶活躍率等。數(shù)據(jù)分析應(yīng)該根據(jù)具體的情況選擇指標(biāo),如果是天氣類工具,可以選擇日活躍率,如果是社交APP,可以選擇周活躍率,更低頻的產(chǎn)品則是月活躍率。
每個(gè)產(chǎn)品都有適合它的幾個(gè)指標(biāo),不要一股腦的裝一堆指標(biāo)上去,當(dāng)你準(zhǔn)備了二三十個(gè)指標(biāo)用于分析,會發(fā)現(xiàn)無從下手。
指標(biāo)結(jié)構(gòu)
既然指標(biāo)太多太復(fù)雜不好,那么應(yīng)該如何正確的選擇指標(biāo)呢?
和分析思維的金字塔結(jié)構(gòu)一樣,指標(biāo)也有固有結(jié)構(gòu),呈現(xiàn)樹狀。指標(biāo)結(jié)構(gòu)的構(gòu)建核心是以業(yè)務(wù)流程為思路,以結(jié)構(gòu)為導(dǎo)向。
假設(shè)你是內(nèi)容運(yùn)營,需要對現(xiàn)有的業(yè)務(wù)做一個(gè)分析,提高內(nèi)容相關(guān)數(shù)據(jù),你會怎么做呢?
我們把金字塔思維轉(zhuǎn)換一下,就成了數(shù)據(jù)分析方法了。
從內(nèi)容運(yùn)營的流程開始,它是:內(nèi)容收集—內(nèi)容編輯發(fā)布—用戶瀏覽—用戶點(diǎn)擊—用戶閱讀—用戶評論或轉(zhuǎn)發(fā)—繼續(xù)下一篇瀏覽。
這是一個(gè)標(biāo)準(zhǔn)的流程,每個(gè)流程都有指標(biāo)可以建立。內(nèi)容收集可以建立熱點(diǎn)指數(shù),看哪一篇內(nèi)容比較火。用戶瀏覽用戶點(diǎn)擊則是標(biāo)準(zhǔn)的PV和UV統(tǒng)計(jì),用戶閱讀是閱讀時(shí)長。
從流程的角度搭建指標(biāo)框架,可以全面的囊括用戶相關(guān)數(shù)據(jù),無有遺漏。
這套框架列舉的指標(biāo),依舊要遵循指標(biāo)原則:需要有核心驅(qū)動指標(biāo)。移除虛榮指標(biāo),適當(dāng)?shù)倪M(jìn)行刪減,不要為添加指標(biāo)而添加指標(biāo)。
維度分析法
當(dāng)你有了指標(biāo),可以著手進(jìn)行分析,數(shù)據(jù)分析大體可以分三類,第一類是利用維度分析數(shù)據(jù),第二類是使用統(tǒng)計(jì)學(xué)知識如數(shù)據(jù)分布假設(shè)檢驗(yàn),最后一類是使用機(jī)器學(xué)習(xí)。我們先了解一下維度分析法。
維度是描述對象的參數(shù),在具體分析中,我們可以把它認(rèn)為是分析事物的角度。銷量是一種角度、活躍率是一種角度,時(shí)間也是一種角度,所以它們都能算維度。
當(dāng)我們有了維度后,就能夠通過不同的維度組合,形成數(shù)據(jù)模型。數(shù)據(jù)模型不是一個(gè)高深的概念,它就是一個(gè)數(shù)據(jù)立方體。
上圖就是三個(gè)維度組成的數(shù)據(jù)模型/數(shù)據(jù)立方體。分別是產(chǎn)品類型、時(shí)間、地區(qū)。我們既能獲得電子產(chǎn)品在上海地區(qū)的2010二季度的銷量,也能知道書籍在江蘇地區(qū)的2010一季度銷量。
數(shù)據(jù)模型將復(fù)雜的數(shù)據(jù)以結(jié)構(gòu)化的形式有序的組織起來。我們之前談到的指標(biāo),都可以作為維度使用。下面是范例:
將用戶類型、活躍度、時(shí)間三個(gè)維度組合,觀察不同用戶群體在產(chǎn)品上的使用情況,是否A群體使用的時(shí)長更明顯?
將商品類型、訂單金額、地區(qū)三個(gè)維度組合,觀察不同地區(qū)的不同商品是否存在銷量差異?
數(shù)據(jù)模型可以從不同的角度和層面來觀察數(shù)據(jù),這樣提高了分析的靈活性,滿足不同的分析需求、這個(gè)過程叫做OLAP(聯(lián)機(jī)分析處理)。當(dāng)然它涉及到更復(fù)雜的數(shù)據(jù)建模和數(shù)據(jù)倉庫等,我們不用詳細(xì)知道。
數(shù)據(jù)模型還有幾種常見的技巧、叫做鉆取、上卷、切片。
選取就是將維度繼續(xù)細(xì)分。比如浙江省細(xì)分成杭州市、溫州市、寧波市等,2010年一季度變成1月、2月、3月。上卷則是鉆取的相反概念,將維度聚合,比如浙江、上海、江蘇聚合成浙江滬維度。切片是選中特定的維度,比如只選上海維度、或者只選2010年一季度維度。因?yàn)閿?shù)據(jù)立方體是多維的,但我們觀察和比較數(shù)據(jù)只能在二維、即表格中進(jìn)行。
上圖的樹狀結(jié)構(gòu)代表鉆?。╯ource和time的細(xì)分),然后通過對Route的air切片獲得具體數(shù)據(jù)。
聰明的你可能已經(jīng)想到,我們常用的數(shù)據(jù)透視表就是一種維度分析,將需要分析的維度放到行列組合進(jìn)行求和、計(jì)數(shù)、平均值等計(jì)算。放一張?jiān)?jīng)用到的案例圖片:用城市維度和工作年限維度,計(jì)算平均工資。
除了Excel、BI、R、Python都能用維度分析法。BI是相對最簡便的。
談到維度法,想要強(qiáng)調(diào)的是分析的核心思維之一:對比,不同維度的對比,這大概是對新人快速提高的最佳捷徑之一。比如過去和現(xiàn)在的時(shí)間趨勢對比,比如不同地區(qū)維度的對比,比如產(chǎn)品類型的區(qū)別對比,比如不同用戶的群體對比。單一的數(shù)據(jù)沒有分析意義,只有多個(gè)數(shù)據(jù)組合才能發(fā)揮出數(shù)據(jù)的最大價(jià)值。
我想要分析公司的利潤,利潤 = 銷售額 – 成本。那么找出銷售額涉及的指標(biāo)/維度,比如產(chǎn)品類型、地區(qū)、用戶群體等,通過不斷的組合和拆解,找出有問題或者表現(xiàn)良好的原因。成本也是同理。
這就是正確的數(shù)據(jù)分析思維??偨Y(jié)一下吧:我們通過業(yè)務(wù)建立和篩選出指標(biāo),將指標(biāo)作為維度,利用維度進(jìn)行分析。
很多人會問,指標(biāo)和維度有什么區(qū)別?
維度是說明和觀察事物的角度,指標(biāo)是衡量數(shù)據(jù)的標(biāo)準(zhǔn)。維度是一個(gè)更大的范圍,不只是數(shù)據(jù),比如時(shí)間維度和城市維度,我們就無法用指標(biāo)表示,而指標(biāo)(留存率、跳出率、瀏覽時(shí)間等)卻可以成為維度。通俗理解:維度>指標(biāo)。
到這里,大家已經(jīng)有一個(gè)數(shù)據(jù)分析的思維框架了。之所以是框架,因?yàn)檫€缺少具體的技巧,比如如何驗(yàn)證某一個(gè)維度是影響數(shù)據(jù)的關(guān)鍵,比如如何用機(jī)器學(xué)習(xí)提高業(yè)務(wù),這些涉及到數(shù)據(jù)和統(tǒng)計(jì)學(xué)知識,以后再講解。
這里我想強(qiáng)調(diào),數(shù)據(jù)分析并不是一個(gè)結(jié)果,只是過程。還記得“如果你不能衡量它,那么你就不能有效增長它”這句話嗎?數(shù)據(jù)分析的最終目的就是增長業(yè)務(wù)。如果數(shù)據(jù)分析需要績效指標(biāo),一定不會是分析的對錯(cuò),而是最終數(shù)據(jù)提升的結(jié)果。
數(shù)據(jù)分析是需要反饋的,當(dāng)我分析出某項(xiàng)要素左右業(yè)務(wù)結(jié)果,那么就去驗(yàn)證它。告訴運(yùn)營和產(chǎn)品人員,看看改進(jìn)后的數(shù)據(jù)怎么樣,一切以結(jié)果為準(zhǔn)。如果結(jié)果并沒有改善,那么就應(yīng)該反思分析過程了。
這也是數(shù)據(jù)分析的要素,結(jié)果作導(dǎo)向。分析若只是當(dāng)一份報(bào)告呈現(xiàn)上去,后續(xù)沒有任何跟進(jìn)、改進(jìn)的措施,那么數(shù)據(jù)分析等與零。
業(yè)務(wù)指導(dǎo)數(shù)據(jù),數(shù)據(jù)驅(qū)動業(yè)務(wù)。這才是不二法門。
附
解答上篇文章的思考題,可能大家等急了。
你是淘寶的數(shù)據(jù)分析師,現(xiàn)在需要你預(yù)估雙十一的銷量,你不能獲得雙十一當(dāng)天和之前的所有數(shù)據(jù)。只能獲得11月12日開始的數(shù)據(jù),你應(yīng)該如何預(yù)估?
因?yàn)槭情_放題,所以沒有固定答案。
大家的回答分為兩類:
一類是通過后續(xù)雙十一的銷量,判斷16年,缺點(diǎn)是需要等一年,優(yōu)點(diǎn)是簡單到不像話。
二類是通過11月12日之后的銷量數(shù)據(jù),往前預(yù)估,期間會考慮一些權(quán)重。缺點(diǎn)是雙十一屬于波峰,預(yù)估難道大,優(yōu)點(diǎn)是可操作性好。
因?yàn)轭}目主要看的是分析思維,目的是找出可能的思路,所以有沒有其他的方法呢?
我們嘗試把思維放開,因?yàn)殇N量能反應(yīng)商品,有沒有其他維度?我們可能會想到:退換貨率、和商品評價(jià)率。因?yàn)殡p十一的商品只能在12日后退換貨和收貨后評價(jià),我們就能根據(jù)這兩個(gè)指標(biāo)平日的平均比率,以及雙十一商品的后續(xù)退換和評價(jià)總數(shù),預(yù)估賣出總量。退換貨率肯定會虛高一些(畢竟雙十一退貨不少),那么商品評價(jià)率更準(zhǔn)確。
還有其他方法么?當(dāng)然有,比如會有不少人用螞蟻花唄支付雙十一,那么后續(xù)還款的比率能不能預(yù)估?
如果再將思路放開呢?雖然我不知道淘寶當(dāng)天的數(shù)據(jù),但是可以尋求外部數(shù)據(jù),比如京東,京東的雙十一銷量是多少,是平時(shí)的多少倍,那么就用這個(gè)倍數(shù)去預(yù)估淘寶的。
整體的分析結(jié)構(gòu)就分為:
外部數(shù)據(jù):
- 京東等其他平臺雙十一銷量
內(nèi)部數(shù)據(jù):
- 商品數(shù)據(jù):商品評價(jià)率、退換貨率、商品銷量
- 支付數(shù)據(jù):螞蟻花唄支付比率等
相關(guān)閱讀
互聯(lián)網(wǎng)數(shù)據(jù)分析能力的養(yǎng)成,需一份七周的提綱
如何七周成為數(shù)據(jù)分析師01:常見的Excel函數(shù)全部涵蓋在這里了
如何七周成為數(shù)據(jù)分析師02:Excel技巧大揭秘
如何七周成為數(shù)據(jù)分析師03:手把手教你Excel實(shí)戰(zhàn)
如何七周成為數(shù)據(jù)分析師:Excel技巧之甘特圖繪制(項(xiàng)目管理)
如何七周成為數(shù)據(jù)分析師:Excel技巧之打造多級菜單
如何七周成為數(shù)據(jù)分析師04:數(shù)據(jù)可視化之經(jīng)典圖表合集
如何七周成為數(shù)據(jù)分析師05:數(shù)據(jù)可視化之打造升職加薪的報(bào)表
如何七周成為數(shù)據(jù)分析師06:數(shù)據(jù)可視化之手把手打造BI
如何七周成為數(shù)據(jù)分析師07:快速掌握麥肯錫的分析思維
#專欄作家#
秦路,微信公眾號ID:tracykanc,人人都是產(chǎn)品經(jīng)理專欄作家。
本文由 @秦路?原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自PEXELS,基于CC0協(xié)議
看了好幾篇文章了,覺得寫得很有見解,不僅僅是干貨還能幫我拓展數(shù)據(jù)分析的思路。
有個(gè)問題沒太理解。 在確定指標(biāo)和做維度分析時(shí),是先確定維度,確定指標(biāo),最終歸納出核心指標(biāo);還是先確定核心指標(biāo),再根據(jù)維度拆解指標(biāo)呢?
?? mark 幫助很大!
超級贊,我每閱讀完一個(gè)小節(jié),梳理一下自己的思路然后做筆記,效果太好了
贊,up
太牛了!即便是其他行業(yè)看了也很有收獲