把波動(dòng)當(dāng)異常,小心變傻子
編輯導(dǎo)讀:工作里常常會(huì)出現(xiàn)關(guān)注的指標(biāo)或數(shù)據(jù)出現(xiàn)波動(dòng),或者在分析某個(gè)功能時(shí)發(fā)現(xiàn)難以理解的數(shù)據(jù)的情況,當(dāng)APP產(chǎn)品業(yè)務(wù)線的某個(gè)數(shù)據(jù)指標(biāo)出現(xiàn)異常的波動(dòng)時(shí),該如何著手?jǐn)?shù)據(jù)異常分析呢?本文作者從自身經(jīng)驗(yàn)出發(fā),圍繞數(shù)據(jù)波動(dòng)的問(wèn)題展開(kāi)了思考,一起來(lái)看看~
一大早,剛剛到工位。
領(lǐng)導(dǎo):“小明,XX指標(biāo)昨天有些異常,你盡快確認(rèn)下原因”。
小明:“好的,我這就看看,盡快給出結(jié)論”。
大家看到這個(gè)情景,不用我說(shuō),肯定都知道怎么回事兒。
相信大家都和小明一樣,遇到波動(dòng)時(shí),我們都會(huì)條件反射的疑問(wèn):啥又異常了?
但是,再深入想想,這個(gè)“異?!笔俏覀儭袄硭鶓?yīng)當(dāng)”認(rèn)為的“異?!?,并不一定是真異常。
數(shù)據(jù)分析切忌“理所應(yīng)當(dāng)”,某些問(wèn)題的原因,查到最后都在”理所應(yīng)當(dāng)“里。
我們來(lái)拆解下“啥又異常了”這句話
“啥”
一定有個(gè)主體。
我們要非常明確的知道,XX指標(biāo)波動(dòng)了,代表的業(yè)務(wù)含義是什么。
我們才能知道,業(yè)務(wù)上,這個(gè)波動(dòng)可能引發(fā)的原因,以及可能影響的范圍。
“波動(dòng)”
就是起伏不定。
那么起伏了多少,我們?nèi)绾瘟炕?/p>
量化了波動(dòng)大小,再去對(duì)比校驗(yàn),是否才能知道波動(dòng)是否異常?
確認(rèn)了波動(dòng)異常,是否才應(yīng)該去定位引發(fā)異常的原因?
“又”
說(shuō)明不止一次的發(fā)生了波動(dòng)。
那么,對(duì)于這些不止一次發(fā)生過(guò)的波動(dòng),我們是否有詳盡的監(jiān)控機(jī)制,預(yù)警機(jī)制,原因鉆取機(jī)制?
再發(fā)現(xiàn)波動(dòng)后,我們?nèi)绾胃咝?、?zhǔn)確的落地原因和后續(xù)改進(jìn)措施?
根據(jù) “啥又異常了”?這句話的拆解,我們來(lái)總結(jié)下如何解讀指標(biāo)的波動(dòng)。
第一步:定位波動(dòng)主體及波動(dòng)性質(zhì)
我們先來(lái)解決“啥”的問(wèn)題,也就是波動(dòng)的主體以及波動(dòng)是否異常。
關(guān)于波動(dòng)的主體
明確是什么指標(biāo)波動(dòng)了,對(duì)應(yīng)的業(yè)務(wù)含義是什么。
如果是通用指標(biāo),那可以視情況而定是否需要解釋對(duì)應(yīng)的業(yè)務(wù)含義。
- 步驟1:什么指標(biāo)在什么時(shí)間內(nèi)產(chǎn)生了波動(dòng),對(duì)應(yīng)的指標(biāo),在業(yè)務(wù)上的含義是什么
- 步驟2:這個(gè)波動(dòng)的對(duì)比方式是什么?環(huán)比?同比?還是歷史均值?
- 步驟3:指標(biāo)波動(dòng)的大小,即對(duì)波動(dòng)有一個(gè)具體量化
公式總結(jié):業(yè)務(wù) + 時(shí)間段 + 對(duì)比方式 + 定性的量化
如:DAU(業(yè)務(wù))??昨日(時(shí)間段)?同比上周(對(duì)比方式)下降了5%(定性的量化)
關(guān)于波動(dòng)是否異常
明確波動(dòng)是否是異常,并給出自己的判斷。
- 步驟1:結(jié)合之前的數(shù)據(jù)經(jīng)驗(yàn)和業(yè)務(wù)了解,初步判斷波動(dòng)是否異常
- 步驟2:通過(guò)歷史一段時(shí)間內(nèi)的自然波動(dòng)閾值,查看相對(duì)波動(dòng)值是否超出閾值,如果超出,則大概率是異常
- 步驟3:針對(duì)異常,給出一個(gè)明確的定性,是由于什么原因引起(一定要嘗試給結(jié)論,哪怕這個(gè)結(jié)論在初期是錯(cuò)的,在不斷提升改進(jìn)之后,也會(huì)越來(lái)越好)
tips:步驟3的結(jié)論總結(jié),可以后期分析出結(jié)論后再給,當(dāng)然,如果業(yè)務(wù)方著急,可以通過(guò)平時(shí)的積累和業(yè)務(wù)經(jīng)驗(yàn)做一個(gè)初步判斷
公式總結(jié):歷史情況?+?波動(dòng)閾值?+?初步判斷
如:對(duì)比去年的趨勢(shì)發(fā)現(xiàn)(歷史情況),此次下降超過(guò)了歷史波動(dòng)閾值(3%)(波動(dòng)閾值),推測(cè)由于 XX 原因引起(初步判斷)
第二步:定位波動(dòng)的原因
我們?cè)賮?lái)解決“波動(dòng)”的問(wèn)題,也就是引起波動(dòng)的原因。
原因初定:從大方向上,初步確定引起波動(dòng)的原因。
從時(shí)間的角度
從時(shí)間的角度,我們可以依次看周同比、月同比、年同比。
即:從時(shí)間發(fā)展的角度,我們確認(rèn)指標(biāo)波動(dòng)是否具有周期性,通過(guò)周期性的波動(dòng)規(guī)律,我們能夠大致定位該次波動(dòng)是否屬于季節(jié)性趨勢(shì)
比如:
- 招聘的高峰期都在年后,那年后換工作潮,會(huì)導(dǎo)致APP的各項(xiàng)指標(biāo)增長(zhǎng);
- 旅行的高峰期都在節(jié)假日,那旅行相關(guān)APP的指標(biāo)在節(jié)假日肯定會(huì)有波動(dòng);
從業(yè)務(wù)的角度
從業(yè)務(wù)的角度,我們可以去和對(duì)接業(yè)務(wù)方了解溝通,確認(rèn)近期“動(dòng)作”。
即:從業(yè)務(wù)的方向出發(fā),我們確認(rèn)指標(biāo)波動(dòng)是否由于業(yè)務(wù)的變動(dòng)導(dǎo)致,通常業(yè)務(wù)的變動(dòng)如果和指標(biāo)的變動(dòng)時(shí)間點(diǎn)能對(duì)上,那么大概率是由于業(yè)務(wù)變化導(dǎo)致
比如:
- 市場(chǎng)近期做了一波市場(chǎng)營(yíng)銷,推廣了某活動(dòng),那么,某些流量相關(guān)指標(biāo)會(huì)出現(xiàn)波動(dòng)
- 渠道側(cè)調(diào)整了渠道投放策略,那么,某些留存&NU指標(biāo)會(huì)出現(xiàn)波動(dòng)
從指標(biāo)的角度
從指標(biāo)的角度,我們可以和數(shù)據(jù)工程師確認(rèn)流程中的邏輯和執(zhí)行流程。
即:從指標(biāo)本身出發(fā),我們確認(rèn)指標(biāo)波動(dòng)是否由于ETL流程 or 指標(biāo)計(jì)算口徑中未發(fā)現(xiàn)的“坑”導(dǎo)致,通常ETL流程部分失敗,或者埋點(diǎn)中,異常值增大,都是由于一些數(shù)據(jù)處理流程中的“坑”沒(méi)被發(fā)現(xiàn)導(dǎo)致。
比如:
- 產(chǎn)出業(yè)務(wù)指標(biāo)的表格依賴上游3個(gè)表格,但是因?yàn)闆](méi)有配置依賴關(guān)系,且其中一個(gè)表格未產(chǎn)出,導(dǎo)致整體業(yè)務(wù)指標(biāo)下跌。
這個(gè)問(wèn)題通常整體指標(biāo)都會(huì)波動(dòng),如果僅從時(shí)間和業(yè)務(wù)角度切入問(wèn)題,對(duì)于問(wèn)題的定位會(huì)比較難。
原因下鉆:確定大方向后,下鉆至能解釋波動(dòng)50%以上的可落地因素
從時(shí)間的角度
從時(shí)間角度切入波動(dòng),一般都是周期性趨勢(shì)的解讀,如:
- 某教育相關(guān)APP,高考出成績(jī)那天流量達(dá)到頂峰,主要由于高考查分導(dǎo)致
- 某天氣相關(guān)APP,由于近期天氣多變,雨雪交加,導(dǎo)致流量上漲
tips:時(shí)間角度的切入,較考驗(yàn)業(yè)務(wù)的了解程度;只有知道產(chǎn)品的用戶是誰(shuí),切入實(shí)際生活中,我們才能把指標(biāo)波動(dòng)和實(shí)際生活所結(jié)合
從業(yè)務(wù)的角度
從業(yè)務(wù)的角度,我們反而更容易切入問(wèn)題,如:
- 渠道策略調(diào)整,導(dǎo)致NU及留存下降,那么我們對(duì)渠道細(xì)拆,就可以知道具體是哪個(gè)渠道影響了NU及留存
tips:針對(duì)業(yè)務(wù)的角度,我們需要確認(rèn),是業(yè)務(wù)上的什么“動(dòng)作”影響了指標(biāo),就能比較清楚的知道原因及拆解方向
從指標(biāo)的角度
從指標(biāo)的角度,我們關(guān)注一些物理特性就好,如:機(jī)房、IP、域名、生成時(shí)間、整體數(shù)據(jù)量的大小。
因?yàn)橥ǔG闆r下,ETL異常or指標(biāo)中的“坑”,都會(huì)有較明顯的異常值,我們只需要監(jiān)控常用的物理特性中的異常值就好。
tips:針對(duì)指標(biāo)本身,我們只需要前期設(shè)定部分規(guī)則,監(jiān)控規(guī)則下的數(shù)據(jù)大小變化,就能較容易的發(fā)現(xiàn)異常
公式總結(jié):數(shù)據(jù)結(jié)論 + 業(yè)務(wù)解釋
如:拆分渠道后,我們發(fā)現(xiàn),XX渠道NU大幅減少,對(duì)整體DAU減少貢獻(xiàn)XX%(數(shù)據(jù)結(jié)論);該情況和市場(chǎng)核對(duì)后,發(fā)現(xiàn)主要是由于XX渠道ROI太低,渠道側(cè)減少該渠道的花費(fèi)導(dǎo)致(業(yè)務(wù)解釋)
第三步:確立后續(xù)TODO
我們最后來(lái)解決“又”的問(wèn)題,也就是 波動(dòng)之后,我們?cè)撟鍪裁础?br />
我們?cè)谏厦鎯蓚€(gè)步驟中,闡述了情況,明確了數(shù)據(jù),解釋了原因。那么,后續(xù)我們?cè)撟鍪裁茨兀?/p>
如果是好的波動(dòng),我們復(fù)盤,我們下次如何做成這樣,或者做的更好。
如:市場(chǎng)做的活動(dòng),導(dǎo)致活躍orNU增加,那么下次,活動(dòng)該如何做的更好,活動(dòng)要不要更頻繁的做…
如果是壞的波動(dòng),我們復(fù)盤,我們下次如何避免這樣,或者提高。
如:APP某功能上線,要求用戶先使用功能A,才能使用功能B,導(dǎo)致留存下降;那么下次新功能上線時(shí),是否需要做AB測(cè)試,是否需要提前做用戶問(wèn)卷調(diào)研…
關(guān)于波動(dòng)本身,我們是否對(duì)核心指標(biāo)做了監(jiān)控?
- 如果有,我們是否需要調(diào)整監(jiān)控閾值,使異常抓取更敏感?
- 如果沒(méi)有,我們是否需要建設(shè)相關(guān)的監(jiān)控,建立異常報(bào)警機(jī)制?
最后
提一個(gè)問(wèn)題:如果一個(gè)指標(biāo)能拆分至N個(gè)維度,我們?cè)诓缓蜆I(yè)務(wù)溝通的前提下,如何定位波動(dòng)解讀的切入角度?
如:某流量型APP,整體流量可以拆分為 渠道、機(jī)型、城市、年齡、功能、是否算法推薦、是否運(yùn)營(yíng)操作等各種維度,在不和業(yè)務(wù)確認(rèn)前,我們?cè)撊绾味ㄎ槐敬尾▌?dòng)需要從哪個(gè)角度切入?即 先拆解哪個(gè)維度,再拆解哪個(gè)維度?
以上,就是本期內(nèi)容,希望對(duì)你有幫助。
本文由 @巡山貓 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!