數(shù)據(jù)掃盲(2):新增用戶與留存到底是啥?
對數(shù)據(jù)基本功的扎實了解,是溝通的橋梁,本文作者對常見的數(shù)據(jù)指標(biāo)進(jìn)行了分析,希望通過此文能夠加深你對基礎(chǔ)數(shù)據(jù)指標(biāo)的認(rèn)識。
01 新增用戶
如果大家看過咱們系列的第一篇文章:《數(shù)據(jù)掃盲(1):我們常說的DAU、MAU是啥?》應(yīng)該是知道這樣一句話:
對數(shù)據(jù)基本功的扎實了解,是溝通的橋梁!
這句話是貫穿我們數(shù)據(jù)掃盲系列始終的,跟著新增用戶我們舉一個場景,大家可以再次深度感受一下這句話。
我們的運營同學(xué)為了推廣app,去找渠道商進(jìn)行合作,涉及到結(jié)算錢的時候,商量以新增用戶為指標(biāo)進(jìn)行結(jié)算,但是對于新增用戶的具體定義,大家發(fā)生了爭執(zhí):
- 渠道商:只要用戶在我們渠道的推廣頁面點擊了產(chǎn)品下載按鈕,就記作一次新增用戶。
- 運營喵:那不成,點了按鈕沒下載那意義不大啊。咱們下載成功記作一次新增,且多次點擊記作一次。
- 產(chǎn)品狗:錯了錯了,咱們app這么牛,至少也要啟動一次記作一次,讓他們體驗下,要不然數(shù)據(jù)質(zhì)量不大,不具備參考價值。
- 工程獅:都打住啊,你們這yy半天不行啊,不注冊我們后臺都沒有數(shù)據(jù)。必須注冊了才算新增用戶。
面對這樣的場景,我們很難去說對錯,我們更關(guān)心的是彼此間對于數(shù)據(jù)指標(biāo)如何達(dá)成共識!
那么新增到底指的是什么呢?
我們把新增用戶進(jìn)行說文解字般的拆解,新增=新+增。接下來我們需要明確兩個問題:
Q1:什么是增?在哪個節(jié)點為增?
A1:一般來說,在用戶與產(chǎn)品發(fā)生關(guān)系之前,往往會經(jīng)歷如下圖所示路徑:
用戶通過不同的渠道銜接進(jìn)入到渠道頁(例如某度廣告頁,某企鵝廣告頁);用戶在渠道頁面點擊下載或者通過渠道頁進(jìn)入到應(yīng)用商店下載;安裝,啟動應(yīng)用,來到應(yīng)用首頁;觸發(fā)相應(yīng)的激活行為(不同業(yè)務(wù)激活行為不同,例如注冊成功、購買商品、亦或是觀看一次視頻等等)。
理論上不同的節(jié)點,都是可以作為一次新增,這里呢,我總結(jié)一下不同節(jié)點作為新增的優(yōu)劣勢,以及適合的場景。
大家就可以根據(jù)表中總結(jié)的,結(jié)合自己公司業(yè)務(wù)選擇適合自己的節(jié)點。
Q2:怎么判斷是否為新?
A2:這個問題是由一個實例引入的,假設(shè)我們以安裝啟動這個節(jié)點作為增,一個用戶下載了某app并安裝啟動,裝了兩天卸載了,又重新安裝啟動,此時他是否算作新增用戶?這里,我們一般有兩種判斷方法:
- 基于設(shè)備:用戶第一次安裝啟動時,記錄設(shè)備。再次安裝則不記錄。其中涉及的不同系統(tǒng)之間(ios,安卓,web)判斷設(shè)備的門道,詳情細(xì)節(jié)可見上一篇文章《再也不怕別人問我DAU和MAU了》其中關(guān)于user部分的介紹。
- 基于賬號關(guān)聯(lián)。
以賬號作為判斷基準(zhǔn),和后臺已有的賬號進(jìn)行比對,看以前是否存在此賬號。
02 留存用戶
本文提到的留存都是指的新增用戶的留存,下不贅述。
首先我們來看一下友盟平臺對于留存是怎么下定義的。
宋老濕還是給大家引入一個案例,來幫助大家理解定義。
案例還是一款悲催的app,上線第一天新增了100名用戶,之后就再也沒有獲取新增用戶。下面給出其上線七日的日活表:
我們由表可以得出MAU=100,這點如果有疑問,請查看數(shù)據(jù)掃盲系列文章一《再也不怕別人問我DAU和MAU呢~ 數(shù)據(jù)掃盲系列(1)》。
問題:如何計算新增用戶七日日留存?
這里給出兩個算法。
算法一:(第七天留存用戶數(shù)/第一天新增用戶數(shù))*100%
算法二:(第二天~第七天去重后的留存用戶數(shù)/第一天新增用戶數(shù))*100%
根據(jù)留存的定義,“某段時間內(nèi)的新增用戶,經(jīng)過一段時間后,仍繼續(xù)使用應(yīng)用的,為留存用戶”。從中可以提煉出留存用戶是某段時間新增用戶的子集。
就本題而言,上線第一天新增了用戶100人且之后再沒有新增用戶,所以第一天之后幾天的活躍用戶都是第一天新增用戶的子集,即第X日留存用戶數(shù)=第X日活躍用戶數(shù),第一天的新增用戶=第一天的活躍用戶。
但是,如果沒有“第一天新增100人后再無新增用戶”的前提,則第X日留存用戶數(shù)≠第X日活躍用戶數(shù),準(zhǔn)確表述應(yīng)為第X日留存用戶數(shù)=第X日來自于第一天新增用戶中的活躍用戶。
這里有一點繞,我舉一小例子幫助大家理解一下。
(假設(shè)5月份新增用戶200,這200人在6月份啟動過應(yīng)用的有100人,7月份啟動過應(yīng)用的有80人,則6月份留存用戶為100人,7月份留存用戶為80人。)
那么采用哪一個算法呢?
如果您有心記得,宋老濕反復(fù)強調(diào)過:數(shù)據(jù)分析一定是基于業(yè)務(wù)的,是有目的(即留存用戶這個數(shù)據(jù)指標(biāo)的意義)。
目的一般來說,留存的計算與分析有以下目的:
- 觀測不同渠道帶來用戶的質(zhì)量;
- 版本更新后的新功能上線的效果反饋。(功能這一塊,會涉及到用戶關(guān)鍵行為的觸發(fā)。屬于精準(zhǔn)留存的問題,后期文章我們會講解)
此處我們以區(qū)分渠道質(zhì)量來做講解:
算法一
假設(shè)某app有兩個獲客渠道A和B,且都是1月1日上線,當(dāng)日新增用戶100名之后再無新增用戶。已知兩個渠道1月1日~1月7日每日的活躍用戶的數(shù)量,用算法一【(第七天留存用戶數(shù)/第一天新增用戶數(shù))*100%】計算分別得到兩個七日留存率。
這里可能會有一些朋友會覺得,用算法一計算忽略了2日到6日的用戶數(shù)據(jù),這樣計算得到數(shù)據(jù)不準(zhǔn)確。其實不是這樣的,我們獲取了兩個數(shù)據(jù)是為了進(jìn)行數(shù)據(jù)對比,從對比中洞察業(yè)務(wù)爆破點。因為無論是渠道A還是渠道B,我們都只使用第一天和第七天的數(shù)據(jù),同時忽略了2日到6日的數(shù)據(jù),忽略的信息是一致的。
因為單一影響因素相同,所以采用算法一計算進(jìn)行對比是相對公平合理的。
當(dāng)然,即使這樣,可能還會有一些朋友會問那有什么辦法不忽略2日到6日的數(shù)據(jù)呢?
算法二
【第二天~第七天去重后的留存用戶數(shù)/第一天新增用戶數(shù))*100%】這種計算方式就是把2日到6日之間的活躍用戶計算在內(nèi),但是這樣的計算方法是否適合用來評估渠道質(zhì)量呢?
我們可以看下下圖是關(guān)于渠道A和B七天日活用戶的折線圖,我們嚴(yán)格按照算法二計算會得出渠道A留存率高于渠道B,實際上我們由圖可以看出渠道B的活躍用戶曲線更接近于自然平緩下降,同時第七日的活躍用戶也高于渠道A。綜合來說渠道B的用戶質(zhì)量是高于渠道A。
所以用算法二來計算留存評估渠道質(zhì)量是不ok的,究其原因,恰恰是引入第二日和第六日的數(shù)據(jù),反而影響了結(jié)果的判斷。
通過以上的案例,大家應(yīng)該理解了兩者的區(qū)別。
算法一我們可以稱之為七日日留存,算法二為七日內(nèi)留存。
當(dāng)然,存在既有合理性,算法二并不是沒有適用場景,針對一些用特定使用周期的app就更適合,例如某app是專注于周末轟趴,活躍用戶大部分聚集在周六和周日,我們?nèi)绻ビ嬎愎ぷ魅眨ㄖ芤恢林芪澹┤我惶斓男略鲇脩羝呷杖樟舸?,會發(fā)現(xiàn)明顯偏低于周末。
針對這種情況,我們只看第七天的日留存顯然不能反應(yīng)真實情況,反之,關(guān)心七日內(nèi)的留存就更為真實可靠。
那么,宋老濕還是以友盟數(shù)據(jù)平臺一組七日留存的表格,大家可以嘗試看下友盟采用的是算法一還是算法二。
有些朋友可能有些摸不到頭腦,有些朋友直覺可能覺得友盟用的是算法一。實際上,友盟平臺計算方法和算法一很相似但有些許不同。我們暫且稱之為算法三。
算法三
(第七天的留存用戶數(shù)/第0天的新增用戶)*100%。
這個第0天其實指的就是計算留存的當(dāng)日,和算法一中的第一天指的是同一天。如上圖所示,如果計算2018—08—01的七日日留存,則算法一中的第1天和算法三中的第0天都是指的08-01的新增用戶數(shù)339人。再仔細(xì)看上圖會發(fā)現(xiàn),友盟統(tǒng)計時采用1天后,2天后對應(yīng)就是算法一中的第二天與第三天。
那么友盟為什么采用算法三,這樣計算有什么好處嗎?希望大家動腦子想一下。
(這里給一個提示:和一周七天有關(guān)聯(lián))。
揭曉答案:這是因為采用算法三我們可以規(guī)避星期對數(shù)據(jù)的干擾。
舉一個例子,2018-08-01是星期三,采用算法一的第七天則是08-07星期二,算法三則是七天后08-08星期三,這樣同時用星期三的數(shù)據(jù),就可以合理規(guī)避今日是周幾對數(shù)據(jù)的干擾。
那么我們一共講了三種算法,每種算法都有其存在的意義,具體的要根據(jù)自己公司業(yè)務(wù)進(jìn)行選擇,保證公司內(nèi)部采用同一種標(biāo)準(zhǔn)即可。
這里,宋老濕給大家做一個表格進(jìn)行總結(jié),大家可以保存圖片備用。
基于此,新增或和留存咱們是聊得差不多了。大家應(yīng)該會有種毛塞頓開的感覺。
下一期,具體主題宋老濕可能會繼續(xù)聊一些數(shù)據(jù)指標(biāo),也可能會聊一些UI設(shè)置的基礎(chǔ)。敬請期待。
作者:宋老濕,公眾號:產(chǎn)品經(jīng)理吐槽喵,一個有溫度的公眾號 互相學(xué)習(xí)交流進(jìn)步
本文由 @產(chǎn)品吐槽喵 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
這個悲催的app不會是真實的事情吧,不會是?——
secret
寫的真好。talkingdata 也是第三種計算方式。
感謝
請問入門的話到底怎么分析這些數(shù)據(jù)?訪問人數(shù)越來越多,總收入越來越少,我都不知道從哪塊數(shù)據(jù)開始分析。。。
這個要具體問具體分析
假設(shè)某月1日新增用戶1000,是不是代表當(dāng)日活躍就是1000呢?有沒有可能活躍人數(shù)是900(少于1000)的情況?
新增的定義和活躍的定義不同 看你怎么定義活躍
例如你認(rèn)為有了某種用戶行為才算活躍 那么就可能出現(xiàn)你說的情況
感謝老師的分享!
感謝您耐心的看完 希望對您有用
更新新文章了
所以分別是 七日日留存、七日內(nèi)留存、七日后留存?
名字不同要 主要還是業(yè)務(wù)場景
老哥,是時候更新一發(fā)了! ??
??
更新新文章了
好像看不到文章里的圖呢,期待繼續(xù)更新~ ??
我測試了下 可以看到
更新新文章了
期待第三集,什么時候更
盡快哦 很開心文章對您有幫助 訂閱點贊收藏是我更新的動力 筆芯
已更新
已更新
很棒 小白容易理解
如果對您有幫助
訂閱加贊 收藏素質(zhì)三連來一波
優(yōu)秀
互相學(xué)習(xí)
更新新文章了
數(shù)據(jù)小白一枚,期待更新~
催更是可以的 訂閱收藏加贊不來了三連嗎 小姐姐
更新新文章了
入門,普及的挺好
共同學(xué)習(xí) 謝謝認(rèn)可 就是普及下數(shù)據(jù)指標(biāo)的基礎(chǔ)
更新新文章了