怎樣合理地定義用戶流失

8 評論 42029 瀏覽 46 收藏 5 分鐘

很久沒有更新博客了,這篇再寫一些關(guān)于“用戶流失”的內(nèi)容,之前發(fā)布的網(wǎng)站的活躍用戶與流失用戶這篇文章對網(wǎng)站的活躍用戶、流失用戶新用戶流失做了定義,這里修正下對流失用戶的英文叫法,一般對流失用戶常用的英文為“churn user”,之前用的wastage、away、lost等都不是太規(guī)范。后來陸續(xù)有做相關(guān)分析的朋友問到流失用戶的流失時間長度到底選擇多長是合理的,尤其是《網(wǎng)站分析實戰(zhàn)》這本書出版之后,我在里面有提到如何更準確地定義流失的時間長度,可能解釋的比較簡單,還是有朋友留言反饋這方面的問題,所以這里再用一篇文章解釋一下。

 

流失用戶與回訪用戶

流失用戶的定義請參考“網(wǎng)站的活躍用戶與流失用戶”這篇文章,要解釋怎么樣合理地去定義用戶流失時間段長度的問題,需要先介紹一個新的指標概念:回訪用戶。這里的回訪用戶不是指Google Analytics上面的Returning Visitor(與新用戶相對,指之前訪問過網(wǎng)站的用戶再次訪問網(wǎng)站),這里的回訪用戶指流失之后再次訪問網(wǎng)站的用戶,即用戶曾經(jīng)流失過,滿足流失時間期限內(nèi)完全沒有訪問/登錄網(wǎng)站的條件,但之后重新訪問/登錄網(wǎng)站。然后,根據(jù)回訪用戶數(shù)可以計算得到用戶回訪率,即:

  用戶回訪率 = 回訪用戶數(shù) ÷ 流失用戶數(shù) × 100%

回訪用戶率的數(shù)值大小間接地可以驗證對用戶流失定義的合理性。正常情況下,用戶的回訪率應該是比較低的,從業(yè)務的角度考慮,如果對流失的定義是合理的,那么很難讓那些對你的網(wǎng)站已經(jīng)失去興趣的用戶重新來訪問你的網(wǎng)站。一般情況下,網(wǎng)站的用戶回訪率應該在10%以下,在5%左右的數(shù)值是比較合理的,對于成熟的網(wǎng)站而言用戶回訪率會稍高,而新興的網(wǎng)站的用戶回訪率通常更低,尤其像手機APP這類用戶易流失的產(chǎn)品。

流失期限與用戶回訪率

用戶流失的流失期限的長度與用戶的回訪率成反比,我們在定義用戶流失時使用的連續(xù)不訪問/登錄網(wǎng)站的期限越長,這批流失用戶之后回訪網(wǎng)站的概率就會越低,并且隨著定義的流失期限的增大,用戶回訪率一定是遞減的,并逐漸趨近于0。那么如果選擇合適的流失期間長度?我們可以設定不同的流失期限長度,進一步統(tǒng)計每個流失期限的用戶回訪率,并觀察用戶回訪率隨定義的流失期限增大時的收斂速度。如果以“周”為單位設定流失期限:

根據(jù)設定的不同流失周期的用戶回訪率的變化曲線,我們可以使用拐點理論(Elbow Method)選擇最合適的流失周期。

拐點理論:X軸上數(shù)值的增加會帶來Y軸數(shù)值大幅增益(減益),直到超過某個點之后,當X增加時Y的數(shù)據(jù)增益(減益)大幅下降,即經(jīng)濟學里面的邊際收益的大幅減少,那個點就是圖表中的“拐點”。比如上圖中流失周期增加到5周的時候,用戶回訪率的縮減速度明顯下降,所以這里的5周就是拐點,我們可以用5周作為定義用戶流失的期限,即一個之前訪問/登錄過的用戶,如果之后連續(xù)5周都沒有訪問/登錄,則定義該用戶流失。

所以,有個這個辦法之后,就能更加合理地定義流失用戶的統(tǒng)計邏輯,而之前要做的就是選擇不同的流失期限分別計算用戶的回訪率,然后用統(tǒng)計的到的數(shù)值生成如上的一張帶平滑線的散點圖,問題就迎刃而解。

via:kdd china

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 不能一概而論,要看具體產(chǎn)品,B端和C端產(chǎn)品也不一樣。

    來自上海 回復
  2. 我覺得吧,有行業(yè)共識的就用共識,跟龍頭企業(yè)看齊。
    沒有行業(yè)共識的,就自己去試,7天,8天,9天……n天
    但是!有可能7天流失回訪率是5%,14天流失回訪率是20%,而30天流失回訪率也是5%

    來自安徽 回復
  3. 我覺得重點是搞清楚一個人產(chǎn)品的流失到底怎么定義,有哪些關(guān)鍵指標。定義之后再去看滿足定義的用戶的準確率是多少,

    來自重慶 回復
  4. 回訪的時間要設置多久才好??時間太長是不是也不太合理?因為回訪時間不同也不好比較

    來自北京 回復
  5. 專程為這篇文章注冊回復。
    根據(jù)用戶回訪率來定義流失,但是用戶回訪率=回訪用戶數(shù) ÷ 流失用戶數(shù) × 100% ,流失沒有定義,怎么計算回訪率?

    來自上海 回復
    1. 同為這篇文章注冊的。。
      個人理解,作者說的回訪率,按作者的意思,若以1周7天為流失周期,其實就是某天活躍的用戶中,連續(xù)7天沒用產(chǎn)品但第8天又使用了產(chǎn)品的用戶有多少;若以2周為流失周期,則指某天活躍的用戶中,連續(xù)14天沒用產(chǎn)品但第15天又使用了產(chǎn)品的用戶有多少……依次類推。所以實際上,這個方法找出來的天數(shù)(或周數(shù)),就是可以涵蓋大部分用戶任意2次登錄時間間隔最大值的天數(shù)。所以若直接統(tǒng)計登錄時間間隔的分布,找到這個天數(shù)會方便的多。作者的思路是正確的,可能表達得有些繞彎

      來自廣東 回復
  6. 有一個問題,用戶回訪率不一定是一直下降的,因為回訪用戶和流失用戶隨著流失最大期限的增大是同時下降的,其比值很可能增加。這個方法感覺在稀疏數(shù)據(jù)上不可行~

    來自上海 回復
    1. 大量數(shù)據(jù)面前比值也有增加的可能。PS:稀疏數(shù)據(jù)在做任何分析的時候都不是很可行,數(shù)據(jù)只有在大量的時候才有意義,小量數(shù)據(jù)有片面性,

      來自河南 回復