【干貨燒腦】如何預(yù)測一個互聯(lián)網(wǎng)產(chǎn)品的未來—一套關(guān)于產(chǎn)品的數(shù)學(xué)模型

11 評論 17581 瀏覽 163 收藏 17 分鐘

這套模型是我在運營路況電臺2000萬用戶過程中積累出來的,也是我們團隊做產(chǎn)品迭代,運營和產(chǎn)品目標(biāo)設(shè)定最基本的方法。這個產(chǎn)品模型從幾個相對不同的維度定義一個產(chǎn)品的關(guān)鍵要素,是測量產(chǎn)品好壞最核心的指標(biāo),通過這套模型能迅速發(fā)現(xiàn)產(chǎn)品的問題,留住用戶的能力并預(yù)測產(chǎn)品未來的走向。

對于一個產(chǎn)品,大家都知道留存和黏度等基本指標(biāo)是非常關(guān)鍵的,如何預(yù)測一個產(chǎn)品的未來,也恰恰是這些指標(biāo)。要預(yù)測產(chǎn)品未來,就得先研究清楚這些基本產(chǎn)品指標(biāo)的規(guī)律。

留存率的規(guī)律

留存率是一個產(chǎn)品最核心的指標(biāo),這是一個產(chǎn)品留住用戶的能力,也是產(chǎn)品經(jīng)理最應(yīng)該關(guān)注的指標(biāo),因為產(chǎn)品迭代改進絕大多時候是在優(yōu)化這個指標(biāo)。 留存率的統(tǒng)計一般會按照時間的跨度按(日、周、月)來統(tǒng)計,按照時間維度,有次日(周、月)、2日(周、月)、…. 、7日(周、月),30日等多個統(tǒng)計維度,但是無論哪種跨度,都遵循相同的規(guī)律。下面我們用月留存來舉個例子說明,下表是某產(chǎn)品的月留存率數(shù)據(jù):

趨勢如下:

左邊是留存趨勢圖,右邊是一個衰減冪函數(shù)的圖像,大家是不是看這兩個趨勢有些相似,是的留存率的趨勢就是遵循冪函數(shù)的規(guī)律,不同的是我們看到的留存率趨勢圖都是取自變量 x >=1之后的數(shù)據(jù),因為留存率的統(tǒng)計都是1日(周、月)之后的整數(shù)。 任何留存率的趨勢都是一個冪函數(shù)

所以說一個產(chǎn)品的留存率由兩個參數(shù) a 和 b 決定,那我們進一步探究 a 和 b 的規(guī)律。

  1. a 是冪函數(shù)下降的起點值,在留存率趨勢來說就是我們常說的次日(周、月)留存率,下面我們以 C 來代表這個值。
  2. b 是冪指數(shù)衰減的趨勢,代表留存率的衰減速度,我們以 R 來代表這個值。

C 值和 R 值的計算,一般有兩種方法,一種是通過擬合算法得來,另外一種是通過冪函數(shù)模型反算出來;擬合算出來的準(zhǔn)確度更高,并且可以算出擬合誤差,不過擬合出來的 C 值和次日(周、月)留存率會有微小的差異,同時計算的復(fù)雜度稍微大一些;第二種通過模型反算比較簡單,很適合表格公式操作,為了簡單方便我一般都用第二種算法,給大家介紹一下反算的方法:

用 C1,C2,C3,…Cn 來表示 1,2,3,…n 日(周、月)的留存率:

C =C1

R = average( log2(C2/C1),log3(C3/C1),…,logn(Cn/C1) )

回到我們上面舉例子的產(chǎn)品,根據(jù)已知的留存數(shù)據(jù),我們通過模型計算出來這款產(chǎn)品留存的趨勢模型是:

留存率= 43.7x^{-0.53307},(其中C=43.7,R=-0.53307)

在實際使用過程中,通過已有幾日(周、月)的留存數(shù)據(jù),按照模型就可以反算出 C 值和 R 值,從而推算出將來幾日(周、月)的留存率數(shù)據(jù)。

這里很多童鞋可能會問,我的產(chǎn)品留存率趨勢不是按照這個模型衰減的,我的回答是產(chǎn)品的留存衰減一定是滿足衰減冪函數(shù)模型的,如果你的產(chǎn)品衰減不遵循這個模型,一定是產(chǎn)品中摻雜了很多非正常的噪聲,這個時候你就要高度警惕了。我之前見過一些產(chǎn)品就因為渠道刷量、刷回訪造成產(chǎn)品留存違背模型的情況,這個時候你就需要問責(zé)渠道了。用這個模型除了可以監(jiān)控渠道異常之外還可以通過短期的數(shù)據(jù)來預(yù)測長期的留存成本,快速監(jiān)控渠道質(zhì)量。

下面我們來通過幾張圖來看看 C 和 R 這兩個參數(shù)對留存率的影響,用另一款產(chǎn)品來說明:

1. R值對留存率的影響

上圖左邊是一個標(biāo)準(zhǔn)的冪函數(shù)隨著冪指數(shù)變化的趨勢圖,從圖中可以看到,冪指數(shù)alpha越接近0(越大),冪函數(shù)衰減的速度越慢;冪指數(shù)越小,冪函數(shù)衰減的速度越快;右邊的圖片是一個實際產(chǎn)品的數(shù)據(jù),假設(shè)通過不斷優(yōu)化產(chǎn)品,讓 R 值從 -0.825 提升到 -0.525 的趨勢,從圖上看出,當(dāng)冪指數(shù)提升到-0.525的時候,第6日的留存率提升了5個百分點以上。因此要提高留存率,一定要努力提高 R 值。

2. C值對留存率的影響

C 值代表留存的起點,從圖中可以看出 C 值越高,以后各日(周,月)的留存值也會更大,這也就是我們常說的出身決定未來啊O(∩_∩)O哈哈~

上面的內(nèi)容比較燒腦啊,很多數(shù)學(xué)公式,我本不想故作高深,但是為了把模型說明白,只能這樣。數(shù)學(xué)不好的童鞋們,也不用關(guān)注太多公式的事情,只需要知道一件事情 產(chǎn)品的留存率滿足數(shù)學(xué)規(guī)律并和兩個參數(shù)相關(guān),一個是次日(周,月)的留存,一個是留存的衰減趨勢,改善產(chǎn)品留存就努力改善這兩個參數(shù)。

說到這里可能很多童鞋會問,我產(chǎn)品的 C 值和 R 值到底是好是壞了,這個沒有一個統(tǒng)一的結(jié)論,因為產(chǎn)品解決的需求不一樣,新增用戶規(guī)模不一樣,沒有統(tǒng)一的標(biāo)準(zhǔn)。不過對于一個剛上線的純移動互聯(lián)網(wǎng)產(chǎn)品,用戶規(guī)模不大的情況下,如果 C 值低于35, R 值小于-0.6的話,就要警惕產(chǎn)品是否有問題了。

產(chǎn)品的黏度指標(biāo)

黏度指標(biāo)對產(chǎn)品是很關(guān)鍵的指標(biāo),它說明了用戶使用產(chǎn)品的頻次,我們通常用MAU/DAU(MAU=月活,DAU=日活) 來定義產(chǎn)品的黏度指標(biāo),這個比值代表用戶回訪的天數(shù)(幾天會用一次產(chǎn)品),當(dāng)MAU/DAU=1的話說明這款產(chǎn)品用戶每天都用;為了更方便理解,這個指標(biāo)也可以這樣計算 DAU/MAU * 30 ,這個指標(biāo)代表用戶一個月會用幾次產(chǎn)品,下面是兩個產(chǎn)品的實際數(shù)據(jù):

產(chǎn)品1的用戶一個月會用2.6次,產(chǎn)品2的用戶一個月會用5次,是產(chǎn)品1的一倍,說明產(chǎn)品2比產(chǎn)品1更有黏度。對于游戲或者社交類產(chǎn)品的MAU/DAU一般都會小于5,如果一款游戲產(chǎn)品MAU/DAU 大于5的話,這款游戲的盈利能力就會有問題,工具類產(chǎn)品這個值也不能超過10,小于7基本是比較合理的。

理解活躍用戶(Active User)

前面這么燒腦的研究留存率的規(guī)律和黏度的指標(biāo),其實都是為了下面真正探究一個產(chǎn)品活躍用戶的規(guī)律。很多人最關(guān)注的往往就是產(chǎn)品的日活,它代表一個產(chǎn)品活躍用戶的總量,也通常是很多產(chǎn)品的終級KPI。因此理解日活的規(guī)律是合理制定KPI,并找到可達目標(biāo)方案最有效的辦法。

DAU(MAU) = 當(dāng)日(月)新增 + 累計歷史日(月)留存

我們以MAU來簡單說明,以上面舉例的一個產(chǎn)品的留存數(shù)據(jù)為基礎(chǔ),假設(shè)該產(chǎn)品每月新增100個用戶,MAU的累計圖如下:

從圖上大家可以看到柱狀同色用戶量的衰減和留存率的衰減是一致的。從活躍用戶的構(gòu)成上來看,除了新增用戶之外,活躍用戶的另外一部分是由歷史留存用戶構(gòu)成,而歷史留存用戶由留存率決定。為了進一步說明活躍用戶和留存率的關(guān)系,我們還是拿上圖的產(chǎn)品,如果留存模型中的 R 值變化,MAU會有什么樣的影響:

從圖中可以看出,從相同的起點開始, R =-0.625的產(chǎn)品比 R =-0.825,在第7個月的時候總活躍用戶多了8%,如果時間更久的話,差距會更大,足見R對長期活躍用戶的影響是非常大的。

預(yù)測你產(chǎn)品的DAU

DAU是大家最關(guān)注的宏觀指標(biāo),是很多產(chǎn)品的KPI,所以如何科學(xué)合理的制定DAU 的目標(biāo)是非常關(guān)鍵的。預(yù)測DAU其實也不難,按照下面3個公式就可以完成預(yù)測:

  1. 預(yù)測DAU = 預(yù)測MAU / 預(yù)測(MAU/DAU)
  2. 預(yù)測MAU = 預(yù)測當(dāng)月新增 + SUM(歷史月留存)
  3. 歷史月留存 = 歷史月新增 * 歷史月到預(yù)測當(dāng)月的留存預(yù)測值

歷史月到預(yù)測當(dāng)月的留存預(yù)測值 是通過留存率模型中 C 值和 R 值來計算的。

從上面的公式可以看到,預(yù)測DAU的關(guān)鍵控制指標(biāo)為以下四個:

  1. C 值 次月留存率
  2. R 值 月留存衰減趨勢
  3. MAU/DAU
  4. 月新增(MNU)

如果用數(shù)學(xué)公式表達的話,

DAU = f(C,R,MAU/DAU, MNU)

通過上面的公式可以向后預(yù)測多月之后的DAU值,比如說年初要設(shè)定年末的DAU目標(biāo),根據(jù)產(chǎn)品現(xiàn)在的模型參數(shù),預(yù)計改善的產(chǎn)品參數(shù)目標(biāo)和新增用戶目標(biāo),準(zhǔn)確預(yù)測DAU,預(yù)測DAU滿足預(yù)期目標(biāo)之后,再反過來就可以得到要實現(xiàn)的產(chǎn)品模型參數(shù),形成分解目標(biāo)。有了分解的目標(biāo),最終完成整體目標(biāo)的可能性就高多了。

預(yù)測的方法上面已經(jīng)說清楚了,用下面的幾張表格說明具體計算的過程,我們根據(jù)2015年10月份到2月份的產(chǎn)品數(shù)據(jù)來預(yù)測2016年4-6月份的DAU數(shù)據(jù):

1. 根據(jù)現(xiàn)有的留存數(shù)據(jù)計算留存率參數(shù)

黃色部分就是根據(jù)現(xiàn)有數(shù)據(jù)估算的 C 值和 R 值,綠色部分是根據(jù)留存率模型估算的往后的留存率數(shù)據(jù)。

2. 設(shè)定預(yù)計導(dǎo)入的新增用戶,并根據(jù)估算留存率數(shù)據(jù),計算逐月的留存用戶

a.設(shè)定預(yù)計導(dǎo)入的新增用戶如下:

b.依次計算逐月的留存率

c.逐月計算月留存用戶

如圖中可以看到,為了計算16年6月的MAU,需要把這之前的所有月份(2015年10月到2016年5月)到2016年6月份留存下的用戶全計算出來。

3. 累計歷史留存用戶,計算MAU

圖中黃色是16年6月份的MAU,從圖中公式可以看出它是歷史所有月留存用戶和當(dāng)月的新增用戶之和。

4. 以往MAU/DAU均值作為 MAU/DAU的預(yù)測值

5. 依據(jù) 估算MAU值,MAU/DAU,計算DAU

圖中黃色部分為計算出來的DAU,后面并根據(jù)實際值,計算了估算誤差,經(jīng)過多次驗證,這個模型估算的誤差較小,不會超過10%,如果沒有大幅的數(shù)據(jù)波動,一般都會在5%以內(nèi)。在用這個模型的時候大家,可以通過調(diào)整參數(shù),預(yù)測指定時間的DAU,辦法就是調(diào)整產(chǎn)品的參數(shù)和新增用戶量達成DAU目標(biāo),從而反得出產(chǎn)品控制參數(shù)。

警惕DAU這個虛榮指標(biāo)

前面講過DAU往往是大家最關(guān)注的宏觀指標(biāo),也是很多產(chǎn)品的KPI,但是DAU是個絕對值指標(biāo),根本反應(yīng)不了產(chǎn)品的實際狀況,反而這個指標(biāo)往往容易騙人,經(jīng)常會給產(chǎn)品經(jīng)理帶來沾沾自喜的感覺,但是我想告訴大家的是,日活其實是個虛榮指標(biāo),如果你的產(chǎn)品沒做好,再高的日活都是浮云。由于DAU 是新增用戶和歷史留存用戶之和,大量的新增很快會推高日活,導(dǎo)致日活不斷增長,但是如果產(chǎn)品的留存數(shù)據(jù)不好,黏度指標(biāo)不高的的話,歷史留存用戶的增量會越來越小,甚至成為負增長,這時候你的產(chǎn)品日活主要是靠新增拉動,一旦新增降下來,日活將劇烈下降。

這套模型我想告訴大家的是產(chǎn)品的關(guān)鍵指標(biāo)是留存和黏度參數(shù),DAU可以是產(chǎn)品的整體目標(biāo),但是達成的手段是優(yōu)化留存和黏度這些產(chǎn)品參數(shù),如果沒有這些數(shù)據(jù)的提升,導(dǎo)入再多的新增也沒有用,會全部流失掉。

這篇文章理論性比較強,涉及到一些數(shù)學(xué)模型,很多童鞋如果沒有實戰(zhàn)過的話不一定能完全掌握,大家在閱讀或?qū)嶋H運用過程中如果有問題可以隨時找我溝通。

DAU預(yù)測模型文件下載:

作者提供鏈接: http://pan.baidu.com/s/1c1GRwQ0 密碼: jwnr

人人官方鏈接: http://pan.baidu.com/s/1ge6CveF 密碼: wxxc

 

作者:李建剛,路況電臺創(chuàng)始人兼CEO

鏈接:https://zhuanlan.zhihu.com/p/20760624

本文由 @李建剛 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 為什么不直接用C、R函數(shù)和日新增用戶數(shù)去直接計算DAU呢?為什么還需要引入月新增,粘性指標(biāo)和

    來自浙江 回復(fù)
  2. 請問如何提升R值和C值呢?有沒有相關(guān)文章可以推薦呢?謝謝~

    來自上海 回復(fù)
  3. ?

    來自廣東 回復(fù)
  4. 上面的公式是基于歸納演繹推出來的,但是歸納演繹得出的結(jié)論有一個隱含條件就是:未來會和過去一樣。但是市場是不斷變化的,上面推導(dǎo)出的公式又能適用多久?

    來自浙江 回復(fù)
    1. 所以就是要不斷【監(jiān)測】數(shù)據(jù),【預(yù)測】未來,通過運營和產(chǎn)品手段改變核心變量,并關(guān)注數(shù)據(jù)【檢測】策略,做負熵。

      來自四川 回復(fù)
  5. 你好,文章寫得非常好,很值得我們大家學(xué)習(xí)。有個地方我稍微提出以下我的異議,R = average( log2(C2/C1),log3(C3/C1),…,logn(Cn/C1) )這里您使用的是均值的算法,我認為這個地方更適用于牛頓上山或牛頓下山的算法進行迭代,不過要判斷級數(shù)的收斂性,用平均的方法我沒有驗證與迭代方法具有多大的偏差。期待向您繼續(xù)交流學(xué)習(xí),謝謝。

    來自北京 回復(fù)
  6. 學(xué)習(xí)了,雖然有點難,但做就要做到專業(yè)!

    來自重慶 回復(fù)
  7. 我按照冪函數(shù)算了一下, 有百分之一點幾的誤差。還挺大的

    來自上海 回復(fù)
  8. 腦子已經(jīng)燒壞,請收下我的膝蓋 ?

    來自天津 回復(fù)
  9. 不明覺厲啊

    來自北京 回復(fù)
  10. 頭疼

    來自廣東 回復(fù)