數(shù)據(jù)產(chǎn)品經(jīng)理:從歸因模型延伸到轉(zhuǎn)化漏斗
歸因是個有意思的問題,許多領(lǐng)域都在研究,比如心理學(xué)中就有“基本歸因錯誤”(Fundamental Attribution Error,F(xiàn)AE);而廣告和金融領(lǐng)域更是對歸因進行了深入研究,來輔助廣告主和投資人獲得更大的收益,避免損失。
一、歸因問題
在前一篇《數(shù)據(jù)產(chǎn)品經(jīng)理:6大數(shù)據(jù)分析平臺的“世界觀”》中主要講解了6個數(shù)據(jù)分析平臺的數(shù)據(jù)模型,這6個平臺都是大家耳熟能詳?shù)?,特別是對于中小型企業(yè)和團隊,在保證數(shù)據(jù)分析效果的同時,能有力的減少創(chuàng)業(yè)初期階段在數(shù)據(jù)上的成本投入。
但在結(jié)尾的地方,我們留下了一個沒有展開的問題——歸因。
事情是這樣發(fā)生的:
我們使用了LinkedIn經(jīng)典的“魔法數(shù)字”案例,也就是“1周內(nèi)增加5個社交好友的用戶更容易留存”。
但是這個結(jié)論是如何的出來的呢?
1周內(nèi)可能發(fā)生很多事情,比如用戶年齡段的改變、地理位置的改變、偏好的改變等等,我們是如何將最終的留存率“歸功于”社交好友數(shù)量的呢?而且這5位社交好友是否同等重要呢?
這就是歸因問題。
歸因的正面作用,它可能是全部數(shù)據(jù)分析要解決的唯一問題——解釋“為什么”,但反面作用,歸因不當(dāng)將會摧毀整個分析的可信度。而且,很可能我們從原始數(shù)據(jù)的收集和整理方法中,就已經(jīng)定下了一個大敗局——終將“潰于蟻穴”。
為了解決這樣的問題,在數(shù)據(jù)平臺上通常會提供幾種歸因的方案供客戶選擇:
1. 首次互動歸因模型
也就是用戶第一次做某件事,在數(shù)據(jù)中通常表現(xiàn)為時間最早、順序號最小等等。當(dāng)然,這是理想情況。在現(xiàn)實中由于種種原因,我們無法從用戶的最終轉(zhuǎn)化一直向前追溯,直至真實的“首次互動”。遇到這種情況,也就只好采用能追溯到的、并且與業(yè)務(wù)相關(guān)的首次行為了。
比如:在用戶的一次購買轉(zhuǎn)化中,我們可以用訂單號追蹤;沒有訂單號,可以用賬號;賬號沒有,可以用訪問會話(Session ID);會話沒有,可以用設(shè)備ID;如果實在是什么都沒有了,那么用戶以前的行為,我們只好當(dāng)它不存在。
2. 最終互動歸因模型
也就是用戶最后一次做某件事,對應(yīng)的在數(shù)據(jù)中就表現(xiàn)為時間最近、順序號最大等等。同樣,在最終互動中也存在“數(shù)據(jù)問題”——直接訪問流量(Direct Traffic),也就是那些找不到前置行為卻完成了轉(zhuǎn)化的流量。為了排除它們的干擾,有時也采用最終非直接互動歸因。
3. 線性歸因模型
也就是平均分。比如前面的LinkedIn的例子,如果用戶添加了5個社交好友并留存下來,那么前面的5個社交好友“同等重要”,全都是促成最終結(jié)果的重要因素。
4. 加權(quán)歸因模型
也就是給多個促成因素分配一定的權(quán)重。
比如:如果用戶從某商城中看了許多商品才下單,在訂單頁點擊了提交按鈕,在支付頁點擊了支付按鈕,在訂單完成頁點擊了查看訂單詳情按鈕。一套動作下來,這筆訂單應(yīng)當(dāng)歸功于那個按鈕呢?
顯然在隨意瀏覽的過程中,點擊行為沒有那么重要。相比之下,后邊的三個按鈕就重要得多。
那么怎么定權(quán)重呢?前面的線性相當(dāng)于等權(quán),還有時間衰減模型、U型/W型/Z型模型。這方面文章很多,不再展開。
以上幾種方法是比較簡單易懂的,而且可以想象計算量與計算復(fù)雜度都不大。但是對于歸因這么重要的一件事,只有這些簡單粗暴的辦法么?
當(dāng)然不是。
比如下面這個:
5. 馬爾科夫歸因
這是把用戶的轉(zhuǎn)化行為比作“馬爾科夫鏈”,來計算各個狀態(tài)之間的轉(zhuǎn)化概率。簡單來說,就是“明天只與今天有關(guān),而與昨天無關(guān)”。這樣,我們也就可以計算出用戶轉(zhuǎn)化路徑中的各個步驟之間的概率,并最終算出權(quán)重。如果我們用這個權(quán)重來代入前面的加權(quán)歸因,是不是瞬間感覺高大上了么?(如果對概率論還有印象的同學(xué),可能會想起一個十分類似的東西——貝葉斯公式。)
二、歸因模型的選擇
Well,不知道各位小伙伴是什么感覺,反正我每次看到這種“N種方法”的狀況是很頭疼的,究竟怎么選呢?
這是個問題。
我們曾介紹:GrowingIO只提供了兩種歸因模型——首次和最后(在手冊中“埋點事件”的“歸因方式”一節(jié),參考:https://docs.growingio.com/docs/),而Google Analytics for Firebase則提供了歸因模型。
至于其他沒有“明說”的平臺,為了節(jié)(lan)?。╝i)時(wan)間(qi),我是沒有驗證。
這樣看,似乎不同的平臺都有自己在模型上的取舍。那是否存在一套通用的模型呢?為什么我們不直接采用看上去就很高大上的馬爾科夫鏈,而還是要用最簡單粗暴的歸因方式呢?
這里主要考量兩個因素:
1. 業(yè)務(wù)形態(tài)
說是業(yè)務(wù)形態(tài),但其實是個比較抽象的概念。落實到數(shù)據(jù)上,就是我們究竟能拿到什么樣的數(shù)據(jù)。(數(shù)據(jù)內(nèi)容是《數(shù)據(jù)產(chǎn)品經(jīng)理:6大數(shù)據(jù)分析平臺的“世界觀”》這篇的主題,有興趣的同學(xué)可以翻回去看看)。
第三方平臺通常以行為分析為重,但與業(yè)務(wù)相關(guān)的數(shù)據(jù)就不那么容易拿到了,比如商品ID、交易金額、支付渠道等等。
因此:即使我們把事件模型收集到的數(shù)據(jù)拼成一個長長的鏈條,但是除了直接導(dǎo)致最終轉(zhuǎn)化的這個環(huán)節(jié)以外,前面的環(huán)節(jié)很可能根本沒有上報業(yè)務(wù)相關(guān)的數(shù)據(jù),或者上報的信息不完整、不準(zhǔn)確。所以我們可以輕松地追蹤行為,卻不太容易從促成轉(zhuǎn)化的角度追蹤所有相關(guān)的行為,除非詳細(xì)地配置了各種自定義事件。
因此,除非在業(yè)務(wù)形態(tài)(產(chǎn)品形態(tài))上以用戶行為為主(比如短視頻類的瀏覽、點贊、收藏、轉(zhuǎn)發(fā)),否則只好在歸因方面采用相對簡單的歸因方法。
而企業(yè)內(nèi)部的數(shù)據(jù)則更加貼近自己的核心業(yè)務(wù),可以方便的拿到核心業(yè)務(wù)數(shù)據(jù)。這就適合業(yè)務(wù)形態(tài)(產(chǎn)品形態(tài))比較復(fù)雜的情況了。我們也可以相對容易地追蹤到促成轉(zhuǎn)化的整個流程。比如電商中的“逛”就是個挺難分析的過程,還有金融中的投資行為等等。它們都需要與業(yè)務(wù)數(shù)據(jù)深度結(jié)合進行分析,也適合使用相對復(fù)雜的歸因模型。比如用來分析投資組合的Brinson模型。
2. 計算量
第二個要考慮的因素就是計算量。計算量主要來源于兩個方面:數(shù)據(jù)量與計算復(fù)雜度。
數(shù)據(jù)量比較好理解,典型的數(shù)據(jù)量爆發(fā)場景,就是每每有企業(yè)自豪地宣布日活數(shù)據(jù)、留存數(shù)據(jù)、交易額/交易人數(shù)等數(shù)字的時候。這些數(shù)字的背后,都是浩如煙海的數(shù)據(jù)內(nèi)容。
那么什么叫計算復(fù)雜度?這個概念可繁可簡。比如,我們拿到的數(shù)據(jù)是3和10兩個數(shù)字,你來體會一下心算“3×10”與“3的10次方”之間的區(qū)別吧,大概就是這個感覺。
三、歸因的延伸
前面講到的基本都是歸因模型的直接應(yīng)用,也就是“給轉(zhuǎn)化找原因”。
但是既然我們說了歸因是分析的全部目的也不為過,那么歸因模型也應(yīng)該有一些延伸應(yīng)用。比如看看下面這個問題:
既然歸因是給轉(zhuǎn)化找原因,而說到轉(zhuǎn)化大家一定會想起漏斗模型,那么歸因與漏斗之間是什么關(guān)系?還有前面提到的轉(zhuǎn)化路徑,難道不是漏斗么?嗯……我已經(jīng)表達(dá)過對于N多模型的厭惡之情,所以這幾個之間的關(guān)系一定要弄明白。
我們從各種數(shù)據(jù)采集中得到的信息是很有限的,它們不會超過我們預(yù)先能想到要看的那些指標(biāo),包括頁面上元素的曝光、點擊、滑動等基本行為,以及與業(yè)務(wù)相關(guān)的發(fā)布內(nèi)容、拍攝視頻、點贊、收藏、下訂單、完成支付等等行為。即使是“無埋點”方案,能夠采集到的內(nèi)容也是預(yù)先設(shè)計好的,并且是更基礎(chǔ)、更通用的指標(biāo)。
很顯然,這些基本的指標(biāo)決不能跟“用戶行為”劃等號,充其量是用戶行為的子集,并且是很小的一個子集。這其中有技術(shù)問題,有認(rèn)知問題,有各種各樣的問題。那么用戶行為到底是什么樣的呢?
其實這個問題不重要,重要的是,我們究竟關(guān)心哪些行為。這就是漏斗。
在當(dāng)今的分析中,大多數(shù)人會采使用轉(zhuǎn)化漏斗,來描繪一個對于業(yè)務(wù)或產(chǎn)品來說最關(guān)鍵的路徑。用戶在這個路徑上如何流動,決定了業(yè)務(wù)或產(chǎn)品是否存在問題、是否還有發(fā)展空間。而這個轉(zhuǎn)化漏斗背后,則是一個價值產(chǎn)生的過程(消費、投資、……),或者是用戶的一個心理過程(學(xué)習(xí)、表達(dá)、……)。
所以雖然都是行為,漏斗與行為軌跡的出發(fā)點就是不同的——漏斗是業(yè)務(wù)或產(chǎn)品的角度,行為軌跡是用戶的角度。兩個往一起一碰,這就有意思了——我希望用戶趕快買,但是用戶就是轉(zhuǎn)轉(zhuǎn)悠悠的不下單。TA在干什么呢?拼出來一個行為路徑看看TA到底在干什么。
總結(jié)起來,漏斗是從業(yè)務(wù)或產(chǎn)品自身的形態(tài)出發(fā),在所有用戶可能產(chǎn)生的行為路徑中,尋找出真正重要的節(jié)點;而歸因則是將漏斗進行橫向拆解,研究促成每一個節(jié)點的真正原因是什么,以及如何加強。
比如下面這張圖,綠色圓圈才是我們的轉(zhuǎn)化漏斗,與藍(lán)色箭頭則找出了每一段的“直接因素”。當(dāng)然,這畫的是理想情況。如果我們的產(chǎn)品設(shè)計出現(xiàn)問題了,則會看到越來越多的用戶經(jīng)過了其他的路徑。
不知道你有沒有這種感覺,面對表現(xiàn)不佳的漏斗,只能干著急而不知道從何下手。因為漏斗本身就不太具備可操作性(Actionable),畢竟節(jié)點是你選的,除非你承認(rèn)自己選錯了。而行為路徑和歸因則給漏斗模型補上了可操作性。
所以真的有很多模型要學(xué)么?我沒覺得。
這個話題我們放在下一篇,嘿嘿……
本文由 @御豪同學(xué) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
下一篇在哪里??
棒
請問下鏈接還有沒有可能更新呀,現(xiàn)在都是404
謝謝反饋,已經(jīng)更新鏈接
太理論了,看不下去,先Mark下,后面再讀吧,大神微信多少,加下微信吧:neutyz
現(xiàn)在GrowingIO有線性歸因了~
做數(shù)據(jù)產(chǎn)品的需要具備的基本技能都有哪些呢
“1周內(nèi)增加5個社交好友的用戶更容易留存”
言簡意賅,牛B