從數(shù)據(jù)產(chǎn)品經(jīng)理視角,聊聊事件模型
上一篇文章寫了埋點(diǎn)以及基礎(chǔ)技術(shù),本篇介紹埋點(diǎn)時(shí)常使用的事件模型。
一、事件模型
在傳統(tǒng)的web時(shí)代,我們經(jīng)使用pv、uv來(lái)統(tǒng)計(jì)某個(gè)頁(yè)面/某個(gè)按鍵的使用情況(如:umeng)。
但隨著數(shù)據(jù)精細(xì)化,產(chǎn)品迭代&數(shù)據(jù)分析更期望深度分析用戶行為(新老用戶的行為差異、各渠道用戶轉(zhuǎn)化率、使用app時(shí)的行為路徑),另一方面推薦也需要用戶粒度的行為數(shù)據(jù)以實(shí)現(xiàn)精準(zhǔn)化,但這些是“基于頁(yè)面、按鈕的計(jì)數(shù)統(tǒng)計(jì)”無(wú)法得到,因而事件模型由此出現(xiàn)。
簡(jiǎn)單來(lái)說(shuō),事件模型非常像5w2h,它通過(guò)(who、when、where、how、what)記錄了誰(shuí)在某個(gè)時(shí)間點(diǎn)、某個(gè)地方、用某種方式、做了某一件事情(某個(gè)行為)。who、when、where、how、what即是事件模型的五個(gè)要素。
- Who:即誰(shuí)參與了這個(gè)事件,唯一標(biāo)識(shí)(設(shè)備/用戶id),可以是 匿名的設(shè)備id(idfa\idfv\android_id\imei\cookie)、也可以是后臺(tái)生成的賬戶id(user_id,uid)、也可以是其他【唯一標(biāo)識(shí)】?,F(xiàn)在很多公司都有自己的唯一設(shè)備id(基于某個(gè)策略產(chǎn)生的唯一標(biāo)識(shí)),e.g.阿里有OneId。
- When:即這個(gè)事件發(fā)生的實(shí)際時(shí)間。該時(shí)間點(diǎn)盡可能精確,有利于行為路徑分析行為排序,像神策會(huì)精確到毫秒。
- Where:即事件發(fā)生的地點(diǎn)。可以通過(guò)ip地址解析國(guó)家、省份、城市;如果期望更細(xì)致的數(shù)據(jù),如果住宅、商業(yè)區(qū)等,需要額外地理信息數(shù)據(jù)庫(kù)來(lái)做匹配。
- How:即用戶用某種方式做了這個(gè)事件,也可以理解為事件發(fā)生時(shí)的狀態(tài)。這個(gè)包括的就比較多,可以是進(jìn)入的渠道、跳轉(zhuǎn)進(jìn)來(lái)的上級(jí)頁(yè)面、網(wǎng)絡(luò)狀態(tài)(wifi\4g\3g)、攝像頭信息、屏幕信息(長(zhǎng)x寬)等。而如使用的瀏覽器/使用的App,版本、操作系統(tǒng)類型、操作系統(tǒng)版本、進(jìn)入的渠道等 經(jīng)常設(shè)置為“預(yù)設(shè)字段”。
- What:即用戶做了什么,也是event模型的主題。這里應(yīng)該盡可能詳細(xì)的描述清楚行為,如搜索(搜索關(guān)鍵字、搜索類型)、觀看(觀看類型、觀看時(shí)長(zhǎng)/進(jìn)度、觀看對(duì)象(視頻id))、購(gòu)買(商品名稱、商品類型、購(gòu)買數(shù)量、購(gòu)買金額、 付款方式)等等。
二、事件模型對(duì)應(yīng)埋點(diǎn)文檔
事件模型反映在埋點(diǎn)上報(bào),即觸發(fā)一個(gè)事件時(shí)上報(bào)對(duì)應(yīng)日志,記錄who、when、where、how、what。對(duì)應(yīng)的統(tǒng)計(jì)文檔,即埋點(diǎn)文檔,在小型創(chuàng)業(yè)公司通常是excel來(lái)傳遞,有數(shù)據(jù)平臺(tái)部門的公司通常會(huì)有專門的維護(hù)后臺(tái)——埋點(diǎn)管理后臺(tái),以同步埋點(diǎn)的增刪改查看。
上述所說(shuō)的事件模型的埋點(diǎn)文檔通常會(huì)包括:
- 事件類型,像“停/啟動(dòng)”、“退出app”這種常規(guī)事件會(huì)設(shè)置為預(yù)設(shè)事件,將自動(dòng)采集,而非預(yù)設(shè)事件則可以支持各種業(yè)務(wù)需求。
- 事件名稱(英文/中文),能夠準(zhǔn)確描述事件,區(qū)別與其他事件,中文名可以用戶數(shù)據(jù)后臺(tái)顯示。
- 事件參數(shù)(英文/中文),能夠準(zhǔn)確定義參數(shù),區(qū)別與其他事件,不同事件的相同參數(shù)盡量保持一致,中文名可以用戶數(shù)據(jù)后臺(tái)顯示。
- 參數(shù)值,備注合理參數(shù)的范圍,例舉參數(shù)的值。
- 類型,參數(shù)值記錄的類型。由于不同類型支持?jǐn)?shù)據(jù)分析后臺(tái)查詢方式不同,比如文本類型可以選擇單個(gè)值,數(shù)值類型使用區(qū)間(大于、小于等),定義參數(shù)類型時(shí)切記考慮通用性、以及分析后臺(tái)的便利性。
- 新增時(shí)間(版本),新增該埋點(diǎn)的時(shí)間點(diǎn)。
- 刪除時(shí)間(版本),刪除該埋點(diǎn)的時(shí)間點(diǎn)。
三、日志上報(bào)
剛有提到“事件模型反映在埋點(diǎn)上報(bào),即觸發(fā)一個(gè)事件時(shí)上報(bào)對(duì)應(yīng)日志,記錄who、when、where、how、what。”?相比行為打包上報(bào)(非實(shí)時(shí)數(shù)據(jù)),有效減少數(shù)據(jù)延遲/丟失比例。
非實(shí)時(shí)的日志上報(bào)sdk中,因上報(bào)策略不同,即使是同一指標(biāo),基于不同的sdk統(tǒng)計(jì)到的數(shù)據(jù)會(huì)有差異,常見問(wèn)題:延遲上報(bào)、數(shù)據(jù)丟失。
上報(bào)策略將會(huì)影響數(shù)據(jù)展示,使業(yè)務(wù)方懷疑數(shù)據(jù)可信度,如:延遲上報(bào)的數(shù)據(jù),再次處理后會(huì)引起數(shù)據(jù)回流(e.g.第一天上報(bào)90%的行為,相應(yīng)報(bào)表則會(huì)基于這90%統(tǒng)計(jì)展示;第二天再次上報(bào)5%前一天的數(shù)據(jù),相應(yīng)報(bào)表則會(huì)基于95%統(tǒng)計(jì)展示,引起兩個(gè)時(shí)間點(diǎn)看到的數(shù)據(jù)不一樣。)
- 實(shí)時(shí):用戶行為發(fā)生后立即上報(bào);
- 非實(shí)時(shí):當(dāng)一系列的行為都發(fā)生后,打包上報(bào)、最常見的app退出/下次啟動(dòng)時(shí)上報(bào)當(dāng)次/上一次用戶行為。
當(dāng)前的事件模型上報(bào)日志示例:
{
“uid”:”1234566″ ? ? ? ? ? ? ? ?##唯一標(biāo)識(shí)
“time”:”1534065122″ ? ? ? ?##時(shí)間
“type”:”pre” ?????????????????? ???##預(yù)設(shè)事件
“event”:”start_up” ????????????##事件名稱
parameters:{
“$app_version”:”1.0″? ? ? ? ##預(yù)設(shè)參數(shù)
“$wifi”:”wifi”?????????????? ???##預(yù)設(shè)參數(shù)
“$ip”:”108.66.35.65″? ? ? ?##預(yù)設(shè)參數(shù)
“masterid”:”12345″? ? ? ? ?##事件參數(shù)
“masterrate”:”666″? ? ? ? ?##事件參數(shù)
“videoid”:”987654321″? ? ##事件參數(shù)
“videotype”:”美食”? ? ? ? ? ##事件參數(shù)
“videotime”:”100s”? ? ? ##事件參數(shù)
“playtime”:”60s” ? ? ? ??? ?##事件參數(shù)
}
}
三、事件模型的分析應(yīng)用
事件模型結(jié)合其主體(用戶/設(shè)備)的屬性信息可以支持各種分析模型(漏斗分析模型、留存分析模型、路徑分析模型、用戶分群模型)。
用戶屬性常記錄年齡、性別、職業(yè)、喜好等不易發(fā)生變化的。
(1)事件分析&用戶分群模型:任一事件可以結(jié)合預(yù)設(shè)字段和用戶屬性來(lái)統(tǒng)計(jì)分析,如 18歲以下的女生在這個(gè)事件上的表現(xiàn),反之也可以得到任一時(shí)間在 屬性維度上的分布,如:這個(gè)事件觸發(fā)用戶的年齡分布、地域分布、機(jī)型分布等。
(2)漏斗分析模型&用戶分群模型:分析一個(gè)多步驟過(guò)程中每一步的轉(zhuǎn)化與流失情況。結(jié)合用戶屬性,可以分析各維度的漏斗,以找到轉(zhuǎn)化低的瓶頸。例如:不同渠道的注冊(cè)漏斗,是否存在某個(gè)渠道在某個(gè)轉(zhuǎn)化過(guò)程中表現(xiàn)異常。
(3)留存分析模型&用戶分群模型:進(jìn)行初始行為的用戶中,有多少人還會(huì)進(jìn)行該行為。結(jié)合用戶屬性,可以細(xì)分群體優(yōu)化增長(zhǎng)、精細(xì)化運(yùn)營(yíng)活動(dòng)。
- 新用戶留存:第一次訪問(wèn)后繼續(xù)訪問(wèn)的用戶占比。
- xxx行為留存率:進(jìn)行xxx行為的用戶中,有多少人還會(huì)進(jìn)行xxx行為,通常來(lái)衡量某個(gè)功能的用戶粘度
- xxx行為后,做yyy行為:進(jìn)行xxx行為的用戶中,有多少人會(huì)進(jìn)行yyy行為。eg.第一天加入購(gòu)物車的用戶中,在第二天付款的占比。
(4)路徑分析模型&用戶分群模型:則可以清晰的看到訪問(wèn)當(dāng)前頁(yè)面的所有用戶中,緊接著有多少進(jìn)入了詳情頁(yè)、有多大比例使用了xx/yy功能、有多大比例進(jìn)入了分類頁(yè)面。結(jié)合不同屬性的用戶在路徑分析模型上的差異點(diǎn)、待優(yōu)化點(diǎn)。
此外,基于“事件模型”采集的數(shù)據(jù),也更好的服務(wù)于:
- 可視化/報(bào)表展示;
- 數(shù)據(jù)分析;
- 實(shí)時(shí)推薦;
- ab測(cè)試等。
本文由 @?cecil 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Pexels,基于 CC0 協(xié)議
加個(gè)微信可以?
數(shù)據(jù)產(chǎn)品經(jīng)理主要做什么呢
“二、事件模型對(duì)應(yīng)埋點(diǎn)文檔”中第五條類型中提到的文本類型和表格中提到的字符類型是同一個(gè)概念嗎?
是相同的
寫的非常好,最近讀者我,在做公司APP埋點(diǎn)方案、日志格式,事件模型很有啟發(fā)意義……
埋點(diǎn)文檔是數(shù)據(jù)產(chǎn)品出?
可以加個(gè)微信嗎?
可以
看到“事件模型非常像5w2h,它通過(guò)(who、when、where、how、what)”,百科一下5W2H分別是what why who when where how howmuch,個(gè)人認(rèn)為嚴(yán)謹(jǐn)總是沒錯(cuò)的
是的,所以是非常像5w2h~
?
好像樓主并沒有按照5W2H來(lái)分析啊,少了why ,howmuch ,樓主可以加上在分析下嗎?