如何進行指標質(zhì)量治理——指標系統(tǒng)(提質(zhì)篇)
編輯導(dǎo)語:如今在企業(yè)的發(fā)展中,指標治理已經(jīng)成了比較關(guān)鍵的一步,并且如今數(shù)據(jù)在企業(yè)各個業(yè)務(wù)中的作用也很大,所以一個優(yōu)質(zhì)的指標系統(tǒng)可以有效率的提高工作進度;本文作者分享了關(guān)于指標質(zhì)量治理的分析,我們一起來了解一下。
01 指標質(zhì)量治理概述
指標質(zhì)量治理主要分為兩個部分:提質(zhì)與增效。
可以簡單從字面進行理解,提質(zhì)就是提升指標質(zhì)量,主要是針對指標本身而言,保障指標在應(yīng)用的過程中不會出現(xiàn)歧義、誤解,并且指導(dǎo)數(shù)倉的規(guī)范化建設(shè);而增效則是增加指標的效益,主要是針對指標與企業(yè)的關(guān)系而言,讓指標在企業(yè)的業(yè)務(wù)活動中,能更高效、更準確地反映出企業(yè)的內(nèi)在情況與業(yè)務(wù)問題,為企業(yè)的發(fā)展方向提供指導(dǎo)。
本文主要是指標提質(zhì)為主,指標增效部分擇日再續(xù)。
02 指標提質(zhì)的工作主要分為兩個階段
A、面對已存在的、混亂的舊指標現(xiàn)狀,進行全業(yè)務(wù)的指標梳理與重建。
B、約束新指標需求,規(guī)范化指標開發(fā)流程。
03 指標提質(zhì)需要達到的目標
A階段:
- 輸出全局指標字典:用于相關(guān)使用人員檢索、查詢、確認;
- 調(diào)整指標的呈現(xiàn):從數(shù)倉字段到報表、數(shù)據(jù)產(chǎn)品的功能上,對梳理后的指標進行優(yōu)化、重整;
- 指導(dǎo)數(shù)倉的重構(gòu):重新規(guī)劃數(shù)倉分層與數(shù)據(jù)加工流程。
B階段:
- 制定指標需求審核流程;
- 輸出指標作業(yè)手冊,從指標的變更、動議到方案、執(zhí)行,制定嚴格的流程;
- 研發(fā)指標系統(tǒng),規(guī)范化指標開發(fā)流程,并最終將指標落地到指標字典。
04 針對指標進行前提的調(diào)研
指標混亂的原因主要有以下 7 個方面(4 個不一致,3 個不清晰):
1)相同指標名稱,口徑不一致
如對于 “新用戶” 的定義:
運營部的口徑是:首次下單并完成支付的用戶。
產(chǎn)品部的口徑是:當日新增注冊的用戶。
兩者描述的是不同的目標用戶群,但由于命名上相同,所以在使用上容易讓人混淆。
2)相同口徑,不同指標名稱
如 “優(yōu)惠券” 的相關(guān)指標:
衡量企業(yè)日常經(jīng)營活動的健康度:優(yōu)惠券抵扣金額。
衡量市場活動效果:優(yōu)惠券消耗金額。
兩者都是衡量優(yōu)惠券抵扣的金額,但由于不同名,所以導(dǎo)致認知上出現(xiàn)了偏差。
3)限定詞不同,但業(yè)務(wù)事實相同的兩個指標,描述事實部分的口徑不一致
如涉及到 “購買” 這個業(yè)務(wù)事實的相關(guān)指標:
白金會員的支付用戶數(shù)中,“支付用戶數(shù)” 的口徑定義是:統(tǒng)計周期內(nèi)下單并且成功支付的去重用戶數(shù)。
黃金會員的支付用戶數(shù)中,“支付用戶數(shù)” 的口徑定義是:統(tǒng)計周期內(nèi)下單并且支付成功,并排除退單的去重用戶數(shù)。
兩者描述的都是 “用戶支付商品訂單” 的這個業(yè)務(wù)過程,記錄都是 “支付” 這個事實,區(qū)別在于,一個限定詞是白金會員,另外一個是黃金會員。但根據(jù)一致性原則,雖然這兩個指標不同,但是“支付”這個事實是相同的,所以“支付用戶數(shù)”這個指標的業(yè)務(wù)口徑、計算邏輯應(yīng)該是一致的。
4)指標口徑與計算邏輯不一致
這個問題的根本是指標的需求方或開發(fā)人員對于指標的認識不清晰,導(dǎo)致指標在開發(fā)邏輯上產(chǎn)生了錯誤導(dǎo)致。如 “近 7 日 UV” 這個指標:
正確的定義是:最近 7 天內(nèi),有登錄過的去重用戶數(shù)。但是在實際應(yīng)用場景中,有的會定義成:“7 日日均 UV” 也就是近 7 日,每日的 UV 相加除以 7 取平均值。
這個問題在梳理的過程中是比較難發(fā)現(xiàn)的,因為它涉及到計算邏輯跟口徑之間的校準,所以需要更仔細地梳理指標開發(fā)邏輯。
5)指標口徑不清晰
部分指標口徑的描述比較籠統(tǒng),或者部分名詞具有多義性。
如描述籠統(tǒng)的 “關(guān)單金額” 的口徑描述是 “關(guān)閉訂單的金額”,但關(guān)閉訂單會有兩種理解,1 是支付后退款,2 是支付前取消;
名詞多義性的:“地址” 這個維度,有多種涵義,如戶籍地址、常住地地址、IP地址、GPS 地址等;
指標描述不清晰,就會讓使用者產(chǎn)生誤解,所以在記錄的時候,必須對這些容易產(chǎn)生誤解的地方進行標注。
6)指標命名不清晰
在實際的業(yè)務(wù)操作過程中,因為各業(yè)務(wù)部門只著眼于自己的業(yè)務(wù),沒有進行全局的設(shè)計,所以有很多指標在自己的部門內(nèi)部使用是沒有問題,但是跟其他部門溝通時就會產(chǎn)生歧義,如 ROI、銷售額、支付人數(shù)等。這些詞都是普通名詞(也即原子指標),是沒有一個具體的指稱的,所以必須將這些普通名詞都加上具體指稱的業(yè)務(wù)對象(也即指標的聚合粒度),變成專有名詞,如:
- xx渠道 ROI,或是xx活動 ROI;
- xx專題銷售額,或是全平臺銷售額;
- xx課程支付人數(shù),或是xx專題支付人數(shù)。
除此之外,所有的指標都包含了一定的統(tǒng)計周期,只要涉及到具體的數(shù)值,就必然要加上統(tǒng)計周期,所有的指標,也都是在最小粒度上去累加出來的,如近一個月xx專題支付人數(shù),是 sum 了 30 個近一天xx專題支付人數(shù),而近一天xx專題支付人數(shù),是 sum 了 24 個近一小時xx專題支付人數(shù),然后到分、到秒。具體需要聚合到什么粒度,根據(jù)具體的需求來設(shè)計,所以上述的指標需要調(diào)整成:
- 近一周xx渠道 ROI;
- 近一月xx專題銷售額;
- 近一年xx課程支付人數(shù)。
7)指標來源和計算邏輯不清晰
這個問題主要出現(xiàn)在一個指標可以通過多個數(shù)據(jù)源,不同的計算邏輯分別統(tǒng)計得出。比如:某個課程的銷售額,既可以從課程的角度,對單個課程的銷售金額進行累加;也可以從用戶的角度,對購買過該課程的用戶的子單的支付金額進行計算。
如果指標有多個來源,就需要進行來源統(tǒng)一,否則,如果來源不清楚,一旦指標發(fā)生問題,很難去溯源定位。另外,有些指標的計算邏輯比較復(fù)雜,僅僅憑借業(yè)務(wù)口徑一段描述,使用指標的人還是無法理解這個指標的計算邏輯,這個時候就需要有一些偽碼或者 SQL 描述。
05 具體的實施步驟
1)由數(shù)據(jù)產(chǎn)品牽頭,各業(yè)務(wù)線數(shù)據(jù)分析師輔助,成立攻堅小組,進行全局指標的梳理。
2)明確梳理計劃,進行全業(yè)務(wù)的指標收集(以下模版供參考)。
3)對于收集到的指標,進行初步討論去重,口徑相同的進行合并,并與業(yè)務(wù)方進行確認。
4)將剩余指標進行歸集,明確主題域、業(yè)務(wù)過程。
5)區(qū)分指標類型,拆分原子指標與派生指標,對于派生指標,要定義統(tǒng)計的實體、業(yè)務(wù)修飾詞、統(tǒng)計周期等。
6)輸出全局統(tǒng)一的指標字典。
7)根據(jù)指標字典,拆分出的原子指標、派生指標、主題域、業(yè)務(wù)修飾詞等內(nèi)容,指導(dǎo)數(shù)據(jù)倉庫的重構(gòu)。
8)進行指標系統(tǒng)的搭建,組件化新指標的開發(fā)流程。
06 寫在最后
指標提質(zhì)的最終成果,就是要形成一個包含生產(chǎn)自動化、開發(fā)邏輯規(guī)范化、口徑一致化的指標系統(tǒng)。
它既包含指標的開發(fā)工具,可以讓各部門業(yè)務(wù)人員自行組裝指標,也提供全局業(yè)務(wù)口徑一致的指標字典,方便使用人員快速了解指標的業(yè)務(wù)含義和計算邏輯,避免對指標的口徑產(chǎn)生歧義。
作者:小風(fēng)數(shù)據(jù)中臺產(chǎn)品負責(zé)人;UBDC全域大數(shù)據(jù)峰會“燈塔人物”;公眾號:一個數(shù)據(jù)人的自留地
本文由@一個數(shù)據(jù)人的自留地 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
請教下主題域怎么劃分呢?