如何通過業(yè)務過程,對指標管理體系進行設計?

11 評論 19211 瀏覽 80 收藏 11 分鐘

本文重點介紹了如何根據(jù)業(yè)務過程來定義原子指標,根據(jù)原子指標和修飾詞的結合來定義相關派生指標,同時做好指標的規(guī)范命名。

指標作為業(yè)務和數(shù)據(jù)的結合,是數(shù)據(jù)統(tǒng)計的基礎,也是量化業(yè)務效果的依據(jù)。如何避免指標統(tǒng)計使用過程中出現(xiàn)的指標名稱混亂,指標不唯一?同時做好數(shù)據(jù)有序地和有結構地分類組織和存儲,避免底層數(shù)據(jù)的重復建設,數(shù)據(jù)統(tǒng)計來源的不唯一?

本文重點介紹了如何根據(jù)業(yè)務過程來定義原子指標,根據(jù)原子指標和修飾詞的結合來定義相關派生指標,同時做好指標的規(guī)范命名。

1. 背景介紹

指標是指將業(yè)務單元細分后量化的度量值,它使得業(yè)務目標可描述、可度量、可拆解。而指標體系的搭建是最為重要的,將直接影響「產(chǎn)生→處理→存儲→計算→應用」的全流程。而在實際的使用過程中出現(xiàn)了以下問題:

  1. 對于同一業(yè)務場景,各部門會用不同的指標來衡量;
  2. 對于同一指標的計算,不同的時間點去統(tǒng)計,統(tǒng)計來源和方式會有差異。

具體來說,要做到以下幾點:

  1. 規(guī)范維度和量度命名,確保唯一性,命名規(guī)則要盡量做到明確、通用、易懂;
  2. 對確認維度或量度,統(tǒng)一計算口徑,避免歧義;
  3. 涵蓋盡可能多的核心維度和量度,以此為基礎推動數(shù)據(jù)建設,確保指標字典里覆蓋的維度都可區(qū)分,指標都可統(tǒng)計;
  4. 基于指標字典,將核心維度和量度注入元數(shù)據(jù)中心,接入指標提取工具,后續(xù)實現(xiàn)不需要寫sql即可完成自助查詢及分析需求,搭建數(shù)據(jù)自助分析的基礎。

因此要提供標準化的、共享的、數(shù)據(jù)服務能力,降低數(shù)據(jù)互通成本,釋放計算、存儲、人力等資源,以消除業(yè)務和技術之痛。

數(shù)據(jù)體系架構如下:

  1. 業(yè)務板塊:如果業(yè)務產(chǎn)品比較多,且彼此之間的指標或者重疊性比較少的,可單獨分開。
  2. 規(guī)范定義:設計出一套數(shù)據(jù)規(guī)范的命名體系。
  3. 模型設計:以維度建模理論為基礎,基于維度建模總線架構,構建一致性的維度和事實。

指標管理體系設計

數(shù)據(jù)體系架構

2. 指標的規(guī)范定義

指標的規(guī)范定義,以維度建模作為理論基礎,構建總線矩陣,劃分和定義數(shù)據(jù)域、業(yè)務過程、維度、度量/原子指標、修飾類型、修飾詞、時間周期、派生指標等。

指標管理體系設計

指標的規(guī)范定義

(1)數(shù)據(jù)域

指面向業(yè)務分析,將業(yè)務過程或者維度進行抽象的集合。其中,業(yè)務過程可以概括為一個個不拆分的行為事件,在業(yè)務過程之下,可以定義指標;維度,是度量的環(huán)境,如買家下單事件,買家是維度。為了保障整個體系的生命力,數(shù)據(jù)域是需要抽象提煉,并且長期維護更新的,但不輕易變動。

(2)業(yè)務過程

指企業(yè)的業(yè)務活動事件,如,下單、支付、退款都是業(yè)務過程。其中,業(yè)務過程不可拆分。

(3)時間周期

用來明確統(tǒng)計的時間范圍或者時間點,如最近30天、自然周、截止當日等。

(4)修飾類型

是對修飾詞的一種抽象劃分。修飾類型從屬于某個業(yè)務域,如日志域的訪問終端類型涵蓋無線端、PC端等修飾詞。

(5)修飾詞

指的是統(tǒng)計維度以外指標的業(yè)務場景限定抽象,修飾詞屬于一種修飾類型,如在日志域的訪問終端類型下,有修飾詞無線端、PC端等。

(6)度量/原子指標

原子指標和度量含義相同,基于某一業(yè)務事件行為下的度量,是業(yè)務定義中不可再拆分的指標,具有明確業(yè)務含義的名稱,如支付金額。

(7)維度

維度是度量的環(huán)境,用來反映業(yè)務的一類屬性,這類屬性的集合構成一個維度,也可以稱為實體對象。維度屬于一個數(shù)據(jù)域,如地理維度(其中包括國家、地區(qū)、省市等)、時間維度(其中包括年、季、月、周、日等級別內(nèi)容)。

(8)維度屬性

維度屬性隸屬于一個維度,如地理維度里面的國家名稱、國家ID、省份名稱等都屬于維度屬性。

(9)派生指標

派生指標=1個原子指標+多個修飾詞(可選)+時間周期??梢岳斫鉃樵又笜藰I(yè)務統(tǒng)計范圍的圈定。如原子指標:支付金額,最近1天海外買家支付金額則為派生指標。

指標管理體系設計

派生指標又分以下三種類型:

事務型指標:是指對業(yè)務活動進行衡量的指標。例如,新增注冊會員數(shù)、訂單支付金額,這類指標需要維護原子指標以及修飾詞,在此基礎上創(chuàng)建派生指標。

存量型指標:是指對實體對象(如商品、會員)某些狀態(tài)的統(tǒng)計,例如商品總數(shù)、注冊會員總數(shù),這類指標需要維護原子指標以及修飾詞,在此基礎上創(chuàng)建派生指標,對應的時間周期一般為“歷史截止當前某個時間”。

復合型指標:是在事務性指標和存量型指標的基礎上復合成的。例如,瀏覽UV-下單買家數(shù)轉化率。

復合型指標的規(guī)則:

  • 比率型:創(chuàng)建原子指標,如CTR、瀏覽UV-下單買家數(shù)轉化率、滿意率等。例如,“最近1天店鋪首頁CTR”,原子指標為“CTR”,時間周期為“最近1天”,修飾類型為“頁面類型”,修飾詞為“店鋪首頁”。
  • 比例型:創(chuàng)建原子指標,如百分比、占比。例如,“最近1天無線支付金額占比”,原子指標為“支付金額占比”,修飾類型為“終端類型”,修飾詞為“無線”。
  • 變化量型:不創(chuàng)建原子指標,增加修飾詞,在此基礎上創(chuàng)建派生指標。例如,“最近1天訂單支付金額上1天變化量”,原子指標為“訂單支付金額”, 時間周期為“最近1天”,修飾類型為“統(tǒng)計方法”,修飾詞為“上1天變化量”。
  • 變化率型:創(chuàng)建原子指標,例如,“最近7天海外買家支付金額上7天變化率”,原子指標為“支付金額變化率”,修飾類型為“買家地域”,修飾詞為“海外買家”。
  • 統(tǒng)計型(均值、分位數(shù)等):不創(chuàng)建原子指標,增加修飾詞,在此基礎上創(chuàng)建派生指標;在修飾類型“統(tǒng)計方法”下增加修飾詞,如人均、日均、行業(yè)平均等。例如,“自然月日均UV”,原子指標為 “UV”,修飾類型為“統(tǒng)計方法”,修飾詞為“日均”。

3. 指標管理的功能實現(xiàn)

為了實現(xiàn)指標管理,需考慮的底層信息:

指標管理體系設計

指標管理功能設計

部分前臺界面展示:

指標管理體系設計

原子指標功能界面

指標管理體系設計

派生指標功能界面

4. 數(shù)據(jù)的使用框架

在對指標進行規(guī)范定義與管理的基礎上,可以此推動底層事實表以及維表的建設,保證數(shù)據(jù)統(tǒng)計的數(shù)據(jù)源唯一以及計算口徑統(tǒng)一。同時,通過指標和修飾詞的結合,便于業(yè)務人員進行自助分析與使用數(shù)據(jù),降低數(shù)據(jù)獲取的效率,從而產(chǎn)生有價值的結論,輔助決策,充分發(fā)揮數(shù)據(jù)的價值。

指標管理體系設計

數(shù)據(jù)分析使用框架

總結

本文總結了如何基于業(yè)務來劃分業(yè)務過程,從而涉及對應的原子指標,在與維度結合的基礎上創(chuàng)建派生指標,建設成規(guī)范統(tǒng)一的數(shù)據(jù)指標體系。以此推動數(shù)據(jù)統(tǒng)計來源的唯一性,并接入指標提取工具,后續(xù)業(yè)務完成自助查詢及分析需求,搭建數(shù)據(jù)自助分析的基礎。

本書部分內(nèi)容根據(jù)阿里巴巴數(shù)據(jù)技術以及產(chǎn)品部的《大數(shù)據(jù)之路 阿里巴巴大數(shù)據(jù)實踐》讀書筆記而展開,歡迎大家一起交流。

 

本文由 @?時之沙 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 請問有對應的產(chǎn)品可以參考嗎

    來自廣東 回復
  2. 能不能給提供兩個指標列表、指標添加頁面,以及維度、修飾的分類列表啊 ;
    另外還有 多個指標之間有參數(shù)依賴關系的如何處理啊?

    來自北京 回復
    1. 意思是,指標A的出參 作為 指標B的入?yún)⑦@種如何整合到一個指標中,還是需要單一指標調(diào)用處理?

      來自北京 回復
    2. 整合到一個指標中;
      另外一個問題是一個原子指標是不是只能有一個時間維度 ?
      因為看原子指標的時間周期自行設定,如果有多個時間的話,其實我是不知道對哪個時間進行統(tǒng)計的 ,但是如果只有一個時間的話有一種情景該如何解決: 近30天內(nèi)注冊 7天內(nèi)激活的用戶,這種數(shù)據(jù)應該就無法滿足了把

      來自北京 回復
  3. 你好!對派生指標的部分時間周期不是很理解?!白罱?0天”這種,很好理解,是站在當前往前推30天,不需要指定是哪一天的前30天。但是對于像這種:自然月、自然周,比如:自然月支付金額,這種派生指標在使用的時候,需要再指定具體哪個自然月嗎?

    來自山東 回復
  4. 數(shù)據(jù)域是什么 還是不太理解 可以直接對應到事實表嗎 舉例中的“日志域” 感覺又不是個事實

    來自北京 回復
  5. 你好,關于指標體系的相關資料或書籍有推薦學習的嗎?

    回復
    1. 《大數(shù)據(jù)之路 阿里巴巴大數(shù)據(jù)實踐》,可以先讀一下這本

      回復
  6. 你好,剛好最近在也看指標體系相關的,有幾個問題想咨詢下:
    1. 文中的數(shù)據(jù)源具體是什么? 單張hive表 還是 ?
    2. 原子指標和數(shù)據(jù)源的關系,原子指標就是數(shù)據(jù)源中的具體字段么?還是說可以加上聚合函數(shù)?

    來自河北 回復
    1. 1、數(shù)據(jù)源是指底層的事實表,是經(jīng)過處理后的單張表。
      2、在指標管理中做到可追溯查詢該指標來自于哪一表,方便數(shù)據(jù)研發(fā)人員后期重復開發(fā)計算。聚合函數(shù)你指的是求和或計數(shù)吧,這個屬于指標的計算說明。
      不知道有沒有解決你的疑問

      回復