指標(biāo)管理必知的真相:訂單事實(shí)表里沒有原子指標(biāo)
原子指標(biāo)在工作業(yè)務(wù)中會用上,對于原子指標(biāo)內(nèi)容,大家對它理解多少呢?下面這篇文章是筆者整理分享的關(guān)于指標(biāo)管理中原子指標(biāo)的相關(guān)內(nèi)容,大家一起來看看吧!
上篇文章「一個問題鑒定指標(biāo)管理真實(shí)力:訂單表里有原子指標(biāo)嗎?」寫完以后,分享到一個群里,有同行回復(fù):有,比如訂單金額。
看到回復(fù),我腦子突然就斷電了,好像對誒!確實(shí)是有原子指標(biāo)叫訂單金額的。果然,哪怕推導(dǎo)過依然會經(jīng)常忘記,我當(dāng)時是咋推導(dǎo)出來的呢?跟我一起來看看~
一、先看一些材料
阿里的數(shù)據(jù)團(tuán)隊基于電商的海量大數(shù)據(jù),在國內(nèi)構(gòu)建頂級的數(shù)據(jù)系統(tǒng),也輸出了很多數(shù)據(jù)理論和規(guī)范,他們產(chǎn)出OneData指標(biāo)理論體系,也可以說是業(yè)界公認(rèn)的標(biāo)準(zhǔn)體系了。以下兩段內(nèi)容以及圖片都來源于阿里云dataworks-智能建模/原子指標(biāo)
指標(biāo)是衡量業(yè)務(wù)特征的統(tǒng)計數(shù)值,用于體現(xiàn)企業(yè)某一業(yè)務(wù)活動的業(yè)務(wù)狀況。指標(biāo)通常分為原子指標(biāo)和派生指標(biāo),與指標(biāo)相關(guān)的參數(shù)還包括修飾詞和時間周期。派生指標(biāo)則是由
原子指標(biāo) + 時間周期 + 一個或多個修飾詞
組成。
原子指標(biāo)用于明確業(yè)務(wù)的統(tǒng)計口徑和計算邏輯,是基于用戶的業(yè)務(wù)活動(即業(yè)務(wù)過程)創(chuàng)建的,用于統(tǒng)計業(yè)務(wù)活動中某一業(yè)務(wù)狀況的數(shù)值。例如,用戶的業(yè)務(wù)活動為購買,則原子指標(biāo)就可以指定為支付金額。
下面這張非常經(jīng)典的圖估計你也看過,也是來源于阿里數(shù)據(jù)團(tuán)隊的書:《阿里巴巴·大數(shù)據(jù)實(shí)踐之路》,被很多數(shù)據(jù)領(lǐng)域的文章和書籍所引用。
第一次看這張圖,我很震撼。因?yàn)楫?dāng)時對指標(biāo)體系的認(rèn)知很模糊,相當(dāng)于給我當(dāng)時錯亂的腦子梳理出來一個非常清晰的邏輯。
但其實(shí),有一些東西深究下去,發(fā)現(xiàn)自己不理解。比如,維度為什么指向?qū)傩裕渴蔷S度表里屬性字段的意義嗎?那什么是度量,度量和指標(biāo)是一個意思嗎?數(shù)據(jù)域是什么?如何劃分?劃分的標(biāo)準(zhǔn)是什么?
但后來,我發(fā)現(xiàn)很多書、文章都是基于這套理論系統(tǒng)來展開的,有的甚至把原子指標(biāo)、派生指標(biāo)這套體系大講特講,但始終沒把蠢蠢的我講懂、講服。
其實(shí),這些問題縈繞在腦子里,需要結(jié)合實(shí)際數(shù)據(jù)慢慢去去理解,甚至是需要自己依照這個圖的結(jié)果自行給出合理的解釋,才能說服自己(就這樣吧,別糾結(jié)了吧)。好吧,但既然大家都這么說,那我也就隨大流吧。但始終我還是覺得沒懂,不太舒服,直到我捋清楚了。
二、為啥沒有原子指標(biāo)
接下來,我說說為啥訂單事實(shí)表里沒有原子指標(biāo)。以下,我們結(jié)合數(shù)據(jù)倉庫的知識一起來看幾個點(diǎn)(包含我的個人理解)。
第一,指標(biāo)定義。指標(biāo)是對事實(shí)的數(shù)字化度量。
第二,原子指標(biāo)特點(diǎn)。原子指標(biāo)是最細(xì)粒度、不可拆分的指標(biāo)。
第三,派生指標(biāo)的定義。派生指標(biāo) = 一個或多個修飾詞 + 時間周期 + 原子指標(biāo)(有的公司也叫衍生指標(biāo),不管叫啥定義都差不多,有的公司定義是這樣:衍生指標(biāo) = 維度+時間周期+業(yè)務(wù)限定+原子指標(biāo))。
第四,事實(shí)表的特點(diǎn)。事實(shí)表,包含維度屬性字段和事實(shí)字段。如果有疑問,可以看《數(shù)據(jù)倉庫工具箱·維度建模權(quán)威指南》里對事實(shí)表的定義。也可以看各個數(shù)據(jù)產(chǎn)品中數(shù)據(jù)建模的功能模塊,在創(chuàng)建事實(shí)表時,字段會分不同的類型,維度 or 指標(biāo) or 事實(shí)。
可以參考官方文檔:華為云數(shù)據(jù)治理中心 DataArts Studio> 用戶指南> 數(shù)據(jù)架構(gòu)組件> 模型設(shè)計> 維度建模> 新建事實(shí)表。
也可以參考:有數(shù)數(shù)據(jù)開發(fā)及管理平臺用戶手冊 V6.5.0 Update /離線用戶手冊/模型設(shè)計中心使用指南/外部數(shù)據(jù)源建表演示。
當(dāng)然,你依然可以參考:大數(shù)據(jù)開發(fā)治理平臺 DataWorks 操作指南/數(shù)據(jù)建模 DataWorks智能數(shù)據(jù)建模/維度建模/可視化建模/創(chuàng)建邏輯模型:明細(xì)表
不過需要補(bǔ)充說明,阿里的dataworks這款產(chǎn)品里,維度和粒度很容易把人繞暈(關(guān)聯(lián)粒度,也就是關(guān)聯(lián)維度)。
有了這四個前提,很明顯看到:訂單事實(shí)表得有維度,而原子指標(biāo)沒有維度。故而,訂單事實(shí)表沒有原子指標(biāo)。
那表里面有啥指標(biāo)呢?表里有數(shù),所有的數(shù)對應(yīng)的都是衍生指標(biāo),或者派生指標(biāo)(或者復(fù)合指標(biāo)),都是具有非常明確業(yè)務(wù)含義的指標(biāo)。正如這篇「文章襯衫的價格是九磅十五便士,那么你應(yīng)該選…」提到的:一個美麗小胖黑孩(皮膚黝黑),買了一個中國的純棉襯衫,襯衫的價格是九磅十五便士。
單純說「訂單價格」這個指標(biāo),是沒有任何業(yè)務(wù)含義的,在具體的業(yè)務(wù)場景里的解釋一個具體的數(shù)字才有實(shí)際意義。就好像,平臺打廣告給咱們說:誒呀,雙十一襯衫跳水價啦!但是呢,你喜歡的特定品牌的、M碼的、黑色經(jīng)典款的襯衫價格沒降,結(jié)果你沒下單,系統(tǒng)也沒訂單生成。
就算咱們把這個訂單金額的指標(biāo)定義出來了,有啥真實(shí)意義呢?沒數(shù)哇,分析啥?要解釋啥?啥也沒有,洗洗睡了。聊抽象的東西,可以聊,但是分析一個真實(shí)發(fā)生了的、一個具體的什么樣的人、買了一件具體的什么樣的襯衫價格多少,才有意義。
三、不爭了,而且我知道你懂,請讓我再說一句
到這里,問題的爭論就結(jié)束了,咱也不掰扯概念了。不管認(rèn)不認(rèn)可答案,只要知道:衍生/派生指標(biāo)由修飾詞/維度/時間周期/原子指標(biāo)組成,你肯定也知道指標(biāo)該怎么管。原子指標(biāo),只不過定義了數(shù)該怎么算,從哪算。
除了原子指標(biāo)以外,其他構(gòu)成派生指標(biāo)的其他元素,是叫做修飾詞、維度、業(yè)務(wù)限定,都無所謂了。
再多的前綴,也都是修飾,形容詞?!冈印惯@個詞語在我們中文語義里,是不能再細(xì)拆的,而當(dāng)我們加形容詞,描述的粒度反而越來越細(xì),這個結(jié)果跟對詞語的理解是完全相反的,很容易給人帶來錯誤的感覺。
任何的形容詞,都是對原子指標(biāo)的細(xì)致解釋。最終,我們反過來看。與其叫做原子指標(biāo),不如換種說法叫詞根指標(biāo)。比如:近1天線上渠道訂單金額、近1天線上渠道會員訂單金額、近1天上午時段線上渠道高級會員訂單金額。
當(dāng)我們徹底搞明白了指標(biāo)的定義,有了自己的理解,哪怕真實(shí)的工作中業(yè)務(wù)復(fù)雜,有成千上萬的指標(biāo),我們也不會怕了,一眼就能識別出來。希望看完文章的你,不用再為概念糾結(jié)了,也不會被別人輕易地唬住了,也能一眼識別對方是在不懂裝懂,還是真的OneData大師~
-end-
接下來,我們可以看看指標(biāo)具體怎么管,指標(biāo)管理系統(tǒng)如何構(gòu)建,會碰到哪些問題,而這,是一個復(fù)雜的系統(tǒng)性工程。以上~感興趣的話,記得點(diǎn)贊、收藏,如果還有問題,記得留言喔,這樣我才有繼續(xù)寫的熱情,我們下回見!
-推薦閱讀-
一文幫你更好地理解指標(biāo)
四千字全面解析數(shù)據(jù)產(chǎn)品經(jīng)理必知概念:標(biāo)簽、維度、指標(biāo)
專欄作家
Lee,公眾號:數(shù)據(jù)產(chǎn)品小lee,人人都是產(chǎn)品經(jīng)理專欄作家。關(guān)注直播、短視頻和文娛領(lǐng)域、擅長數(shù)據(jù)架構(gòu)、CDP及數(shù)據(jù)治理相關(guān)工作。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
文章開頭提到的“訂單金額”是一個特殊的派生指標(biāo),這個派生指標(biāo)的時間周期和修飾詞是空。那如果非要把它看做一個原子指標(biāo)的話,那原子指標(biāo)的限定詞就是空,空就代表無常、有無限可能,所以才說原子指標(biāo)既是不可再分的,又是拿來進(jìn)一步細(xì)分的。