【數(shù)據(jù)治理】主數(shù)據(jù)識(shí)別的影響因素和識(shí)別方法

0 評(píng)論 991 瀏覽 2 收藏 9 分鐘

在當(dāng)今數(shù)據(jù)驅(qū)動(dòng)的商業(yè)環(huán)境中,對(duì)數(shù)據(jù)的有效管理變得尤為重要。其中,主數(shù)據(jù)管理(MDM)作為確保企業(yè)數(shù)據(jù)質(zhì)量和一致性的關(guān)鍵環(huán)節(jié),一直受到數(shù)據(jù)管理者的重視。

01.影響主數(shù)據(jù)判定和識(shí)別的因素

上一篇文章(【數(shù)據(jù)治理】主數(shù)據(jù)的基本概念和未來展望),在說明主數(shù)據(jù)的基本概念時(shí),給出了主數(shù)據(jù)的一些關(guān)鍵詞:穩(wěn)定、復(fù)用、高價(jià)值。

但是主數(shù)據(jù)的判定和識(shí)別不能脫離具體場(chǎng)景和情況。某一個(gè)數(shù)據(jù),在不同的情況下,可能會(huì)有不同的判定和識(shí)別結(jié)果。這也是之前文章提到過的。

“在具體實(shí)踐過程中,主數(shù)據(jù)并沒有一個(gè)金科玉律般的標(biāo)準(zhǔn)。同一行業(yè)不同企業(yè)、同一企業(yè)不同發(fā)展階段,主數(shù)據(jù)都可能是不一樣的。”

那么,有哪些影響主數(shù)據(jù)判定和識(shí)別的因素呢?

一般情況下,主數(shù)據(jù)是相對(duì)穩(wěn)定的。比如,公司的產(chǎn)品信息、供應(yīng)商信息、組織架構(gòu)、用戶信息等。但是主數(shù)據(jù)也會(huì)隨著業(yè)務(wù)發(fā)展階段、業(yè)務(wù)運(yùn)營模式和業(yè)務(wù)管控策略發(fā)生變化,這種情況下,企業(yè)就需要根據(jù)具體情況進(jìn)行主數(shù)據(jù)的增刪操作。

1. 業(yè)務(wù)發(fā)展階段

隨著業(yè)務(wù)的發(fā)展,某些數(shù)據(jù)的重要性開始提升并開始在不同系統(tǒng)內(nèi)被重復(fù)使用,業(yè)務(wù)對(duì)這些數(shù)據(jù)的穩(wěn)定性提出了更高的要求。因此,這些數(shù)據(jù)就需要納入主數(shù)據(jù)管理的范疇。

比如,現(xiàn)在有一個(gè)商店,業(yè)務(wù)發(fā)展初期維護(hù)了基本用戶信息。隨著業(yè)務(wù)更好地發(fā)展,推出了會(huì)員體系。此時(shí),會(huì)員信息會(huì)被很多其他業(yè)務(wù)系統(tǒng)重復(fù)使用,因此,用戶的會(huì)員相關(guān)數(shù)據(jù),就需要納入到主數(shù)據(jù)管理范疇。

2. 業(yè)務(wù)運(yùn)營模式

隨著市場(chǎng)需求的變化,技術(shù)的進(jìn)步,外部競(jìng)爭(zhēng)環(huán)境的變化等,企業(yè)也不得不主動(dòng)或被動(dòng)地轉(zhuǎn)變業(yè)務(wù)運(yùn)營模式,而運(yùn)營模式的轉(zhuǎn)變,會(huì)影響主數(shù)據(jù)的劃分。

比如,京東在初期,以線下銷售為主。在2004年開始嘗試線上銷售,后逐步發(fā)展為以線上銷售為主。

如果京東從一開始就有主數(shù)據(jù)管理的話,可能在初期,更關(guān)注實(shí)體店鋪的運(yùn)營,主數(shù)據(jù)可能主要集中在商品信息、供應(yīng)鏈信息、庫存數(shù)據(jù)等方面。

線上銷售時(shí)期,除了初期的主數(shù)據(jù),還會(huì)把線上的商鋪信息、用戶信息等都納入到主數(shù)據(jù)管理。

同樣的一個(gè)案例,也是因?yàn)闃I(yè)務(wù)運(yùn)營模式的調(diào)整,導(dǎo)致主數(shù)據(jù)劃分發(fā)生了變化。只不過是對(duì)現(xiàn)有主數(shù)據(jù)進(jìn)行刪減。

2022年比亞迪宣布自2022年3月起停止燃油汽車的整車生產(chǎn)。這次調(diào)整,可能會(huì)對(duì)產(chǎn)品信息數(shù)據(jù)、零部件數(shù)據(jù)產(chǎn)生影響。

3. 業(yè)務(wù)管控策略

對(duì)于一些大型的集團(tuán),想要掌控各個(gè)分公司的客戶數(shù)據(jù),是非常困難的,阻力很大。所以,即使集團(tuán)總部想掌握這些重要的客戶數(shù)據(jù),但是因?yàn)闆]有辦法被總部利用,沒有辦法在總部流通和使用,所以分公司的客戶,銷售數(shù)據(jù),不算主數(shù)據(jù)。

02.主數(shù)據(jù)識(shí)別方法

主數(shù)據(jù)的識(shí)別是主數(shù)據(jù)管理中最終的一項(xiàng)工作。主數(shù)據(jù)不是拍腦袋確定的。需要有比較科學(xué)合理的方法。接下來介紹兩種主數(shù)據(jù)識(shí)別的方法。

1. 主數(shù)據(jù)特征識(shí)別法

「如果有一個(gè)動(dòng)物長得像鴨子,叫聲像鴨子,走路像鴨子,那么它是鴨子」

主數(shù)據(jù)特征識(shí)別法就是這種思路。假如某個(gè)數(shù)據(jù)完全符合主數(shù)據(jù)的特征,那可以肯定的說,這個(gè)數(shù)據(jù)就是主數(shù)據(jù)。

在定義的基礎(chǔ)上,擴(kuò)展一下,可以從以下的幾個(gè)角度來判斷數(shù)據(jù)是否是主數(shù)據(jù)。

  • 高價(jià)值性:主要看是否體現(xiàn)業(yè)務(wù)的核心價(jià)值??蛻舻幕拘畔⒖隙ㄊ蔷哂泻诵膬r(jià)值的,但是客戶的配送地址所在省份就不是核心價(jià)值數(shù)據(jù)了;
  • 實(shí)體獨(dú)立性:主要體現(xiàn)在不可分割性和完整性。例如,主數(shù)據(jù)管理中比較高頻的客戶主數(shù)據(jù)。客戶主數(shù)據(jù)是作為一個(gè)整體被管理的,其包含的各個(gè)信息項(xiàng)(名稱、聯(lián)系方式、賬戶等)不會(huì)被單獨(dú)查分出來作為獨(dú)立的數(shù)據(jù)實(shí)體進(jìn)行管理。完整性指的是,公司在維護(hù)相關(guān)實(shí)體數(shù)據(jù)時(shí),會(huì)盡可能全面地收集信息,以確保數(shù)據(jù)的完整、準(zhǔn)確;
  • 相對(duì)穩(wěn)定性:主數(shù)據(jù)在時(shí)間范圍內(nèi)保持相對(duì)穩(wěn)定、不頻繁發(fā)生變更是主數(shù)據(jù)的一個(gè)重要特征。在線教育行業(yè)會(huì)維護(hù)用戶的基本信息,其中年齡是一個(gè)每年都會(huì)變更的數(shù)據(jù),那么年齡就不是主數(shù)據(jù),而可以把不變更的生日數(shù)據(jù)維護(hù)進(jìn)主數(shù)據(jù);
  • 高共享性:是否被其他系統(tǒng)引用是一個(gè)很重要的特征,即使某個(gè)數(shù)據(jù)具有非常高的價(jià)值,但是,它只在某一個(gè)系統(tǒng)內(nèi)流轉(zhuǎn),那也不能算是主數(shù)據(jù);
  • 識(shí)別唯一性:主數(shù)據(jù)具有權(quán)威性,而權(quán)威性體現(xiàn)在識(shí)別唯一性。有些數(shù)據(jù)在系統(tǒng)內(nèi)是不具備識(shí)別唯一性的。比如,用戶昵稱;
  • 長期有效性:短期、臨時(shí)使用的數(shù)據(jù),一般不會(huì)作為主數(shù)據(jù)。

可以做一個(gè)表格,對(duì)數(shù)據(jù)進(jìn)行判斷。對(duì)各個(gè)維度進(jìn)行評(píng)估,然后根據(jù)每個(gè)維度的評(píng)估情況判定是否是主數(shù)據(jù)。

2. 業(yè)務(wù)共享矩陣法

在特征識(shí)別法中,有6個(gè)特征。那么,這6個(gè)特征是否可以簡化一下,這樣主數(shù)據(jù)識(shí)別也會(huì)更簡便些。

在6個(gè)特征中,可以只選取高價(jià)值和高共享。

其他的4個(gè)特征,從某種層面講,是這兩個(gè)特征的衍生。高共享在一定程度上決定了,數(shù)據(jù)一定是識(shí)別唯一性的。其他的特征也可以推理出。

基于此,有了評(píng)估數(shù)據(jù)的重要程度和共享程度的業(yè)務(wù)共享矩陣法。

根據(jù)兩個(gè)維度對(duì)字段進(jìn)行評(píng)估,雙高的大概率是主數(shù)據(jù),雙低的大概率不是主數(shù)據(jù),難點(diǎn)就在于如何區(qū)分那些中間狀態(tài)的。

我自己總結(jié)了一個(gè)方法??梢詮脑c(diǎn)到最右上角畫一條直線。越靠近線右上角的,越有可能是主數(shù)據(jù),不過,采用這個(gè)辦法也有可能拿不準(zhǔn),這就需要有業(yè)務(wù)經(jīng)驗(yàn),數(shù)據(jù)治理經(jīng)驗(yàn)的專業(yè)老師進(jìn)行區(qū)分了。這個(gè)步驟,主要是把那些明顯是,大概率是,明顯不是,大概率不是的數(shù)據(jù)區(qū)分出來。

本文由 @孟老濕 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!