【數(shù)據(jù)治理】主數(shù)據(jù)的基本概念和未來展望
當(dāng)我們要在產(chǎn)品里面取一個(gè)主數(shù)據(jù),如何操作?這篇文章,作者分享了他在工作中碰到的案例和應(yīng)對方法,給大家解釋了主數(shù)據(jù)的這個(gè)概念,一起來學(xué)習(xí)下。
作為產(chǎn)品經(jīng)理或研發(fā),有沒有遇到過這種情況。
你正在做一個(gè)需求,需要用到用戶的一些數(shù)據(jù),這時(shí)候,你找到A產(chǎn)品,他說,“我們只有你要的數(shù)據(jù)中的一部分?jǐn)?shù)據(jù),想要完全獲取你想要的這部分?jǐn)?shù)據(jù),你得跟B產(chǎn)品再聊聊。”
好不容易跟B也聊清楚了,發(fā)現(xiàn)雙方存儲(chǔ)的用戶數(shù)據(jù),唯一標(biāo)識(shí)根本不一樣,一個(gè)用的用戶id,一個(gè)用用戶編碼。要想把兩個(gè)業(yè)務(wù)的用戶數(shù)據(jù)正確拼接適用,還得維護(hù)一個(gè)用戶id和用戶編碼的映射關(guān)系表。
這還是兩個(gè)業(yè)務(wù)系統(tǒng),如果某個(gè)需求要用到分散在三個(gè)業(yè)務(wù)系統(tǒng)的用戶數(shù)據(jù),那就自求多福吧。光一個(gè)梳理協(xié)調(diào)工作就夠你喝一壺的。
????上面的這個(gè)場景可不是我瞎編的,是我真正遇到過的。
一、什么是主數(shù)據(jù)
業(yè)務(wù)初期,數(shù)據(jù)量沒有那么大,或者業(yè)務(wù)在狂奔,業(yè)務(wù)需求還做不過來的情況下,當(dāng)然,這也和管理者認(rèn)識(shí)不到位有關(guān)系。這些經(jīng)常被各個(gè)業(yè)務(wù)使用,但是分散在不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù)管理,沒有被重視起來,在產(chǎn)品規(guī)劃、IT架構(gòu)建設(shè)中,往往被安排在較為靠后的階段,優(yōu)先級(jí)非常低。
后來,隨著數(shù)據(jù)分析越來越重要,信息化建設(shè)的發(fā)展,對于解決剛剛面臨的問題,越來越被擺到臺(tái)面上了。
這里引入一個(gè)重要概念,主數(shù)據(jù)。對于主數(shù)據(jù),中國信通院牽頭編寫的主數(shù)據(jù)管理實(shí)踐白皮書(2.0版)中,定義如下:
主數(shù)據(jù)指滿足組織跨部門業(yè)務(wù)協(xié)同需要的、反映核心業(yè)務(wù)實(shí)體狀態(tài)屬性的基礎(chǔ)信息。主數(shù)據(jù)具有,跨部門、跨業(yè)務(wù)、跨流程、跨系統(tǒng)、跨技術(shù)等特征。
非常抽象,比陶喆都抽象。
我來翻譯翻譯。
首先,只有有必要在各個(gè)系統(tǒng)間共享的數(shù)據(jù)才是主數(shù)據(jù)。這就是定義里,“滿足跨組織跨部門業(yè)務(wù)系統(tǒng)需要”的含義。一定是被大家所共用的數(shù)據(jù)才可稱之為主數(shù)據(jù),自己圈地自萌的數(shù)據(jù),不是主數(shù)據(jù)。
其次,主數(shù)據(jù)是價(jià)值導(dǎo)向的,能夠在組織內(nèi)跨業(yè)務(wù)重復(fù)使用的高價(jià)值數(shù)據(jù)才能稱之為主數(shù)據(jù)。既然高價(jià)值,那必然不會(huì)把所有的數(shù)據(jù)都納入到主數(shù)據(jù)的范疇。那就只會(huì)是“反映核心業(yè)務(wù)實(shí)體狀態(tài)屬性的基礎(chǔ)信息”。
此外,共享、重復(fù)使用和高價(jià)值還決定了,主數(shù)據(jù)也應(yīng)該是穩(wěn)定的,不能三天兩頭變來變?nèi)サ摹T囅?,不穩(wěn)定的數(shù)據(jù)怎樣去共享、復(fù)用進(jìn)而產(chǎn)生高價(jià)值呢?
在具體實(shí)踐過程中,主數(shù)據(jù)并沒有一個(gè)金科玉律般的標(biāo)準(zhǔn)。同一行業(yè)不同企業(yè)、同一企業(yè)不同發(fā)展階段,主數(shù)據(jù)都可能是不一樣的。
主數(shù)據(jù)的識(shí)別是一個(gè)復(fù)雜的過程,以后會(huì)專門聊一聊該如何識(shí)別。簡單來說,如何判斷一個(gè)數(shù)據(jù)是主數(shù)據(jù)?主要看它是否符合三個(gè)特征,穩(wěn)定、復(fù)用、高價(jià)值。而不是,上個(gè)項(xiàng)目哪些數(shù)據(jù)是主數(shù)據(jù),這次項(xiàng)目這些數(shù)據(jù)就一定是主數(shù)據(jù)。
二、什么是主數(shù)據(jù)管理
所謂沒有規(guī)矩不成方圓,主數(shù)據(jù)管理就是對主數(shù)據(jù)定規(guī)矩。管理哪些數(shù)據(jù),誰來管理數(shù)據(jù),怎么管理數(shù)據(jù)。這套規(guī)矩,是一整套用于生成和維護(hù)企業(yè)主數(shù)據(jù)的規(guī)范,技術(shù)和方案。總結(jié)下來就是,主數(shù)據(jù)管理就是組織、制度和平臺(tái)的建設(shè)。組織是基礎(chǔ),制度是保障,平臺(tái)是抓手。
組織框架上的建設(shè)。搭建不同層級(jí)的主數(shù)據(jù)治理組織框架,定義清楚各個(gè)層級(jí)和角色的職責(zé)。別小瞧這個(gè)規(guī)矩,根據(jù)項(xiàng)目經(jīng)驗(yàn),主數(shù)據(jù)項(xiàng)目的風(fēng)險(xiǎn),有80%來自于管理;
主數(shù)據(jù)管理制度的建設(shè)。比如,要定義好一個(gè)總的主數(shù)據(jù)管理制度文件,相當(dāng)于主數(shù)據(jù)的憲法,行為依據(jù)、爭議處理都要按照這個(gè)“憲法”來。還可以定義好各類主數(shù)據(jù)模板,用這個(gè)模板來進(jìn)行主數(shù)據(jù)建模和錄入,減少不同系統(tǒng)之間的扯皮;
主數(shù)據(jù)平臺(tái)的建設(shè)。到了平臺(tái)建設(shè),就比較偏落地了。很多文章在聊主數(shù)據(jù)管理的時(shí)候只是解釋了什么是主數(shù)據(jù)管理,要怎么管理。但是沒有解釋主數(shù)據(jù)管理來管理去,到底要達(dá)到啥目的,有啥價(jià)值。缺了這個(gè),很容易聽著聽著就魂游八方,不知所謂了。
主數(shù)據(jù)管理的核心價(jià)值是,通過管理,使各系統(tǒng)對同一業(yè)務(wù)實(shí)體數(shù)據(jù)(也就是主數(shù)據(jù))的認(rèn)識(shí)是一致的。從而達(dá)成信息對稱。那主數(shù)據(jù)平臺(tái)的建設(shè),就需要包含能夠讓各系統(tǒng)認(rèn)知達(dá)成一致的能力。下圖是主流的主數(shù)據(jù)管理平臺(tái)需要具備的產(chǎn)品能力。
三、主數(shù)據(jù)管理的未來展望
目前主數(shù)據(jù)的管理,還停留在對結(jié)構(gòu)化數(shù)據(jù)的管理層面。對非結(jié)構(gòu)化數(shù)據(jù),比如圖形、視頻、商標(biāo)、字體等,目前市面上的系統(tǒng),基本上都沒有涉及非結(jié)構(gòu)化數(shù)據(jù)管理,那么未來,可以通過更多形態(tài)的技術(shù)手段,實(shí)現(xiàn)對所有的數(shù)據(jù)類型進(jìn)行管理。
現(xiàn)在是AI時(shí)代,當(dāng)然也不能少了AI的賦能。目前的主數(shù)據(jù)管理平臺(tái)的使用方式還比較傳統(tǒng),主要是人工維護(hù)和程序維護(hù)相結(jié)合的方式。那么未來,也許可以把RPA、OCR等技術(shù)引入管理平臺(tái),不僅能提高效率,還能減少人工出錯(cuò)。
最后,是一個(gè)關(guān)于主數(shù)據(jù)管理的野望。未來會(huì)不會(huì)將主數(shù)據(jù)管理從組織內(nèi)的管理升級(jí)成行業(yè)級(jí)、產(chǎn)業(yè)級(jí)的主數(shù)據(jù)管理呢?我覺得非常難,也許到了數(shù)據(jù)資產(chǎn)具有了非常強(qiáng)大的商業(yè)價(jià)值、行業(yè)價(jià)值的時(shí)候,這個(gè)野望也許會(huì)變成現(xiàn)實(shí)。
參考
主數(shù)據(jù)管理實(shí)踐白皮書2.0
數(shù)據(jù)賦能之主數(shù)據(jù)實(shí)施方法論詳解
本文由 @孟老濕 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!