數(shù)據(jù)運(yùn)營(yíng)篇 | 開啟使用數(shù)據(jù)的第一步—找到數(shù)據(jù)

0 評(píng)論 863 瀏覽 0 收藏 7 分鐘

這篇文章是關(guān)于數(shù)據(jù)運(yùn)營(yíng)的深入探討,特別強(qiáng)調(diào)了在數(shù)據(jù)使用過(guò)程中“找到數(shù)據(jù)”的重要性。作者詳細(xì)介紹了數(shù)據(jù)地圖、數(shù)據(jù)目錄和數(shù)據(jù)資產(chǎn)平臺(tái)等工具,這些工具的目標(biāo)是展示數(shù)據(jù)平臺(tái)已經(jīng)加工好的數(shù)據(jù),以便有數(shù)據(jù)需求的人能夠輕松地找到并使用這些數(shù)據(jù)。

找數(shù)據(jù)對(duì)于數(shù)據(jù)使用這來(lái)說(shuō),是開啟數(shù)據(jù)使用的第一步,如果連數(shù)據(jù)都找不到談何使用。數(shù)據(jù)地圖、數(shù)據(jù)目錄、甚至于數(shù)據(jù)資產(chǎn)平臺(tái)等等。其實(shí)目標(biāo)就是一件事情,展示數(shù)據(jù)平臺(tái)已經(jīng)加工好的數(shù)據(jù),能夠讓有數(shù)據(jù)需求的人,完成使用數(shù)據(jù)第一步–找數(shù)據(jù)。

這里的數(shù)據(jù)地圖和數(shù)據(jù)管理篇中檔我們討論元數(shù)據(jù)的時(shí)候,我們?cè)谟懻撌裁?中介紹的元數(shù)據(jù)本質(zhì)是一樣的。但是展示形式上可以更加靈活些?;蛘哒f(shuō)一個(gè)是面向研發(fā)的,一個(gè)是面向業(yè)務(wù)應(yīng)用的。

在元數(shù)據(jù)篇中,界面一般按照所屬的數(shù)據(jù)源展示為樹狀結(jié)構(gòu)。

在數(shù)據(jù)地圖中,一般有一個(gè)首頁(yè),首頁(yè)一個(gè)搜索框,在搜索列表中,詳情頁(yè)有各個(gè)不同的tab。

首頁(yè)

首頁(yè)的主要就是一個(gè)搜索能力,用戶輸入想搜索的內(nèi)容,模糊匹配后顯示模糊匹配的列表內(nèi)容。這里的列表均是表的內(nèi)容。

如果是增強(qiáng)版本的話,通過(guò)這個(gè)搜索能夠?qū)?shù)據(jù)資產(chǎn)的的數(shù)據(jù)服務(wù)API、報(bào)表、大屏、甚至文章等等均進(jìn)行搜索查詢。這塊可以在資產(chǎn)搜索 中再說(shuō)明。

詳情頁(yè)面

搜索完之后,點(diǎn)擊某一個(gè)具體的字段,可以顯示搜索的詳情。

詳情頁(yè)面其實(shí)就是針對(duì)表的各個(gè)維度的描述,有哪些維度也是隨著使用不斷深入的。通常我們可以添加的維度有:基本信息、字段  、  數(shù)據(jù)預(yù)覽、分區(qū)信息、數(shù)據(jù)稽核、數(shù)據(jù)血緣、更新信息、加工任務(wù)、評(píng)價(jià)等等。

基本信息

基本信息包括表的英文名稱、中文名稱、表的描述、創(chuàng)建時(shí)間、負(fù)責(zé)人、等等基本的信息。

以及這個(gè)元數(shù)據(jù)屬于什么數(shù)據(jù)倉(cāng)庫(kù)分層,屬于什么業(yè)務(wù)領(lǐng)域的。這些信息是在數(shù)據(jù)管理篇中2、表層面的規(guī)劃 中進(jìn)行的設(shè)置。

字段

以列表的形式展示表里面的字段、字段的類型、以及字段的描述信息。其中字段描述信息是否豐富、全面也是數(shù)據(jù)是否全面的一個(gè)重要維度。

數(shù)據(jù)預(yù)覽

不需要查詢數(shù)據(jù),提供一下數(shù)據(jù)預(yù)覽能力,把表里面的數(shù)據(jù)是什么樣子,能夠更加直觀的給數(shù)據(jù)消費(fèi)者以用戶體驗(yàn)。

這里有一個(gè)問(wèn)題是如果是直接查詢數(shù)據(jù)的話,需要選擇查詢數(shù)據(jù)的時(shí)候使用的資源。如果是提前保存數(shù)據(jù)的話,保存的多少,使用什么存儲(chǔ),是否進(jìn)行更新就需要有一個(gè)方案了。

分區(qū)信息

如果是大數(shù)據(jù)存儲(chǔ)如HIVE等。如果是分區(qū)表,需要列出來(lái)分區(qū)信息,都有哪些分區(qū)字段,最新分區(qū)是什么。每個(gè)分區(qū)是什么時(shí)候更新寫入數(shù)據(jù)的。

數(shù)據(jù)稽核

這個(gè)信息其實(shí)更多的是一個(gè)數(shù)據(jù)探查的過(guò)程,相當(dāng)于提前把一些字段的特征給總結(jié)出來(lái)不需要用戶手動(dòng)寫SQL進(jìn)行總結(jié)。如果字段的最大值、最小值、平均值。如果是枚舉字段的話,有多少個(gè)枚舉值,每個(gè)值數(shù)多少。如果數(shù)數(shù)值類型的話,數(shù)值類型的字段分布是什么樣的等等,這些信息。

這些信息是一個(gè)表的一個(gè)計(jì)算的結(jié)果,就會(huì)涉及到一個(gè)范圍的問(wèn)題。以及什么時(shí)候來(lái)進(jìn)行計(jì)算。使用什么資源來(lái)進(jìn)行計(jì)算。這些想清楚了,這個(gè)功能才能更好的實(shí)現(xiàn)。

數(shù)據(jù)血緣

數(shù)據(jù)血緣可以理解為是在任務(wù)治理篇中的端到端的任務(wù)血緣鏈路 的精簡(jiǎn)版本,這里僅僅展示表與表之前的上下游關(guān)系。用戶作為影響分析, 數(shù)據(jù)溯源。展示形式上仍舊以圖的形式進(jìn)行展示。

更新信息

每個(gè)表都需要進(jìn)行更新,進(jìn)行字段增加,進(jìn)行字段類型變更,字段刪除等等。這里就可以記錄表的整個(gè)的變更信息。

加工任務(wù)

將對(duì)應(yīng)的加工任務(wù)在界面上顯示出來(lái),直觀的體現(xiàn)是由哪個(gè)任務(wù)加工生成的此表。

評(píng)價(jià)

評(píng)價(jià)的功能就比較靈活了??梢允枪俜降脑u(píng)價(jià),如數(shù)據(jù)熱度、數(shù)據(jù)可信度—這個(gè)可信度就可以是面向OLAP的數(shù)據(jù)指標(biāo)使用 中提到的,如果是統(tǒng)一的指標(biāo)了,就保證是一致的,添加一個(gè)官方標(biāo)簽表明已經(jīng)是。

也可以是用戶為主的,提這張表的意見,新增什么字段、數(shù)據(jù)準(zhǔn)確性怎么樣等等信息。從而建立一個(gè)信息收集、反饋的渠道。

生成的數(shù)據(jù)服務(wù)

如果是基于表生成的數(shù)據(jù)服務(wù)API,直接顯示對(duì)應(yīng)的API,如果是基于SQL的也可以體現(xiàn)下,此表在哪個(gè)數(shù)據(jù)服務(wù)API邏輯中。

本文由人人都是產(chǎn)品經(jīng)理作者【數(shù)據(jù)小吏】,微信公眾號(hào):【數(shù)據(jù)小吏】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!