數(shù)據(jù)產(chǎn)品經(jīng)理,該如何搭建數(shù)據(jù)平臺?

4 評論 26189 瀏覽 226 收藏 8 分鐘

本文作者結(jié)合實際工作案例,介紹了在搭建數(shù)據(jù)平臺的過程中數(shù)據(jù)產(chǎn)品經(jīng)理需要注意的流程和使用的工具,與大家分享。

關(guān)于2B/2G數(shù)據(jù)平臺搭建與一般軟件開發(fā)流程整體一致,但是特殊性體現(xiàn)在用戶和數(shù)據(jù)上。這里以之前做的一個數(shù)據(jù)監(jiān)測平臺為例,以數(shù)據(jù)為中心,介紹一下數(shù)據(jù)PM在整個數(shù)據(jù)平臺開發(fā)過程中用到的工具與需重點關(guān)注的數(shù)據(jù)處理流程。

一、常用數(shù)據(jù)分析工具

1. 數(shù)據(jù)分析工具

  • Orange:可視化數(shù)據(jù)挖掘工具,無需coding;
  • SPSS:數(shù)據(jù)統(tǒng)計軟件,需較強的數(shù)據(jù)分析能力;
  • Excel:數(shù)據(jù)統(tǒng)計軟件,需入門級數(shù)據(jù)分析能力;

2. 數(shù)據(jù)來源工具

  • 百度指數(shù):數(shù)據(jù)分享平臺,只用于PM參考,無開放API;
  • 八爪魚:爬蟲工具,只用于PM參考,只支持windows平臺;

3. 數(shù)據(jù)展示工具

  • Echarts:數(shù)據(jù)可視化插件,自帶代碼,可與技術(shù)人員共享;
  • Tableau:數(shù)據(jù)可視化分析、展示,可預設(shè)計動態(tài)數(shù)據(jù)界面;
  • 易詞云:詞云生成器,詞云樣式豐富。

二、重點數(shù)據(jù)處理流程

1. 流程概覽

  1. 重點數(shù)據(jù)提取
  2. 數(shù)據(jù)采集
  3. 數(shù)據(jù)評估與運維
  4. 數(shù)據(jù)展示

2. 具體執(zhí)行

(1)重點數(shù)據(jù)提取

我們提取重點數(shù)據(jù)是為了形成數(shù)據(jù)指標。在結(jié)合其他資深數(shù)據(jù)產(chǎn)品建議與自身開發(fā)經(jīng)驗的基礎(chǔ)上,這里介紹一種相對全面實用的數(shù)據(jù)指標的建設(shè)方法:

數(shù)據(jù)指標=指標名稱+業(yè)務(wù)大類+維度+匯總方式+量度+關(guān)聯(lián)維度+時間

提取重點數(shù)據(jù),即建立數(shù)據(jù)指標的過程中,需要產(chǎn)品進一步梳理產(chǎn)品映射的業(yè)務(wù)邏輯,設(shè)計產(chǎn)品底層的數(shù)據(jù)分析策略。同時基于此,也可協(xié)助技術(shù)開發(fā)人員打開數(shù)據(jù)表創(chuàng)建思路,以便后臺數(shù)據(jù)庫搭建(包括數(shù)據(jù)倉庫建設(shè))。

建立數(shù)據(jù)指標需重點把握業(yè)務(wù)大類和維度——

業(yè)務(wù)大類,一方面可直接按照B/G端客戶的實際業(yè)務(wù)邏輯進行梳理,另一方面源自產(chǎn)品開發(fā)前期的需求分析內(nèi)容——業(yè)務(wù)需求之外的其他需求,比如2G數(shù)據(jù)產(chǎn)品經(jīng)常關(guān)注的輿情方面。在此過程中,需要細化信息顆粒度,全面覆蓋需求進行匯總,再按照重要程度、業(yè)務(wù)內(nèi)容進行取舍分類,形成業(yè)務(wù)大類。

維度,一般按照時間、空間、主體進行劃分。

時間即指年月日以及更小的時間單位,在橫向的時間軸上,數(shù)據(jù)既要涵蓋對歷史情況的回溯,又要包含對未來事件的預判(需要數(shù)據(jù)建模)。

空間方面,2B/2G產(chǎn)品關(guān)注的空間通常反映為行政等級——國家、省、市、地方等,尤其是對G端產(chǎn)品,這種空間劃分涉及到用戶權(quán)限配置,比如省級監(jiān)管局可看到對應省轄區(qū)內(nèi)的所有數(shù)據(jù)內(nèi)容。時間與空間在后期的產(chǎn)品使用中,一般應支持用戶下鉆,進行更細致的信息查詢。

主體指的產(chǎn)品業(yè)務(wù)邏輯所涉及到的人、物等,在政府數(shù)據(jù)監(jiān)管平臺中,這里包括受監(jiān)管的企業(yè)、產(chǎn)品。不同的主體一般都存著在復雜的業(yè)務(wù)聯(lián)系,所以在設(shè)計數(shù)據(jù)模塊時應考慮到用戶對相關(guān)的主體維度的關(guān)注,在之中創(chuàng)建便捷的跳轉(zhuǎn)方法。

根據(jù)數(shù)據(jù)指標的定義,數(shù)據(jù)產(chǎn)品應該支持多種組合查詢,數(shù)據(jù)展示模塊中應具備聯(lián)動功能,如不同的業(yè)務(wù)+不同的維度查詢,形成篩選器,支持用戶自主查詢。

(2)數(shù)據(jù)采集

數(shù)據(jù)采集通常有三種方法:錄入、抓取、建模。

  1. 錄入,支持用戶通過產(chǎn)品后臺進行數(shù)據(jù)錄入,這種信息通常是通過系統(tǒng)抓取難以獲取的,比如數(shù)據(jù)來源不確定的信息,需要人工進行錄入。
  2. 抓?。合到y(tǒng)對不同數(shù)據(jù)源的數(shù)據(jù)進行抓取分析,進行展示,這種信息常為內(nèi)容類。
  3. 建模:區(qū)別與錄入與抓取的直接展示,數(shù)據(jù)建模主要應用于數(shù)據(jù)預測,對數(shù)據(jù)的處理更為復雜,先建模再生成新數(shù)據(jù),對原有數(shù)據(jù)形成補充,完善數(shù)據(jù)信息或者對未來趨勢形成預測,以支撐決策。

(3)數(shù)據(jù)評估與運維

數(shù)據(jù)評估、運維從PM出發(fā),提供兩個參考的角度:質(zhì)量把控和重要級排序。

質(zhì)量把控方面嚴格來講,通常大的數(shù)據(jù)平臺,需要建立專門的數(shù)據(jù)質(zhì)量管理系統(tǒng),對于元數(shù)據(jù)、接口穩(wěn)定性等內(nèi)容進行細致管理監(jiān)控。在此,PM可以從數(shù)據(jù)的來源可靠性、優(yōu)化處理、工具利用方法等方面進行評估把控,如對抓取信息的網(wǎng)站進行評估篩選,保證數(shù)據(jù)來源安全可靠。

重要級排序,在沒有真正用戶使用產(chǎn)品的前提下,這種排序是很難進行設(shè)計與用戶之間的雙向確認的,所以我們可以在進行產(chǎn)品設(shè)計時,允許用戶后期對dashboard等頁面的功能模塊進行自定義的拖拉組建,對我們已經(jīng)預設(shè)的數(shù)據(jù)內(nèi)容重要級排序進行修正。

(4)數(shù)據(jù)展示

這里從功能、數(shù)據(jù)呈現(xiàn)方式兩方面進行說明。

數(shù)據(jù)展示需要的功能在前面的重點數(shù)據(jù)提取——維度建立已經(jīng)提過,最重要的是聯(lián)動與下鉆,這要求數(shù)據(jù)在系統(tǒng)中形成一個完整的信息鏈路,既可統(tǒng)攬匯總,又可細化查看,真正做成一個好用的數(shù)據(jù)工具。

數(shù)據(jù)呈現(xiàn)方式主要是數(shù)據(jù)布局和圖表的選擇。這里可以參考桃子貍的文章《“NCP疫情分析管控”數(shù)據(jù)可視化大屏設(shè)計總結(jié)》中的可視化設(shè)計部分。

結(jié)語

本篇著重介紹搭建數(shù)據(jù)平臺過程中,PM對于數(shù)據(jù)處理需要掌握的工具與重點,基本出自筆者自身經(jīng)驗,多有不足還請大家指教~

 

本文由 @Lens-J 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

作者:產(chǎn)品經(jīng)理小派

本文由 @產(chǎn)品經(jīng)理小派 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 分析過于淺顯而且總結(jié)也不是很完備。
    就比如數(shù)據(jù)采集的定義假如是前臺展示用數(shù)據(jù)的來源,可以粗略地可以分為手工(包括后臺錄入,格式文件導入),自動(抓取,系統(tǒng)api推送,系統(tǒng)內(nèi)邏輯處理)
    再比如,最開始的數(shù)據(jù)說明,時間是維度,空間地理也是維度,地理還可以有支撐維;維表建模是業(yè)務(wù)數(shù)據(jù)處理的第一步

    回復
    1. 我覺得您提出的問題是合理的,感謝指出。
      這里的總結(jié)只是針對產(chǎn)品經(jīng)理角色的主要工作內(nèi)容的,所以涉及到開發(fā)包括后臺技術(shù)的內(nèi)容未做深入分析。
      作者目前經(jīng)驗尚有不足,后期會根據(jù)實際執(zhí)行情況再作補充。向您學習~

      來自北京 回復
  2. 大家期待已久的《數(shù)據(jù)產(chǎn)品經(jīng)理實戰(zhàn)訓練營》終于上線啦!

    本課程非常適合新手數(shù)據(jù)產(chǎn)品經(jīng)理,或者想要轉(zhuǎn)崗的產(chǎn)品經(jīng)理、數(shù)據(jù)分析師、研發(fā)、產(chǎn)品運營等人群。

    課程會從基礎(chǔ)概念,到核心技能,再通過典型數(shù)據(jù)分析平臺的實戰(zhàn),幫助大家構(gòu)建完整的知識體系,掌握數(shù)據(jù)產(chǎn)品經(jīng)理的基本功。

    學完后你會掌握怎么建指標體系、指標字典,如何設(shè)計數(shù)據(jù)埋點、保證數(shù)據(jù)質(zhì)量,規(guī)劃大數(shù)據(jù)分析平臺等實際工作技能~

    現(xiàn)在就添加空空老師(微信id:anne012520),咨詢課程詳情并領(lǐng)取福利優(yōu)惠吧!

    來自廣東 回復
    1. x

      來自廣東 回復