從BAT看企業(yè)構(gòu)建大數(shù)據(jù)體系的六層級(jí)
小編按:很“干貨”的一篇講大數(shù)據(jù)在中國巨頭公司如何落地的文章,從業(yè)務(wù)架構(gòu),平臺(tái)架構(gòu),甚至算法層都做了剖析,原文據(jù)說是內(nèi)訓(xùn)PPT,對(duì)于需要在項(xiàng)目中落地“大數(shù)據(jù)”的朋友有相當(dāng)?shù)慕梃b意義。
本文將企業(yè)大數(shù)據(jù)體系的構(gòu)建分為六個(gè)層級(jí),但并非是線性過程,每個(gè)層級(jí)之間或有基礎(chǔ)關(guān)系,但并不是說一定要逐層構(gòu)建。例如創(chuàng)業(yè)型公司,在缺乏數(shù)據(jù)研發(fā)實(shí)力的時(shí)候,多數(shù)會(huì)借助第三方平臺(tái)進(jìn)行數(shù)據(jù)上報(bào)與分析。
下面一張圖,是本文的精華概括,后面一一展開與大家探討。
本文將企業(yè)大數(shù)據(jù)體系的構(gòu)建分為六個(gè)層級(jí),但并非是線性過程,每個(gè)層級(jí)之間或有基礎(chǔ)關(guān)系,但并不是說一定要逐層構(gòu)建。例如創(chuàng)業(yè)型公司,在缺乏數(shù)據(jù)研發(fā)實(shí)力的時(shí)候,多數(shù)會(huì)借助第三方平臺(tái)進(jìn)行數(shù)據(jù)上報(bào)與分析。 下面一張圖,是本文的精華概括,后面一一展開與大家探討。 基礎(chǔ)的數(shù)據(jù)平臺(tái)建設(shè)工作,包含數(shù)據(jù)平臺(tái)建設(shè),數(shù)據(jù)規(guī)范,數(shù)據(jù)倉庫、產(chǎn)品數(shù)據(jù)規(guī)范,產(chǎn)品ID,用戶ID,統(tǒng)一SDK等。 很多公司的數(shù)據(jù)無法有效利用,就是缺乏統(tǒng)一規(guī)范,產(chǎn)品數(shù)據(jù)上報(bào)任由開發(fā)按照自己的理解和習(xí)慣上報(bào),沒有標(biāo)準(zhǔn)化的SDK和上報(bào)協(xié)議,并且數(shù)據(jù)散落在各個(gè)部門產(chǎn)品的服務(wù)器,無法構(gòu)建結(jié)構(gòu)化的數(shù)據(jù)倉庫。 做數(shù)據(jù)平臺(tái)的架構(gòu),很多人會(huì)理解為高大上的技術(shù)活,其實(shí)整個(gè)數(shù)據(jù)平臺(tái)價(jià)值的體現(xiàn),需要公司各個(gè)部門的配合,例如關(guān)鍵數(shù)據(jù)指標(biāo)體系的建立,需要從各個(gè)部門業(yè)務(wù)指標(biāo)進(jìn)行提煉,并得到業(yè)務(wù)部門認(rèn)可。常見的關(guān)鍵指標(biāo)有:DAU、PCU、WAU、MAU、按天留存率(1-30日留存)、累計(jì)留存率(7日、14日、30日累計(jì)留存率),新增用戶,有效新增用戶,活躍轉(zhuǎn)化率,付費(fèi)轉(zhuǎn)化率,收入指標(biāo),ARPU人均收入,渠道效果數(shù)據(jù)等。 下圖是騰訊和阿里的數(shù)據(jù)平臺(tái)架構(gòu)。 阿里云梯分布式計(jì)算平臺(tái)整體架構(gòu): 在第一層級(jí)中,進(jìn)行數(shù)據(jù)指標(biāo)體系規(guī)范,統(tǒng)一定義,統(tǒng)一維度區(qū)分,就可以很方便的進(jìn)行標(biāo)準(zhǔn)化可配置數(shù)據(jù)報(bào)表設(shè)計(jì),直觀的可視化輸出設(shè)計(jì),包括行為、收入、性能、質(zhì)量等多種數(shù)據(jù)類別。 在PPT中以友盟、迅雷、百度、騰訊等公司的數(shù)據(jù)報(bào)表體系進(jìn)行詳細(xì)講解。 騰訊數(shù)據(jù)門戶 阿里數(shù)據(jù)地圖 三、產(chǎn)品與運(yùn)營分析 在建立數(shù)據(jù)平臺(tái)和可視化基礎(chǔ)上,對(duì)已有的用戶行為、收入數(shù)據(jù)等進(jìn)行各種分析,輸出日?qǐng)?bào)、周報(bào)、月報(bào)、各種專題分析報(bào)告。常見的數(shù)據(jù)分析工作如下: 1. A/B TEST進(jìn)行產(chǎn)品分析優(yōu)化; 2. 運(yùn)用漏斗模型進(jìn)行用戶觸達(dá)分析,如TIPS、廣告等曝光到活躍的轉(zhuǎn)化; 3. 收入效果監(jiān)控與分析,包含付費(fèi)轉(zhuǎn)化率、渠道效果數(shù)據(jù)等; 4. 業(yè)務(wù)長期健康度分析,例如從用戶流動(dòng)模型、產(chǎn)品生命周期分析產(chǎn)品成長性和健康度; 5. 營銷推廣活動(dòng)的實(shí)時(shí)反饋; 用戶畫像也是常見的數(shù)據(jù)分析方式,包括用戶如性別、年齡、行為、收入、興趣愛好、消費(fèi)行為、上網(wǎng)行為、渠道偏好、行為喜好、生活軌跡與位置等,反映用戶各種特征,以達(dá)到全面的了解用戶,針對(duì)性的為用戶提供個(gè)性化服務(wù)的目的,通常每半年做一次用戶畫像的專題分析。 下圖是常見的數(shù)據(jù)分析思路: 常用分析工具:EXCLE,SPSS,SAS,Enterprise Miner,Clementine,STATISTICA。個(gè)人用的比較多的是:EXCEL和SPSS。 下圖是SPSS常用的數(shù)據(jù)分析與挖掘方法: 四、精細(xì)化運(yùn)營平臺(tái) 基于數(shù)據(jù)基礎(chǔ)上搭建的精細(xì)化運(yùn)營平臺(tái),主要的平臺(tái)邏輯多數(shù)是進(jìn)行用戶細(xì)分,商品和服務(wù)細(xì)分,通過多種推薦算法的組合優(yōu)化進(jìn)行商品和服務(wù)的個(gè)性化推薦。另外還有針對(duì)不同產(chǎn)品生命周期,用戶生命周期構(gòu)建的產(chǎn)品數(shù)據(jù)運(yùn)營體系。 五、數(shù)據(jù)產(chǎn)品 廣義的數(shù)據(jù)產(chǎn)品非常多,例如搜索類,天氣預(yù)報(bào)類等等。這里主要講狹義的數(shù)據(jù)產(chǎn)品,以BAT三家公司的數(shù)據(jù)產(chǎn)品為例進(jìn)行分享。 騰訊:廣點(diǎn)通、信鴿 阿里:數(shù)據(jù)魔方、淘寶情報(bào)、淘寶指數(shù)、在云端 百度:百度預(yù)測、百度統(tǒng)計(jì)、百度指數(shù)、百度司南、百度精算 截取幾張PPT如下: ?六、戰(zhàn)略分析與決策 戰(zhàn)略分析與決策層,更多的是跟很多傳統(tǒng)的戰(zhàn)略分析、經(jīng)營分析層面的方法論相似,最大的差異是數(shù)據(jù)來自于大數(shù)據(jù)。 有很多企業(yè)錯(cuò)誤的把“業(yè)務(wù)運(yùn)營監(jiān)控層”和“用戶/客戶體驗(yàn)優(yōu)化層”做的事情放在經(jīng)營分析或者戰(zhàn)略分析層來做。傅志華認(rèn)為“業(yè)務(wù)運(yùn)營監(jiān)控層”和“用戶/客戶體驗(yàn)優(yōu)化層”更多的是通過機(jī)器、算法和數(shù)據(jù)產(chǎn)品來實(shí)現(xiàn)的,“戰(zhàn)略分析”、“經(jīng)營分析”更多的是人來實(shí)現(xiàn)。很多企業(yè)把機(jī)器能做的事情交給了人來做,這樣導(dǎo)致發(fā)現(xiàn)問題的效率較低。 建議是,能用機(jī)器做的事情盡量用機(jī)器來做好“業(yè)務(wù)運(yùn)營監(jiān)控層”和“用戶/客戶體驗(yàn)優(yōu)化層”,在此基礎(chǔ)上讓人來做人類更擅長的經(jīng)驗(yàn)分析和戰(zhàn)略判斷。 在變化極快的互聯(lián)網(wǎng)領(lǐng)域,在業(yè)務(wù)的戰(zhàn)略方向選擇上,數(shù)據(jù)很難預(yù)測業(yè)務(wù)的大發(fā)展方向,如果有人說微信這個(gè)大方向是通過數(shù)據(jù)挖掘和分析研究出來,估計(jì)產(chǎn)品經(jīng)理們會(huì)笑了。從本質(zhì)上來說,數(shù)據(jù)在精細(xì)化營銷和運(yùn)營中能起到比較好的作用,但在產(chǎn)品策劃、廣告創(chuàng)意等創(chuàng)意性的事情上,起到的作用較小。但一旦產(chǎn)品創(chuàng)意出來,就可以通過灰度測試,數(shù)據(jù)驗(yàn)證效果了。 來源:虎嗅網(wǎng) 作者:BLUES
阿里大數(shù)據(jù)業(yè)務(wù)架構(gòu):
- 目前還沒評(píng)論,等你發(fā)揮!