數(shù)據(jù)源發(fā)生變化時需要注意的點
編輯導(dǎo)讀:很多產(chǎn)品的數(shù)據(jù)是在三方平臺的源數(shù)據(jù)基礎(chǔ)上設(shè)計的,源數(shù)據(jù)的內(nèi)容發(fā)生了變化,將直接影響這類產(chǎn)品的功能。本文作者從調(diào)研變化和如何應(yīng)對這兩個點進行分析,探討當(dāng)數(shù)據(jù)源發(fā)生變化時需要注意的點,希望對你有幫助。
一般意義上的產(chǎn)品,其底層數(shù)據(jù)是由用戶在產(chǎn)品上的行為產(chǎn)生的,例如淘寶中的訂單數(shù)據(jù),是由消費者在淘寶上進行下單動作而產(chǎn)生的數(shù)據(jù),然而有一部分產(chǎn)品,依賴的是三方的數(shù)據(jù)。
例如幫助淘寶商家分析,下單的用戶是新用戶還是老用戶,在這個產(chǎn)品上,使用的并不是用戶在該產(chǎn)品上產(chǎn)生的行為數(shù)據(jù),而是使用了淘寶上的用戶行為數(shù)據(jù),數(shù)據(jù)源也是由淘寶開放提供的。
因這類產(chǎn)品的源數(shù)據(jù)非自有數(shù)據(jù),是由三方平臺產(chǎn)出的,而三方平臺會因為其業(yè)務(wù)變動、政策變更等因素導(dǎo)致需要變更源數(shù)據(jù),具體包括數(shù)據(jù)格式的變更,數(shù)據(jù)內(nèi)容的變更,數(shù)據(jù)傳輸方式的變更。
而這類產(chǎn)品提供的功能是在三方平臺的源數(shù)據(jù)基礎(chǔ)上設(shè)計的,源數(shù)據(jù)的內(nèi)容發(fā)生了變化,將直接影響這類產(chǎn)品的功能,導(dǎo)致統(tǒng)計出錯等問題,嚴(yán)重地將會直接導(dǎo)致功能無法使用,對產(chǎn)品造成嚴(yán)重影響。
一起看下這個場景,因消費者數(shù)據(jù)隱私等政策出臺,某電商平臺為了合規(guī),將開放的訂單接口的訂單中的“買家手機號”字段做了模糊處理,返回值例如157****6037。
小明所負(fù)責(zé)的產(chǎn)品A是一款營銷短信類產(chǎn)品,通過“訂單接口”中的“買家手機號”字段,來實現(xiàn)對店鋪訂單的消費者發(fā)送一些營銷短信,包括促銷信息提醒、二次購買邀請等。這次某電商平臺的變更就給產(chǎn)品A帶來了重大的影響:
變更前,買家手機號字段展示的是明文數(shù)據(jù),產(chǎn)品A直接根據(jù)訂單中的手機號碼,發(fā)出相應(yīng)的短信。
變更后,買家手機號字段展示的是模糊化的數(shù)據(jù),無法獲取到短信接收方的號碼,因此無法將短信發(fā)送到產(chǎn)生過訂單的消費者手機號中,不再能夠達到對此類消費者進行提醒、邀請、回訪等營銷動作,對用戶、該產(chǎn)品的業(yè)務(wù)都產(chǎn)生了嚴(yán)重影響。
作為用戶,所使用的產(chǎn)品,不再能提供相應(yīng)的服務(wù),沒有辦法對用戶店鋪中的消費者進行營銷活動,給用戶造成了需要重新尋找新產(chǎn)品的成本和錯失營銷時機的損失。
作為小明所在的公司,這一項改動會直接導(dǎo)致產(chǎn)品A的核心功能受阻,影響力公司業(yè)務(wù),甚至可能造成現(xiàn)有用戶的大量投訴、退款和流失,對公司產(chǎn)品A的業(yè)務(wù)帶來的影響是毀滅性的。
從這里我們可以看出,受到平臺接口對于字段內(nèi)容的變更,對于產(chǎn)品A,對于產(chǎn)品A所在的業(yè)務(wù)和公司產(chǎn)生的影響是巨大的,小明作為負(fù)責(zé)產(chǎn)品A的產(chǎn)品經(jīng)理,需要對本次變更作出應(yīng)對動作,避免或降低這種情況的發(fā)生。
那么在面對這樣的情況時,應(yīng)該去如何應(yīng)對呢,本文就想從調(diào)研變化和如何應(yīng)對這兩個點來和大家討論,當(dāng)數(shù)據(jù)源發(fā)生變化時需要注意的點。
一、什么情況下數(shù)據(jù)源會發(fā)生變化
在討論如何應(yīng)對變化前,想和大家一起先討論個問題,什么情況下數(shù)據(jù)源會發(fā)生變化?數(shù)據(jù)源為什么要變化呢?在文章開頭我們了解到底層數(shù)據(jù)從來源進行分類,能分成自有數(shù)據(jù)和三方數(shù)據(jù)兩個類型,不同的數(shù)據(jù)類型發(fā)生的變化情況不同。
首先,我們來看自有數(shù)據(jù),指儲存在本產(chǎn)品數(shù)據(jù)庫的數(shù)據(jù),其來源可以是該產(chǎn)品用戶在應(yīng)用的行為產(chǎn)生的數(shù)據(jù),是該產(chǎn)品運營方生產(chǎn)的數(shù)據(jù),甚至可以是從其他產(chǎn)品或線下獲取數(shù)據(jù)后加工存儲下來的。
只要最終數(shù)據(jù)存儲到了產(chǎn)品自身的數(shù)據(jù)庫,就屬于自有數(shù)據(jù)范疇。例如微信朋友圈中的動態(tài)和評論,是微信用戶產(chǎn)生后并存儲在微信數(shù)據(jù)庫中的,屬于自有數(shù)據(jù)。
因自有數(shù)據(jù),存儲在自己數(shù)據(jù)庫中,對于數(shù)據(jù)的把握,是相對較為可控的。當(dāng)因業(yè)務(wù)變更導(dǎo)致會產(chǎn)生數(shù)據(jù)改變時,是可以提前預(yù)料的,我們就可以在功能改變前,作出相應(yīng)的調(diào)整,就能避免出現(xiàn)因自由數(shù)據(jù)變化帶來對產(chǎn)品功能的重大影響。
再來看三方數(shù)據(jù),三方數(shù)據(jù)是指非存儲在本產(chǎn)品數(shù)據(jù)庫的數(shù)據(jù),數(shù)據(jù)的來源和維護需要依賴其他產(chǎn)品,例如產(chǎn)品B是個交易軟件,其交易數(shù)據(jù)是實時從交易所獲取的,這部分?jǐn)?shù)據(jù)是由交易所提供和維護的,就屬于三方數(shù)據(jù)。
從三方數(shù)據(jù)的定義中,我們能認(rèn)識到三方數(shù)據(jù)不是由本產(chǎn)品存儲的,對其變化是不可提前預(yù)知的,因此當(dāng)三方數(shù)據(jù)做出導(dǎo)致數(shù)據(jù)變更的行為時,我們知曉這個變化也經(jīng)常是后置的。
但不論是哪一種數(shù)據(jù)類型的數(shù)據(jù)源發(fā)生了變化,其共同特點是,如果放任不理,都會給產(chǎn)品帶來重大影響,所以需要我們面對變化作出調(diào)整方案。
二、數(shù)據(jù)源變化后應(yīng)對方案
我們已知數(shù)據(jù)源變化會給產(chǎn)品帶來重大影響,因此需要對此作出應(yīng)對方案,這個方案需要包含變化前后的差異和可能帶來的影響,以及解決方案(不局限于產(chǎn)品方案,也可以是運營方案等)。應(yīng)對方案是為了盡可能地降低數(shù)據(jù)源變化所帶來的影響,避免出現(xiàn)嚴(yán)重的負(fù)面情況,具體應(yīng)對方案中我們可以根據(jù)下面二步進行展開,一起來討論下吧。
1. 充分了解變化前后的數(shù)據(jù)差異
變化前后的數(shù)據(jù)差異,是問題產(chǎn)生以及帶來負(fù)面影響的直接原因,因此我們需要分別在相同條件下獲取1份變化前的數(shù)據(jù),和1份變化后的數(shù)據(jù),充分了解兩者之間的差異,包括數(shù)據(jù)格式的變化、數(shù)據(jù)內(nèi)容的變化、以及數(shù)據(jù)傳輸方式的變化,才能為后續(xù)的解決方案提供理論依據(jù)。
可以按以下幾個方面對兩份數(shù)據(jù)一一比對,并最終得出差異結(jié)論。
1)數(shù)據(jù)格式差異
定義:什么是數(shù)據(jù)格式差異?數(shù)據(jù)格式差異就是指改變前的數(shù)據(jù)格式和改變后的數(shù)據(jù)格式不同。
例如數(shù)據(jù)源變化中數(shù)據(jù)格式由格式A變化成格式B,那么這里改變前的數(shù)據(jù)格式是A,改變后的是B,A和B是不同的格式,這就是一次數(shù)據(jù)格式差異。
產(chǎn)生差異的原因:不同的數(shù)據(jù)格式滿足不同的場景,當(dāng)場景發(fā)生變化時,數(shù)據(jù)格式也就隨之發(fā)生了變化。
?影響及對策:
改變后的數(shù)據(jù)相比較改變前,更改了數(shù)據(jù)格式,可能會導(dǎo)致產(chǎn)品無法使用數(shù)據(jù),例如為了使得數(shù)據(jù)不被直接解讀,數(shù)據(jù)格式從數(shù)值改變?yōu)榱俗址?,而原有產(chǎn)品都是以數(shù)值作為標(biāo)準(zhǔn)數(shù)據(jù)格式直接進行數(shù)據(jù)存儲,并提供數(shù)據(jù)分析。
當(dāng)數(shù)據(jù)格式改為字符串時,產(chǎn)品無法獲取數(shù)據(jù),原有產(chǎn)品以“數(shù)值”設(shè)計的功能都將無法使用,會給產(chǎn)品帶來客訴以及退款等負(fù)面作用,為此我們需要根據(jù)最新的數(shù)據(jù)格式,修改涉及到的功能,降低其產(chǎn)生的影響。
2)數(shù)據(jù)內(nèi)容差異
定義:同樣的,什么是數(shù)據(jù)內(nèi)容差異?數(shù)據(jù)內(nèi)容的差異就是改變前后的數(shù)據(jù)在內(nèi)容方面有出入,例如數(shù)據(jù)源變化中數(shù)據(jù)內(nèi)容差生了差異,改變前的內(nèi)容是A,改變后的內(nèi)容是B,A和B是不同的內(nèi)容,這就是一次數(shù)據(jù)內(nèi)容差異。
而具體的A和B之間內(nèi)容的差異關(guān)系會存在A多于B,A小于B,A和B存在交集,即改變后數(shù)據(jù)內(nèi)容多于改變前,改變后少于改變前,以及改變前后互有多少。
產(chǎn)生差異的原因:不同的數(shù)據(jù)內(nèi)容是由業(yè)務(wù)決定的,當(dāng)業(yè)務(wù)發(fā)生變化時,數(shù)據(jù)內(nèi)容也會隨之進行變化。
影響以及對策:
首先,我們先看A多于B的情況,即改變后數(shù)據(jù)相較于改變前,多了很多數(shù)據(jù)內(nèi)容,多出來的內(nèi)容對與現(xiàn)有功能是一個多余的狀態(tài),我們需要分析多出來的部分是否會對現(xiàn)有功能產(chǎn)生影響,多出來的數(shù)據(jù)內(nèi)容可能會對原有的數(shù)據(jù)展示和存儲產(chǎn)生影響,包括因數(shù)據(jù)內(nèi)容溢出導(dǎo)致的頁面展示錯位,數(shù)據(jù)存儲異常等,會導(dǎo)致現(xiàn)有功能無法使用,從而產(chǎn)生負(fù)面影響。
對于這個影響,我們需要修正展示和存儲規(guī)則,解決這個問題后,我們可以再分析多出來部分的內(nèi)容是否支持做一些新能力或新功能,從而提升產(chǎn)品的價值和競爭力。
一起看個案例,例如訂單數(shù)據(jù)中的“訂單生成時間”原先只返回了年月日,本次改動返回了年月日時分秒,而產(chǎn)品中存儲的時間格式是 yyyy-mm-dd,而當(dāng)前年月日時分秒的格式為 yyyy-mm-dd HH:MM:SS,如果不對訂單生產(chǎn)時間進行處理,會導(dǎo)致訂單生產(chǎn)時間直接無法被儲存,從而依賴“訂單生成時間”字段的功能就將失去原始數(shù)據(jù),不再能向用戶提供依次統(tǒng)計的字段或者功能,導(dǎo)致用戶問題或場景無法解決。
其次,來看A少于B的情況,即改變后數(shù)據(jù)相較于改變前,少了很多數(shù)據(jù)內(nèi)容,這一情況會直接導(dǎo)致改變后的原始數(shù)據(jù)少了一部分內(nèi)容,從而導(dǎo)致產(chǎn)品功能中關(guān)鍵數(shù)據(jù)丟失,無法再向用戶提供原有設(shè)計的字段和功能。對于這個影響,我們需要盡快解決數(shù)據(jù)差異帶來的問題,盡可能讓功能和改變前保持一致。
還是通過案例來了解下,例如訂單數(shù)據(jù)中包含了買家ID、訂單編號、訂單生成時間、訂單狀態(tài)等,如果改變后訂單狀態(tài)缺失,那么就會直接導(dǎo)致產(chǎn)品中依賴“訂單狀態(tài)”的功能少了原始數(shù)據(jù),無法計算數(shù)據(jù)或提供功能。
最后是,A和B存在交集的情況,即改變后數(shù)據(jù)相較于改變前,部分?jǐn)?shù)據(jù)內(nèi)容多了,部分?jǐn)?shù)據(jù)內(nèi)容少了。需要分別將多的部分和少的部分,參照A多于B和B多于A的情況,作出相應(yīng)的改動。
結(jié)合如下的案例來加深下理解:
產(chǎn)品C提供了分析用戶付費情況的功能,其分析邏輯是,通過調(diào)用“公司中臺產(chǎn)品”的標(biāo)準(zhǔn)接口獲取數(shù)據(jù),依賴接口中“用戶字段”下的業(yè)務(wù)參數(shù)(0-免費用戶,1-付費用戶)來分析付費情況,近期“中臺產(chǎn)品”增加了分析能力,對業(yè)務(wù)參數(shù)做了如下變化,0-免費用戶,1-付費用戶(0-500元),2-付費用戶(500元以上),同時更改了數(shù)據(jù)獲取方式為消息推送,這就會對產(chǎn)品C的功能起到影響。
分析對比變化前后的數(shù)據(jù),可以發(fā)現(xiàn)這里的差異:
A. 數(shù)據(jù)內(nèi)容發(fā)生了變化,業(yè)務(wù)參數(shù)值,1的含義變化了,新增了業(yè)務(wù)參數(shù)值2
業(yè)務(wù)參數(shù)的變化會導(dǎo)致付費用戶統(tǒng)計不完全,因為之前的付費用戶所取的業(yè)務(wù)參數(shù)為? 1,而現(xiàn)在只取 1會導(dǎo)致所分析出來的付費用戶是不完全的,付費用戶只有 1 這部分,丟失了業(yè)務(wù)參數(shù)為2 的這部分付費用戶,直接會導(dǎo)致付費用戶的統(tǒng)計結(jié)果是不完全的。
假如1月15日(業(yè)務(wù)參數(shù)于1月1日改變)付費100元的用戶有100個,付費1000元的用戶有30個,如果不對付費用戶所取業(yè)務(wù)參數(shù)邏輯進行調(diào)整,那么付費用戶的付費金額統(tǒng)計為100 x 100 = 10000元,直接導(dǎo)致了付費1000元以上的30個付費用戶沒有被統(tǒng)計進來,造成了付費用戶統(tǒng)計數(shù)據(jù)的丟失,對使用產(chǎn)品 C 分析店鋪付費用戶情況的商家對自己店鋪的情況造成誤判。
B. 數(shù)據(jù)傳輸方式發(fā)生了變化,從主動調(diào)用接口變成了被動接受推送
數(shù)據(jù)傳輸?shù)淖兓瑫?dǎo)致原有取數(shù)方式-主動調(diào)用接口獲取的數(shù)據(jù)是空,直接導(dǎo)致付費用戶分析沒有數(shù)據(jù)結(jié)果產(chǎn)出。
同樣假如數(shù)據(jù)傳輸方式在1月14日改變,因為數(shù)據(jù)傳輸方式變更,原有的傳輸方式不再提供14號之后的數(shù)據(jù),假如產(chǎn)品C不做出對應(yīng)的調(diào)漲,在15日仍使用接口調(diào)用數(shù)據(jù)。
那么1月15日產(chǎn)品C通過接口獲取到的付費用戶數(shù)據(jù)為空,上文中130個付費用戶的數(shù)據(jù)都沒有辦法獲取到了,產(chǎn)品C分析店鋪付費用戶情況的功能也直接宣告失效。
這些差異直接影響產(chǎn)品C的“分析用戶付費”功能沒有原始數(shù)據(jù),無法生產(chǎn)分析結(jié)果,整個功能不再能夠被用戶使用,并對用戶造成誤判等決策失誤 ,進而給該產(chǎn)品帶來客訴等負(fù)面影響。
為此我們需要作出對應(yīng)的調(diào)整方案,使得產(chǎn)品功能與“數(shù)據(jù)改變前”一致,可以順利獲取到數(shù)據(jù),并根據(jù)數(shù)據(jù)準(zhǔn)確計算出付費用戶的情況包括人數(shù)、付費金額等,那么接下來我們要討論的就是如何根據(jù)調(diào)研結(jié)果設(shè)計產(chǎn)品應(yīng)對方案。
2.?根據(jù)調(diào)研結(jié)果設(shè)計方案
在充分調(diào)研變化前后數(shù)據(jù)的差異,我們就能根據(jù)差異做出相應(yīng)的調(diào)整方案,可以參考以下步驟展開:
- 第一步,是了解差異以及差異所帶來的影響,對照“標(biāo)題1” 中的調(diào)研方式,我們已經(jīng)可以充分了解變化前后的數(shù)據(jù)差異和對功能帶來的影響,是數(shù)據(jù)少了還是數(shù)據(jù)多了,是數(shù)據(jù)格式變了還是內(nèi)容發(fā)生了改變,并通過這些差異推斷出給功能帶來的影響
- 第二步,是需要優(yōu)先解決差異導(dǎo)致原有功能無法使用的問題,例如數(shù)據(jù)無法更新,數(shù)據(jù)無法計算等,盡可能做到不因為數(shù)據(jù)變化,導(dǎo)致用戶無法使用功能和產(chǎn)品
- 第三步,可以從變化中尋找一些有價值的點,例如變化后比變化前多一部分?jǐn)?shù)據(jù)內(nèi)容,這部分內(nèi)容是否可以支持對產(chǎn)品進行功能優(yōu)化或升級,提升產(chǎn)品的競爭力
一起來看下在產(chǎn)品C的案例中,首先在已知調(diào)研差異后,發(fā)現(xiàn)“付費用戶的定義從業(yè)務(wù)參數(shù)1,變?yōu)榱藰I(yè)務(wù)參數(shù)1和2”,影響了現(xiàn)有付費用戶分析的功能。
所以需要我們修改付費用戶統(tǒng)計的邏輯,解決這個問題:用戶字段中業(yè)務(wù)參數(shù)1和2的用戶都要標(biāo)記為付費用戶。
其次,因為改變后相較于改變前的數(shù)據(jù)差異,多了對付費用戶付費金額程度的數(shù)據(jù),我們就可以利用這個差異,提升“付費用戶”功能,例如對付費程度劃分等級v1和v2,分別代表微氪付費用戶和核心付費用戶,更加細(xì)分付費用戶的范圍,使得“付費用戶”功能有更大的價值。
三、總結(jié)
數(shù)據(jù)源分為自有數(shù)據(jù)和三方數(shù)據(jù),它們都存在受到業(yè)務(wù)或政策導(dǎo)致變化的情況,可能會給產(chǎn)品帶來嚴(yán)重的負(fù)面影響。
因此,我們需要通過充分調(diào)研數(shù)據(jù)源變化情況,了解變化前后的差異點;根據(jù)差異點,設(shè)計產(chǎn)品方案;以及向用戶說明變化情況,來避免因數(shù)據(jù)源變化而帶來的影響。
#專欄作家#
晌午,微信公眾號:晌午自習(xí)室,人人都是產(chǎn)品經(jīng)理專欄作家。4年產(chǎn)品經(jīng)驗,專注于數(shù)據(jù)方向,目前是電商客服領(lǐng)域的產(chǎn)品 。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
自有數(shù)據(jù),存儲在自己數(shù)據(jù)庫中,對于數(shù)據(jù)的把握,是相對較為可控的。