當環(huán)比數(shù)據(jù) “失控”:五大妙法還原商戶增長真相
做數(shù)據(jù)分析時,有時候會碰到一些難以解釋的異常情況,比如文章中這種環(huán)比異常增長的案例,如何找到真相?本文分享的五個方法,希望可以幫到大家。
一、問題現(xiàn)狀
做商戶交易分析的時候,經常會碰到一種讓人頭疼的情況。比如說,上個月有些商戶的生意不咋地,交易額只有個位數(shù),可能就幾塊錢。但這個月突然就火了,交易額一下子變成了好幾百甚至好幾千。這一對比,環(huán)比增長率就大得離譜,完全不能正常反應商戶的真實經營變化。要是就這么直接看數(shù)據(jù),很容易被誤導。
那怎么才能把這些數(shù)據(jù)處理得合理點,還能清楚地知道哪些商戶環(huán)比增長或者減少得多呢?下面就給大家講講幾個實用的辦法。
二、計算方式優(yōu)化
2.1、設定合理閾值
可以根據(jù)業(yè)務經驗和數(shù)據(jù)特點設定一個合理的環(huán)比增長率閾值,比如超過 1000% 或 2000% 等視為異常值。對于超過閾值的數(shù)據(jù),單獨進行標記或分組處理,在展示和分析時區(qū)別對待,既不影響整體的排序和分析,又能關注到這些特殊情況。
例如,在上述商戶交易數(shù)據(jù)統(tǒng)計業(yè)務中,根據(jù)以往數(shù)據(jù)波動情況,發(fā)現(xiàn)一般商戶的環(huán)比增長率很少超過 1000%,那么就可以將 1000% 設為閾值。
假設我們正在分析某商戶的環(huán)比增長數(shù)據(jù),原始數(shù)據(jù)如下:
根據(jù)以往該商城商戶數(shù)據(jù)波動情況,發(fā)現(xiàn)一般商戶的環(huán)比增長率很少超過 1000%,所以將 1000% 設為閾值。對于超過閾值的商戶 A、商戶 C 和商戶 E 進行單獨標記或分組處理。
整體分析:在不考慮這些異常值的情況下,對剩余商戶(如商戶 B、商戶 D、商戶 F)進行分析,可得到一般商戶的平均環(huán)比增長率、增長趨勢等數(shù)據(jù),以此了解商城內大多數(shù)商戶的正常業(yè)務增長情況。例如,這些正常增長商戶的平均環(huán)比增長率為 18.3%,說明在正常情況下,大部分商戶保持著較為穩(wěn)定的增長。
異常值分析:單獨查看超過閾值的商戶 A、商戶 C 和商戶 E。商戶 A 可能是因為上月參加了一個效果不佳的促銷活動,導致基數(shù)較低,而本月恢復正常經營且有新的爆款商品推出,使得銷售額大幅增長;商戶 C 或許是獲得了一筆大額訂單,屬于偶然因素導致的增長;商戶 E 可能是成功入駐了某熱門平臺的推薦位,從而銷量暴增。通過對這些異常值的單獨分析,可以挖掘出背后特殊的業(yè)務事件或機遇,為其他商戶提供借鑒,或者為平臺制定針對性的扶持政策提供依據(jù)。
2.2、采用對數(shù)轉換
對數(shù)據(jù)進行對數(shù)轉換,將原始的環(huán)比數(shù)據(jù)取對數(shù)后再進行分析和排序。這樣可以壓縮數(shù)據(jù)的范圍,使極大值和極小值之間的差距相對縮小,減少異常值對整體排序的影響,同時也能在一定程度上反映數(shù)據(jù)的相對變化趨勢。
例如,原本環(huán)比增長率為 10000% 的數(shù)據(jù),取對數(shù)后會變成一個相對較小的值,與其他數(shù)據(jù)的差距不再那么懸殊,能更合理地參與倒序排列。
假設我們正在分析某電商平臺上 5 家商戶的季度環(huán)比增長率數(shù)據(jù),原始數(shù)據(jù)如下:
通常我們使用以 10 為底的對數(shù)進行轉換(當然也可以根據(jù)實際情況選擇自然對數(shù)等)。對上述環(huán)比增長率數(shù)據(jù)進行以 10 為底的對數(shù)轉換。
原始數(shù)據(jù)排序:按照原始環(huán)比增長率從高到低排序為:商戶 A(10000%)、商戶 B(500%)、商戶 C(200%)、商戶 D(50%)、商戶 E(10%)??梢钥吹缴虘?A 的環(huán)比增長率數(shù)值遠高于其他商戶,在排序中占據(jù)絕對優(yōu)勢,這種過大的差距可能會掩蓋其他商戶之間相對變化的信息。
對數(shù)轉換后排序:按照對數(shù)轉換后的值從高到低排序為:商戶 A(4)、商戶 B(2.7)、商戶 C(2.3)、商戶 D(1.7)、商戶 E(1)。通過對數(shù)轉換,極大值(商戶 A)與其他值之間的差距被明顯壓縮,使得各商戶之間的相對差異更加合理地呈現(xiàn)出來。這樣在分析排序時,我們能更全面地考慮到所有商戶的相對變化情況,而不會過度受極端值(如商戶 A 的超高環(huán)比增長率)的影響。對數(shù)轉換后的數(shù)據(jù)能確保資源分配不僅僅傾向于增長幅度極為突出的個別商戶,而是綜合考慮到各類增長程度的商戶,促進平臺整體的均衡發(fā)展。
2.3、計算移動平均環(huán)比
計算移動平均環(huán)比,即不僅考慮當前周期與上一周期的環(huán)比,還綜合考慮多個周期的環(huán)比情況,取其平均值。這樣可以平滑數(shù)據(jù),減少單個周期異常值的影響,更能體現(xiàn)商戶的長期趨勢和穩(wěn)定增長情況。
例如,計算過去 3 個周期的移動平均環(huán)比,用本周期與前三個周期分別計算環(huán)比,再求平均值,作為該商戶的綜合環(huán)比指標進行排序。
2.4、分區(qū)間統(tǒng)計和展示
將數(shù)據(jù)按照一定的金額區(qū)間或環(huán)比增長區(qū)間進行分組統(tǒng)計和展示。對于那些前一周期金額較小、本周期金額大幅增長的商戶,單獨放在一個區(qū)間進行分析和展示,與其他正常增長的商戶區(qū)分開來,這樣可以更清晰地看到不同區(qū)間內商戶的環(huán)比增減情況。
例如,將商戶分為 “個位數(shù)金額增長到六位數(shù)金額”,“十位數(shù)金額增長到五位數(shù)金額” 等不同區(qū)間,分別分析每個區(qū)間內的環(huán)比增減情況和排名。
假設我們收集了某電商平臺在一個特定時間段內,1000 家商戶的上一周期和本周期交易金額數(shù)據(jù),以下是基于區(qū)間統(tǒng)計和展示的具體分析:
1)設定區(qū)間
區(qū)間一:個位數(shù)金額增長到六位數(shù)金額
區(qū)間二:十位數(shù)金額增長到五位數(shù)金額
區(qū)間三:百位數(shù)金額增長到四位數(shù)金額
區(qū)間四:正常增長區(qū)間(上下波動幅度在 ±50% 以內)
2)數(shù)據(jù)歸類與統(tǒng)計
經過對 1000 家商戶數(shù)據(jù)的整理,各區(qū)間商戶分布如下:
區(qū)間一:有 10 家商戶屬于個位數(shù)金額增長到六位數(shù)金額。上一周期這些商戶平均交易金額為 5 元,本周期平均達到了 150000 元。
區(qū)間二:共 25 家商戶是從十位數(shù)金額增長到五位數(shù)金額。上一周期平均交易金額為 85 元,本周期平均為 18000 元。
區(qū)間三:40 家商戶符合百位數(shù)金額增長到四位數(shù)金額。上一周期平均交易金額為 650 元,本周期平均為 4500 元。
區(qū)間四:剩下的 925 家商戶處于正常增長區(qū)間。上一周期平均交易金額為 5000 元,本周期平均為 5500 元。
3)環(huán)比增減情況分析
區(qū)間一:環(huán)比增長率極高,平均環(huán)比增長率達到了約 3000000%。這些商戶可能是一些新興的特色小商家,抓住了某個熱門趨勢或平臺推廣機會,實現(xiàn)了爆發(fā)式增長。
區(qū)間二:平均環(huán)比增長率約為 21000%。這類商戶可能是在原有基礎上通過優(yōu)化產品或服務,吸引了更多客戶,實現(xiàn)了較大幅度的增長。
區(qū)間三:平均環(huán)比增長率約為 592%。這些商戶穩(wěn)步拓展業(yè)務,可能通過一些常規(guī)的營銷手段或改進經營策略,取得了較為可觀的增長。
區(qū)間四:平均環(huán)比增長率為 10%。該區(qū)間內商戶增長較為平穩(wěn),代表了平臺上大多數(shù)商戶的常規(guī)增長水平。
排名展示
對于每個區(qū)間內的商戶,按照環(huán)比增長率進行排名。例如在區(qū)間一中,商戶 A 上一周期交易金額為 3 元,本周期達到了 180000 元,環(huán)比增長率高達 6000000%,在該區(qū)間內排名第一。這表明商戶 A 在這類爆發(fā)式增長的商戶中,增長速度最為突出。
2.5、采用相對比率指標
除了環(huán)比增長率,還可以引入其他相對比率指標,如定基比率等,從不同角度衡量商戶的增長情況。結合多個指標進行綜合評估,避免僅依賴環(huán)比數(shù)據(jù)導致的異常值影響過大問題。
例如,以某個固定周期為基期,計算每個周期與基期的定基比率,再結合環(huán)比數(shù)據(jù),綜合判斷商戶的增長趨勢和幅度。
假設我們有某商戶連續(xù) 5 個季度的交易數(shù)據(jù),如下表所示:
1)計算環(huán)比增長率
- 環(huán)比增長率 = (本期數(shù) – 上期數(shù))/ 上期數(shù) ×100%
- Q2 環(huán)比增長率 = ($12000 – 10000) / 10000×100% = 20%
- Q3 環(huán)比增長率 = ($15000 – 12000) / 12000×100% = 25%
- Q4 環(huán)比增長率 = ($13000 – 15000) / 15000×100% ≈ -13.33%
- Q5 環(huán)比增長率 = ($18000 – 13000) / 13000×100% ≈ 38.46%
2)計算定基比率
- 以 Q1 為基期,定基比率 = (各期數(shù) / 基期數(shù))×100%
- Q2 定基比率 = ($12000 / 10000)×100% = 120%
- Q3 定基比率 = ($15000 / 10000)×100% = 150%
- Q4 定基比率 = ($13000 / 10000)×100% = 130%
- Q5 定基比率 = ($18000 / 10000)×100% = 180%
3)綜合分析
- 從環(huán)比增長率看,Q2 到 Q3 增長態(tài)勢良好,但 Q4 出現(xiàn)了負增長,Q5 又大幅增長。環(huán)比數(shù)據(jù)能體現(xiàn)相鄰兩個周期的變化情況,但如果某一周期數(shù)據(jù)異常(如 Q4 因特殊原因導致交易金額下降),可能會影響對整體趨勢的判斷。
- 而定基比率始終以 Q1 為參照,更能體現(xiàn)從基期開始的總體增長趨勢。該商戶從 Q1 到 Q5 的定基比率持續(xù)上升,表明整體上交易金額處于增長狀態(tài)。
- 通過結合環(huán)比增長率和定基比率這兩個相對比率指標,我們可以更全面、準確地評估該商戶的增長情況。例如,在分析 Q4 數(shù)據(jù)時,雖然環(huán)比出現(xiàn)負增長,但結合定基比率發(fā)現(xiàn),相較于基期 Q1 仍有 30% 的增長,說明該商戶的業(yè)務總體增長趨勢未變,Q4 的下滑可能是短期波動,而非長期趨勢逆轉。
通過以上一種或多種方法的結合使用,可以更合理地處理數(shù)據(jù),既能有效應對環(huán)比率異常大的情況,又能準確地看出環(huán)比增減大的商戶,為數(shù)據(jù)分析和決策提供更有價值的信息。
本文由 @一個帽子的世界 原創(chuàng)發(fā)布于人人都是產品經理。未經作者許可,禁止轉載
題圖來自 Pexels,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務
分享的方法是有用的,希望可以應用到本身的工作中