超詳解析零售業(yè)中的那些數(shù)據(jù)挖掘問題(二)
![](http://image.woshipm.com/wp-files/img/105.jpg)
本文是 TalkingData 首席數(shù)據(jù)科學(xué)家張夏天翻譯自 Highly Scalable Blog?的一篇文章,介紹了零售業(yè)中的數(shù)據(jù)挖掘問題。本文內(nèi)容包括零售業(yè)中的多個常見問題,如響應(yīng)建模、推薦系統(tǒng)、需求預(yù)測、價格差異、促銷活動規(guī)劃、類目管理、財務(wù)影響等。其中涉及的資源分配優(yōu)化問題、個性化推薦、定向廣告等業(yè)務(wù)問題,上下兩篇完整閱讀大約需要兩個半小時,本次發(fā)布下篇。
問題 4: 價格差異
1.問題定義
零售商向客戶提供一組產(chǎn)品時,針對每個用戶都制定不同的價格來最大化整體的收入。另外,該問題可以重新定義為提供定向折扣從而在基線價格上改變價格。
2.應(yīng)用
價格差異被廣泛的應(yīng)用在零售業(yè)并且存在非常多種顯性和隱性的形式:優(yōu)惠券,店鋪級價格分區(qū),和折扣都是價格差異的例子。
價格區(qū)分與通過數(shù)量折扣來提升銷售是相關(guān)的。
動態(tài)定價能用價格差異的原則和模型來增量的調(diào)整價格。
盡管我們在問題的定義中暗示了是細(xì)粒度的個體定價方式,但是這是非常極端的情況更多常見的方法是對大的客戶分群設(shè)置不同的價格。
3.解決方案
價格區(qū)分是最基礎(chǔ)的經(jīng)濟和營銷問題 [SM11],因此:
此處 G 是利潤,Q 是銷售數(shù)量,P 是單位價格,V 是可變的單位成本(大致相當(dāng)于零售商拿到的批發(fā)價格),而是固定成本如管理成本。公式(4.1)中的價格和銷量是互相依賴的,因為隨著價格的提高需求會下降,反之亦然。價格和銷量的關(guān)系通??梢杂靡粋€線性函數(shù)來逼近,這一函數(shù)具有一個一般被稱為需求彈性的系數(shù):
換言之, 需求彈性是需求量的百分比變化與價格的百分比變化的比率。公式(4.1)和(4.2)可以可視化如下:
需求曲線是一條由需求彈性和零售商利潤定義的斜線,數(shù)值上等價于(Po-V) · Q0,此處 P0 是由零售商設(shè)定的單位產(chǎn)品價格。
一方面,當(dāng)價格接近可變成本時利潤趨近于 0,雖然銷售量很高。
另一方面,高價格將導(dǎo)致銷售量下降,結(jié)果利潤也會變得很小。這基本上意味著價格服從于一個數(shù)值優(yōu)化問題,并且零售商可以用統(tǒng)計技術(shù)來估計需求彈性并找到使得公式(4.1)最大化的最優(yōu)價格。
這一方法,即所謂計量價格優(yōu)化的實用性是比較有限的 [SM11] 因為又公式(4.1)表達的模型過于簡化了市場行為并丟棄了在競爭市場中一些重要的影響價格-數(shù)量關(guān)系的因素。
例如,價格大幅度下降可能會引發(fā)競爭對手降低整個行業(yè)價格的對稱反應(yīng),所以所有的市場參與者最終都會處于一個銷售量和利潤都較低的狀況。
盡管計量價格優(yōu)化有很多局限性,但公式(4.1-4.2)揭示了價格差異的本質(zhì)。對于任意一個價格,無論它有多優(yōu)化,這一價格都是一種折衷。因為一些客戶會因為這一價格太貴而放棄購買,盡管他們可能愿意以更低的在 P0 和 V 之間的價格(依然對兩種利潤是正向貢獻)購買該產(chǎn)品。
此外,一些客戶可以容忍高于 P0 的價格,盡管他們產(chǎn)生的銷售量會相對較小。在這兩種情況下,零售商無法獲取位于需求曲線和可變成本線圍成的三角區(qū)域之中的額外利潤。
價格差異是一種自然的方法來克服單一常規(guī)價格的限制,通過根據(jù)客戶的付款意愿將客戶分群并向不同的客戶群體提供不同的價格??紤]一個這種策略的特殊情況,在前一圖表的常規(guī)價格外補充了一個較高的溢價(注意與單一價格策略相比利潤區(qū)域如何增加):
這一考慮帶來了零售商如何把相同的產(chǎn)品以不同的價格賣給不同的客戶這一挑戰(zhàn)性問題。一般而言,這需要在具有不同付費意愿的客戶之間設(shè)置區(qū)隔以使得高付費意愿的客戶不能以為低付費意愿客群設(shè)定的價格來付費。零售商可以使用如下幾種區(qū)隔機制:
- 店鋪區(qū)域:連鎖零售商店一般都位于不同的社區(qū)內(nèi),這些社區(qū)具有不同的平均家庭收入、平均家庭規(guī)模、最近競爭商店距離等人口屬性和競爭性因素。這就自然對客戶的價格敏感性以及尋找替代供應(yīng)商的能力或者意愿做了區(qū)分。這使得零售商可以在店鋪的級別上在不同區(qū)域設(shè)置不同的價格。
- 包裝大?。?/strong>諸如軟飲料或化妝品之類的快速消費品(FMCG)具有較高的周轉(zhuǎn)率,消費者自然可以選擇是頻繁購買少量產(chǎn)品或者儲存大量的產(chǎn)品,這種權(quán)衡也受到諸如家庭規(guī)模等人口因素的影響。這一機制通過購買大型或小型包裝的意愿來創(chuàng)建區(qū)隔,并為不同包裝尺寸設(shè)置不同的單位邊際價格。買一送一(BOGO)優(yōu)惠也與此機制有關(guān)。
- 促銷活動:客戶可以根據(jù)他們是否愿意等待較低價格還是以正常價格立即購買來區(qū)分。此種客戶分群方式被廣泛應(yīng)用于服飾領(lǐng)域,在該領(lǐng)域季節(jié)性促銷是主要的營銷機制之一。
- 優(yōu)惠券:許多客戶不會愿意以常規(guī)價格來購買某一產(chǎn)品,但是當(dāng)有折扣價時卻會考慮購買。因此零售商可以從折扣中獲得額外的客戶,盡管他們貢獻的毛利率相較于那些以正常價格購買的產(chǎn)品的客戶較低。另一方面,向太過廣泛的受眾提供折扣可能是有害的,因為那些愿意以正常價格購買的客戶也會使用折扣(當(dāng)沒有折扣的時候),前面章節(jié)中討論過的響應(yīng)建模技術(shù)有助于解決這一問題。然而有一種 19 世紀(jì)就存在的傳統(tǒng)解決方案——優(yōu)惠券,優(yōu)惠券代表需要付出一定努力才能賺取或兌換的價格折扣(例如,客戶必須在報紙上找到它,剪下來并在商店出示),這就通過花費時間和精力獲得折扣的意愿區(qū)分了客戶。
- 銷售渠道:不同的銷售渠道自然代表不同的區(qū)隔,因為客戶對購買渠道的選擇與他們的支付意愿密切相關(guān)。例如,與在雜貨店購買相同葡萄酒的顧客相比,酒類商店顧客的價格敏感性一直較低 [CU13]。
盡管這些技術(shù)已經(jīng)應(yīng)用很久了,但是要建立一個完整的折扣優(yōu)化模型是非常挑戰(zhàn)的。
并且,據(jù)我們所知,所有現(xiàn)有的模型都有這樣或者那樣的局限性。在本節(jié)剩下的部分我們考慮兩個價格差異模型,這兩個模型是根據(jù)美國超市(特別是 Safeway 在芝加哥子公司的數(shù)據(jù))的數(shù)據(jù)設(shè)計并在這些數(shù)據(jù)上做過驗證的。
4.基于數(shù)量和地點的差異
文獻 [KJ05] 提出了這一模型,該模型的目標(biāo)是聯(lián)合優(yōu)化基于包裝大小的數(shù)量折扣和店鋪級別的區(qū)域價格。這一模型與我們在需求預(yù)測章節(jié)中討論的模型非常相似,只是該模型引入了更多的包裝大小和折扣參數(shù)。
讓我們考慮這樣一種情況:一個零售商運營多個店鋪,銷售的某種產(chǎn)品也有幾種品牌,產(chǎn)品的規(guī)格也有幾種,例如可口可樂和百事可樂分別有 2 聽裝、4 聽裝和 6 聽裝。目標(biāo)是優(yōu)化每種包裝的單位產(chǎn)品價格,這里假設(shè)單位產(chǎn)品價格是可以根據(jù)產(chǎn)品規(guī)格和店鋪來調(diào)整。我們從標(biāo)準(zhǔn)的多元邏輯特模型(multinomial logit – MNL)開始,這一模型在前一節(jié)需求預(yù)測中討論過。
它表示顧客在時間 t 在商店 s 購買產(chǎn)品 j 的概率,J 是產(chǎn)品的數(shù)量(所有品牌的所有規(guī)格加上)。時間以相對較長的時間間隔(如周)進行測量。參數(shù)變量 x 可以使用以下回歸模型進行估計:
此處 zj 是產(chǎn)品規(guī)格,Pjts 是價格,djts 是折扣力度(單位美元),ruts 整合了諸如最近競爭商店等競爭性因素,而 fjts 則整合了環(huán)境變化因素如天氣。因此, 回歸參數(shù) αk 基本上對應(yīng)著客戶對品牌、規(guī)格的偏好、對價格的敏感性、對折扣的響應(yīng)度、對競爭者的偏好、對變化因素的敏感性,以及折扣對價格敏感性的影響等等。
文獻 [KJ05] 認(rèn)為促銷案例中的價格敏感性回歸模型應(yīng)該比以上僅用一個回歸量來表達價格敏感性更復(fù)雜,因為客戶會有囤積產(chǎn)品的情況,這就使得過去的促銷會提高其對當(dāng)前產(chǎn)品價格的敏感性。這一方面可以通過將相應(yīng)的回歸器分解為兩個部分來建模,如下所示:
以上公式中 α3 是平均敏感度而第二項則表示記憶效應(yīng)。其中 W 是表示歷史深度,即過去的周數(shù),p0 表示常規(guī)價格,而 p 是實際的折后價格。類似的,也有觀點認(rèn)為對促銷的敏感性也與最近的促銷有關(guān):
此處 wj 是最近的促銷活動過去的周數(shù)。促銷敏感性對 wj 依賴基于以下假設(shè),兩次促銷之間的周期越長,則對促銷的響應(yīng)度越高。
公式(4.3)允許我們預(yù)測銷售量,所以價格優(yōu)化問題能夠根據(jù)公式(4.1)分時間周期來定義:
以上公式中 cjt 表示批發(fā)價格,而 Qjt 表示預(yù)測的銷售量。此處的優(yōu)化約束條件是為了避免由市場競爭或者客戶行為等主要因素的變化引起的劇烈的價格變化和偏移。
文獻 [KJ05] 提出了這一特殊的約束條件,這一約束要求優(yōu)化后的產(chǎn)品份額加權(quán)平均價格(表示產(chǎn)品的市場份額)不會超過優(yōu)化前的份額加權(quán)平局價格(表示原始價格)。這一優(yōu)化問題(4.4)可以在店鋪水平上得到求解,這意味著在規(guī)格和地點上都可以做差異化,或者僅在連鎖店級別上來差異化數(shù)量折扣。
5.個性化折扣和優(yōu)惠券
盡管上面的模型在店鋪層面做價格差異也隱含了客戶層次上的價格差異,但是這一模型不是為單個客戶的折扣優(yōu)化來設(shè)計的。
接下來我們考慮文獻 [JT13] 提出的另一種模型,這一模型是為了專門優(yōu)化個性化折扣和優(yōu)惠券的。這一模型的主要優(yōu)勢是它不僅是優(yōu)化折扣的粒度,同時也嘗試為指定用戶提供折扣的最優(yōu)時間和折扣的最優(yōu)有效期。
這些時間屬性上的優(yōu)化思想來自于以下假設(shè):一個客戶購買的概率不是隨時間恒定的,而是會隨著時間變化的,因此對每一個用戶而言都存在最優(yōu)的折扣時間窗口。
這一模型的主要缺陷是其只能對特定品牌如廠商促銷來進行優(yōu)化,而不能用于品類管理。你為了對折扣的時間屬性建模,假設(shè)對產(chǎn)品的折扣力度為 d,我們將客戶 u 在時間 t 購買產(chǎn)品的概率分解為購買產(chǎn)品的概率和客戶在在時刻 t 購買的概率乘積:
對給定產(chǎn)品的購買概率密度函數(shù)能夠用公式(4.3)中用過的 MNL 的模型來估計。在時刻時購買的概率密度函數(shù)在文獻 [JT13] 中由厄蘭分布來建模:
此處參數(shù)變量 yu 可以用回歸模型來估計,該回歸模型與公式(4.3)中用來估計參數(shù)變量的類似,會用一個回歸量來描述折扣力度,因此之后可以對其進行優(yōu)化。
上面定義的購買概率使得我們能夠?qū)o定客戶的銷售量 Qu 作為折扣力度(以美元為單位)、折扣起始時間、和折扣周期的函數(shù)來建模:
以上推導(dǎo)可以使得我們導(dǎo)出如下毛利率優(yōu)化問題:
這里 m 是在正常價格下的毛利率。以上公式中的第一項對應(yīng)著收入,收入由三個方面組成(促銷前的收入、促銷期間的收入和促銷后的收入);第二項對應(yīng)著營銷活動的成本。下圖描述了這一優(yōu)化問題:
頂部的第一個圖顯示了客戶 u 購買的概率密度函數(shù)曲線,此圖中對于給定產(chǎn)品在正常價格時的銷量對應(yīng)著 S0 區(qū)域。一個固定的永久折扣增加的銷量對應(yīng)的區(qū)域為 S1,因此總收入和促銷成本(如中間的圖所示)是與 S0 和 S1 成正比的。
時間優(yōu)化的促折銷使得收入與 S0+S2 成正比, 其成本與 S02+S2(如底部的圖所示)。固定折扣促銷和時間優(yōu)化的促銷之間的這種差異表明在概率密度函數(shù)具有某些數(shù)量性質(zhì)時存在利用時間優(yōu)化來改善毛利率的潛力。
問題 5:促銷活動規(guī)劃
1.問題定義
零售商向客戶提供一組產(chǎn)品時,針對每個用戶都制定不同的價格來最大化整體的收入。另外,該問題可以重新定義為提供定向折扣從而在基線價格上改變價格。
零售商準(zhǔn)備一次促銷活動,即對某個或者一組特定商品進行有時限的折扣。對促銷活動的規(guī)劃需要估計到下列有關(guān)的值:
- 哪些產(chǎn)品的庫存需要避免在活動結(jié)束前缺貨?
- 什么樣的價格會最大化收入?價格可以考慮是一個恒定值或者是一個從活動開始到結(jié)束不同時間段的函數(shù)。
我們將考慮庫存水平是預(yù)先確定的,零售商試圖計算最優(yōu)價格這種情況。這是時尚零售商在處理季節(jié)性清倉和款式翻新 [JH14, CA12] 中遇到的典型問題。這一問題可以以不同的方式來定義,如將需求預(yù)測和價格優(yōu)化作為獨立的問題來處理,也可以同時優(yōu)化庫存水平和價格,總之其目的是最大化收入。
2.應(yīng)用
促銷活動的規(guī)劃在零售中有如下的應(yīng)用:
- 清倉和季節(jié)性促銷是時尚零售業(yè)中的主要應(yīng)用。
- 某些商業(yè)模式如快閃零售(也被稱為彈出零售)只有促銷活動一種銷售方式。
- 快消品和易腐品的零售商可以使用促銷活動策劃來調(diào)整銷售節(jié)奏與產(chǎn)品保質(zhì)期同步 。
3.解決方案
動態(tài)需求預(yù)測和價格優(yōu)化是經(jīng)濟學(xué)中所研究的基礎(chǔ)問題,被稱為收入管理。收入管理的理論在書籍如 [TA05] 中有很好的闡釋和系統(tǒng)化的介紹。在服務(wù)業(yè)中的預(yù)定服務(wù),如機票、體育場座位、酒店房間、租車等等場景中可以找到收入管理自動化的最先進和最有效率的例子。
要理解這些技術(shù)可以如何在零售領(lǐng)域中使用,我們來考察由 RueLaLa(一個時尚零售商)提出來的方法論。
我們假設(shè)一個零售商計劃對 N 個產(chǎn)品或者產(chǎn)品組(產(chǎn)品組中的產(chǎn)品價格相同,如不同口味的酸奶,或者不同花色的 T 恤)進行打折。設(shè) P 為價格集合,該集合包含每個產(chǎn)品可以設(shè)定的價格。在實踐中,P 通常是根據(jù)業(yè)務(wù)規(guī)則組成的比較小集合。
例如,價格下限可以根據(jù)零售商的盈利水平定義為 29.90, 價格調(diào)整幅度根據(jù)心理價格可以設(shè)定為 5 美元,則 P=$29.9,$34.9,$39.9,$44.9,$49.9。
假設(shè)促銷活動中的所有產(chǎn)品或者產(chǎn)品組都有某些共同點,例如同屬于相同的類目“女鞋”或者“平安夜食品”,因此對一個產(chǎn)品的需求潛在的依賴于其他可替代產(chǎn)品的價格。
通過引入變量 S,其等于所有參與促銷活動的競爭產(chǎn)品(產(chǎn)品組)的價格之和,而對某一產(chǎn)品估計的期望需求則為數(shù)學(xué)期望 E{Q | i,pj,S},此處 Q 是表示需求量的隨機變量,i=1,2,……,N 是產(chǎn)品的索引,而 j =1,2,……,|P| 是單個產(chǎn)品或產(chǎn)品組的價格。既然 Q 與產(chǎn)品價格 S 和都相關(guān),這就隱含地包含了產(chǎn)品價格與可替代產(chǎn)品的評價價格的比值對需求和其彈性都是有影響的。
現(xiàn)在我們可以在假設(shè) S 為固定的并對所有可能的 S 求解這一優(yōu)化問題 [JH14]:
當(dāng)產(chǎn)品 i 的價格為 pj 時,二值變量 δi,j∈0,1 為 1,否則為 0。上述優(yōu)化問題中的目標(biāo)函數(shù)可以自然地表達為促銷活動的收入。第一項約束保證每個產(chǎn)品的價格都在 P 之中(原文可能有問題),而第二項約束保證所有產(chǎn)品的價格之和為 S。其他關(guān)于庫存水平的約束也可以加入到優(yōu)化問題中來。
以上的優(yōu)化問題需對需求 E{Q | i,pj,S} 做估計,這可以用前面章節(jié)中做需求預(yù)測和價格分群的技術(shù)來解決。然而,需要非常注意到缺貨(而且是可取的)是促銷活動中非常典型的情況,因此對很多產(chǎn)品的需求預(yù)測建模所要用到的歷史數(shù)據(jù)都是被截斷的。
正如 [JH14] 中所建議的那樣,可以通過使用在此前促銷期間沒有缺貨的產(chǎn)品的數(shù)據(jù)為不同產(chǎn)品類別構(gòu)建畫像來解決此問題,并使用這些畫像來調(diào)整相應(yīng)類別的需求曲線。
問題 6: 類目管理
1.問題定義
零售商根據(jù)類目銷售產(chǎn)品。一個類目表示一組相對內(nèi)聚的產(chǎn)品,這些產(chǎn)品有很多共同點(如”甜點”、“女式牛仔”等),所以客戶有可能在他們的首選產(chǎn)品因某些原因缺貨時愿意用另一產(chǎn)品來替代。
產(chǎn)品缺貨的主要原因有永久性的品種減少(如因為有限的貨架空間)和暫時的性的售罄。類目管理的目標(biāo)是利用替代效用用優(yōu)化方法計算出一個產(chǎn)品子集,這一子集在滿足物理約束如可用的貨架空間的情況下可以最大化毛利率。
2.應(yīng)用
品類管理是一項相對專業(yè)化的工作,但是當(dāng)目標(biāo)是優(yōu)化一個產(chǎn)品類目的整體收益而不是一個單一產(chǎn)品的收益時,它也會涉及到在促銷優(yōu)化問題中存在的替代效應(yīng)問題。零售商一般情況下對類目的整體收益的關(guān)心程度遠(yuǎn)勝于對單個產(chǎn)品的優(yōu)化,因此在本節(jié)中討論的方法可以被用在很多不同的應(yīng)用中以實現(xiàn)最優(yōu)解決方案。
本節(jié)研究的模型可以直接應(yīng)用于以下類目管理方式:
- 倉庫的產(chǎn)品庫存水平優(yōu)化。一個特別重要的應(yīng)用是對易腐產(chǎn)品的庫存管理,這需要考慮到保質(zhì)期和過去產(chǎn)品造成的潛在損失。
- 優(yōu)化貨架的布局來調(diào)整相關(guān)產(chǎn)品的份額。
- 類目規(guī)劃(在類目中加入或者移除哪些產(chǎn)品)。
3.解決方案
從計量經(jīng)濟學(xué)的角度來看,類目管理問題是由收益遞減規(guī)律引起的?;蛘吒唧w地說,收入和成本與類目的規(guī)模關(guān)系是不同的,總的趨勢是消費者購買能力在某個時候達到飽和,同時由于店鋪面積和其他運營成本的增加,成本持續(xù)增長:
這一趨勢引出了類目優(yōu)化問題。這是一個非常具有挑戰(zhàn)性的問題,因為它需要對整個類目中所有產(chǎn)品之間的相互依賴關(guān)系建模。然而,盡管面臨這些挑戰(zhàn),在 [KOK07] 中已經(jīng)提出了一種切實可行的類目優(yōu)化模型,并在荷蘭的連鎖超市 Albert Heijn 中應(yīng)用。在研究這一方法之前,我們先引入下列符號:
- N={1,2,……,J} – 零售商給用戶提供的一個類目下面的最大產(chǎn)品集合,即所有品類。
- fi∈{0,1,2,……} – 產(chǎn)品 j 的庫存水平。零售商通過選擇 f 為 0(產(chǎn)品不出現(xiàn)在品類中)或者非 0 來優(yōu)化品類。
- F0 – 統(tǒng)一庫存單位度量下的庫存總?cè)萘?。這里有個假設(shè)是所有產(chǎn)品的庫存水平之和不能超過 F0。庫存總?cè)萘靠梢杂蓚}庫或者店鋪的可用貨架空間所約束。
- Nh ? N – 店鋪 h 的品類,是總品類的子集。
- dj 表示產(chǎn)品 j 的原始需求率(當(dāng)所有 N 品類都展示給客戶時有多少顧客會選擇該產(chǎn)品)
- Dj – 觀察到的產(chǎn)品的需求率(每天因為原始意愿或者替代效應(yīng)而實際選擇產(chǎn)品 j 的數(shù)量)。對給定產(chǎn)品觀察到的需求與原始需求和其他產(chǎn)品的可獲得性(替代效應(yīng))有關(guān)系,其可以被視為函數(shù):
- Dj({f1,……,fJ},{d1,……,dJ})
使用上述符號,品類優(yōu)化問題可以形式化如下:
其中毛利率 Gj 是給定產(chǎn)品和其對應(yīng)的觀測需求的函數(shù)。這一函數(shù)很大程度上與零售商的商業(yè)模式有關(guān),所以我們下面介紹一些通用的函數(shù)模板,基于這些模板可以根據(jù)實際的使用情況來定制毛利率函數(shù):
公式(6.2)將觀測需求乘以毛利率 m,這是對毛利潤最簡單的建模方式,該公式隱含假設(shè)了補貨及時而沒有缺貨的情況。雜貨這樣的快消品正是屬于這種情況,但是在其他領(lǐng)域如服飾則必須如公式(6.3)那樣考慮缺貨的情況。銷售易腐貨物的零售商還要考慮貨損,公式(6.4)通過引入單位損失變量 L 來對此進行建模。
為討論方便,后面我們假設(shè)所有產(chǎn)品的補貨都是及時的,所以缺貨是不可能或者是可忽略的。因此我們可以將 j∈{0,1} 作為二值變量來表示產(chǎn)品是否在類目中,更復(fù)雜的處理缺貨的模型可以在 [KOK07] 中找到。
要解決(6.1)中的優(yōu)化問題,我們需要定義觀測需求函數(shù)。在無缺貨假設(shè)下,需求函數(shù)可按照下面公式來建模:
其中 αk-j 是產(chǎn)品 k 被產(chǎn)品 j 替換的概率。上述公式是比較自明的:第一項是原始需求,而第二項是所有被從類目中移除的產(chǎn)品的累計替代需求。
公式(6.5)需要估計替代概率 αk-j 和原始需求率 dj。為了做這些估計,我們假設(shè)下列變量是已知的(我們已經(jīng)在本文的前面章節(jié)討論過需求預(yù)測):
- Qjh,j∈Nh – 每個客戶在店鋪對產(chǎn)品的需求。假設(shè) Kh 是一天內(nèi)進過店鋪 h 的客戶數(shù)量, 則 Dj = Kh * Qjh。
- Q0jh,j∈Nh – 每個客戶在店鋪 h 具有全品類產(chǎn)品時的需求(假設(shè)商店的品類是全的)。因為品類齊全所以不存在替代效應(yīng),因此 Q0jh 就是原始需求。
估計替代率 αk-j 是比較困難的事情因為產(chǎn)品集合 J 中有多達不同 J2的替代率。不過,[KOK07] 找到了下述客戶行為的簡化模型,在實踐中這一模型有足夠的精度并僅需要用一個而不是 J2 個變量:如果產(chǎn)品 k 買不到,客戶會選擇其第二選擇產(chǎn)品來替代的概率為 δ,這一概率對一個類目下的所有產(chǎn)品都是一樣的,則客戶不買任何東西的概率為(1- δ)。這一模型引出了如下替代率的簡單公式:
為了估計 δ, 我們將給定店鋪的總需求定義為Qjh(可由歷史數(shù)據(jù)來估計)之和:
另一方面,該值也可以根據(jù)公式(6.5)估計如下:
現(xiàn)在 δ 可以通過最小化總需求的實際值和預(yù)測值之間的差異來估計:
求解優(yōu)化問題(6.1)的下一步是計算公式(6.5)中使用的原始需求率。我們首先注意到店鋪?h?對?N?中所有產(chǎn)品的總需求可以按如下方式計算:
其中?Vh?是每天到訪店鋪?h?的客戶總數(shù)。在公式(6.10)中,所有?Q0jh?之和乘以?Vh?表示在給定全品類時的的總需求。然而的值時針對擁有全品類的店鋪估計得的,其值時與給定店鋪相關(guān)(如地點,店鋪面積等等)而沒有被建模的。這可以通過公式(6.7)估計的類目需求和從公式(6.8)預(yù)測的需求比值來補償調(diào)整。
在一個品類有限的店鋪,總需求是以下兩個部分的和:對給定店鋪品類中存在的商品的需求和對中其他產(chǎn)品的需求。兩部分的比率可以由表示如下:
自然的,Th * rh 表示對品類中存在的產(chǎn)品的需求分額,而(1- Th * rh)則表示對不在品類中的產(chǎn)品的需求份額。最后,我們對單一產(chǎn)品的需求可以當(dāng)作是總需求的一部份來計算:
所有公式(6.12)和(6.9)中的系數(shù)都可以根據(jù)數(shù)據(jù)來估計,因此我們可以把所有公式展開到原始優(yōu)化問題(6.1)中,則這個問題可以使用 [KOK07] 提出的數(shù)值方法來求解。
公式(6.1)將為每個產(chǎn)品都產(chǎn)生一個假定的最有庫存水平 fj。這些庫存水平值可以用來調(diào)整庫存和優(yōu)化貨架布局。值得注意的是該模型使得零售商可以做假設(shè)分析來評估對品類和庫存水平的改變會如何影響毛利率。
例如,零售商可以畫出毛利率根據(jù)給定產(chǎn)品或者產(chǎn)品組的庫存水平變化的函數(shù)曲線。這些曲線對易腐產(chǎn)品尤其具有描述性,因為毛利率是凸函數(shù),當(dāng)庫存水平為 0 時函數(shù)值為 0,而當(dāng)庫存水平過高時毛利率因為產(chǎn)品過期造成的損失也會為 0,毛利率的最優(yōu)值是在兩種極端情況之間。
問題 7:財務(wù)影響
如果缺乏上述被討論的優(yōu)化方法的財務(wù)表現(xiàn)方面的數(shù)據(jù),我們對這些方法和對應(yīng)的數(shù)據(jù)問題的概述將是不完整的。盡管這些數(shù)據(jù)是不難獲取的,但對此我們?nèi)匀恍枰?jǐn)慎對待,因為財務(wù)表現(xiàn)與零售商的商業(yè)模型機密相關(guān),并且事實上我們無法隔離其他環(huán)境因素如市場增長或者競爭對手的行動對優(yōu)化問題的影響。
除此之外,這些數(shù)字可能因很多因素而有很大的差異,所以本文中我們的目標(biāo)只是提供一些基準(zhǔn),使得讀者可以對優(yōu)化的潛在幅度有所了解。以下列表收集了一些關(guān)于這些優(yōu)化方法對財務(wù)影響的實例:
響應(yīng)模型廣泛用于整個營銷過程,從零售到推廣活動 [EP13]。經(jīng)常有報道稱,與隨機投放相比,響應(yīng)模型可以將推廣活動的收益率提高 20-30%,而提升模型可以帶來 15% 左右的實質(zhì)性提升或在其他方法都不起作用的困難的情況下實現(xiàn)盈利 [PS08]。
在 RueLaLa 的實踐中對 [JH14] 中提出的營銷活動優(yōu)化進行了全面評估,得出的一般結(jié)論是,綜合優(yōu)化模型比之前使用的啟發(fā)式算法能提高約 10% 的收入。 [CA12] 中提出的并經(jīng) Zara 驗證過的事件優(yōu)化模型聲稱可提供 5.8% 的收入增長。
類目管理框架已在 Albert Heijn 進行了驗證,以優(yōu)化 37 個商店中 25 個子類別的分類。發(fā)現(xiàn)在這 25×37 = 1295 個情況中,使用傳統(tǒng)方法有 701 個不理想,在使用了新的類目管理方法進行優(yōu)化后可以提高約 6.2% 的毛利率。
最后,值得注意的是,大多數(shù)這里討論的優(yōu)化方法不會顯著的影響零售商的成本,因此收入的提升大概率的直接帶來凈利潤的提升。
結(jié)論
在前面的章節(jié)中我們概述了一些零售相關(guān)的計量經(jīng)濟學(xué)問題,給出了其應(yīng)用和用例,并且闡述了可以應(yīng)用到這些問題上的數(shù)據(jù)分析方法和優(yōu)化模型。在最后的一節(jié)中,我們將把上述這些模型聯(lián)系起來以提供一個全景式的總結(jié)。
1.由點到面
本文的主要目的是描繪完全依賴于數(shù)據(jù)挖掘和數(shù)值優(yōu)化的決策自動化框架。因此,將這個框架可視化為一個消費數(shù)據(jù)并產(chǎn)生可執(zhí)行動作和決策的管道是合理的。
首先,我們可以將數(shù)據(jù)探索和知識發(fā)現(xiàn)流程放入一個單獨的層級中,該層級主要使用無監(jiān)督學(xué)習(xí)算法,并且主要依靠人為因素來評估數(shù)據(jù)挖掘結(jié)果,例如客戶群或者是購買產(chǎn)品的頻繁項集。
雖然這些過程在實踐中非常重要,但它們很難集成到自動優(yōu)化過程中來,因為模式的發(fā)掘通常依賴于手工流程而且通常相比于增量式優(yōu)化它對戰(zhàn)略決策更有用。不過這一層的輸出可以配置到下游的過程中,例如,新發(fā)現(xiàn)的客戶群可用于定義新的傾向模型或引入并優(yōu)化專屬折扣。
接下來的兩層分別與建模和優(yōu)化有關(guān)。廣義而言,建模層的基本目標(biāo)是提供一個全面的消費者模型,定量描述他或她的價格敏感性,對活動和折扣的響應(yīng)傾向,用一種產(chǎn)品替代另一種產(chǎn)品的意愿,對推薦的接受度,等等。
但是在實踐中建立這樣一個全面的模型是非常困難的,所以我們使用多種專用模型來處理不同的問題。然而,需要指出的是,這種想象中的消費者模型涉及到所有類型的優(yōu)化問題,因此獲取有關(guān)客戶行為各個方面的全面數(shù)據(jù)至關(guān)重要。
優(yōu)化層的主要挑戰(zhàn)是多目標(biāo)的聯(lián)合優(yōu)化。聯(lián)合優(yōu)化對計算來說是一個嚴(yán)重的挑戰(zhàn),而且最重要的是聯(lián)合優(yōu)化受到底層預(yù)測模型能力的限制,所以幾乎所有的優(yōu)化技術(shù)都只能處理一個或兩個目標(biāo)。
我們把這些層都放到下圖中。組件之間存在許多可能的依賴關(guān)系和相互作用,因此我們僅展示了一個與響應(yīng)建模相關(guān)的樣例程流,以免圖變得過于混亂。
2.定價的重要性
在這些不同的問題和目標(biāo)中,我們需要非常重視定價決策以及所有于定價有著直接或間接關(guān)系的的優(yōu)化問題。讓我們用一個經(jīng)典例子來說明定價決策的重要性。會議一下企業(yè)利潤的基本公式:
G = Q · (P – V)- C
其中 Q 是銷售量,P 是價格,V 是可變成本,而 C 表示固定成本。假設(shè)一個服裝零售商每月以 40 美元的單價銷售 10 萬件服裝,假設(shè)每件服裝的批發(fā)價是 25 美元而固定成本為一個月 50 萬美元。我們可以計算銷售量、價格、可變成本和固定成本在變化百分之一的情況下是如何影響利潤的:
在這個例子中,我們可以看到定價對利潤的影響比其他變量大得多。盡管這是一個過于簡單和任意的例子,這一模式在眾多不同行業(yè)的不同企業(yè)中存在。這使我們得到如下結(jié)論:零售商應(yīng)特別關(guān)注與定價(折扣、個性化價格、動態(tài)定價等)有關(guān)的優(yōu)化方法以及支持這些方法的數(shù)據(jù)挖掘流程。
我們也注意到全渠道零售可以給自動定價優(yōu)化帶來新的機會。既然價格差異是最有力的定價技術(shù)之一,則定價優(yōu)化的理想環(huán)境是為每一個客戶提供顯示或隱式(折扣)的個性化價格,而且所有的價格是可以動態(tài)調(diào)整的。數(shù)字渠道恰好提供了這些條件,其中每個客戶都有自己獨立和動態(tài)的對零售商的視圖。
3.隱含維度的重要性
如我們已經(jīng)提到的,許多零售業(yè)中的優(yōu)化問題與用戶的行為模型是內(nèi)在相關(guān)的。在個人客戶層面建立這種模型的能力是數(shù)據(jù)挖掘技術(shù)帶來的最重要的好處之一,也是一對一營銷的關(guān)鍵推動力。
客戶建模的最復(fù)雜的例子可以在推薦系統(tǒng)中找到,這些系統(tǒng)通常使用隱式維度的概念來捕捉客戶和產(chǎn)品的心理特征。這一概念非常的重要,它可能遠(yuǎn)遠(yuǎn)超出推薦系統(tǒng)的范圍,但據(jù)我們所知,它并沒有如期望的那樣在其他應(yīng)用中被廣泛應(yīng)用。
這使我們得出這樣一個結(jié)論,即整體的優(yōu)化系統(tǒng)可以將推薦領(lǐng)域的最先進的技術(shù)應(yīng)用到那些不常見的應(yīng)用中而受益。
4.展望
在零售業(yè)中實現(xiàn)完全的自動化決策是極具雄心的,甚至可以說,在實踐中想要衡量這些優(yōu)化方法的表現(xiàn)幾乎是不可能的,因為觀察到的收益提升可能與市場趨勢,競爭對手的行動,顧客品味的變化以及其他因素相關(guān)。
這個問題在經(jīng)濟學(xué)教科書中被稱為內(nèi)生性問題,這對于數(shù)據(jù)驅(qū)動優(yōu)化技術(shù)的研發(fā)者和用戶來說都是一個巨大的挑戰(zhàn),而且即使看起來成功的案例也會受到該問題的挑戰(zhàn)而顯得其結(jié)果沒那么可靠。
盡管如此,在過去的十年中,主要的零售商一直在尋求將數(shù)據(jù)挖掘與數(shù)值優(yōu)化技術(shù)結(jié)合在一起的技術(shù)的整體解決方案。這種先進的系統(tǒng)將是企業(yè)數(shù)據(jù)管理演進的下一個階段,它將遵循對數(shù)據(jù)倉庫的共識并大量采用數(shù)據(jù)學(xué)科學(xué)方法。
— 全文終 —
相關(guān)閱讀:
《超詳解析零售業(yè)中的那些數(shù)據(jù)挖掘問題》
作者:Ilya Katsov
原文鏈接:https://highlyscalable.wordpress.com/2015/03/10/data-mining-problems-in-retail/
譯者:張夏天,公眾號:TalkingData(ID:Talkingdata)
TalkingData誠邀優(yōu)秀人才加入,感興趣同學(xué)請將簡歷投遞至 TalkingData 首席數(shù)據(jù)科學(xué)家張夏天郵箱:xiatian.zhang@tendcloud.com
本文由 @TalkingData 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 Pexels,基于 CC0 協(xié)議
- 目前還沒評論,等你發(fā)揮!