電商商品搜索權(quán)重模型
編輯導(dǎo)語:我們在網(wǎng)上搜索商品時,它會根據(jù)季節(jié)、銷量等一些數(shù)據(jù)進行排列;比如我們在夏天的時候搜索長袖,只會出現(xiàn)比較薄款的類型,厚重的長袖都在后面;本文作者對電商商品搜索權(quán)重模型進行分析,我們一起來看一下。
商品搜索權(quán)重設(shè)計做為各大電商的商業(yè)機密,網(wǎng)上很少有資料涉及這方面的知識;之前因為項目需要,自己整理過一些權(quán)重設(shè)計資料,這里和大家分享一個簡單的權(quán)重計算模型,有興趣的朋友可以自己再根據(jù)需求進行優(yōu)化。
一、權(quán)重概念
權(quán)重是反應(yīng)參數(shù)指標在整體評價系統(tǒng)中的重要程度,權(quán)重越高,表明該指標越重要。
舉個列子,一個學(xué)校招生考試,共三個科目:語文(100分)、數(shù)學(xué)(100分)、英語(100分),最終根據(jù)語文30%,數(shù)學(xué)40%,英語30%的比例進行累計得一個總得分,得分高者優(yōu)先錄取。
其中的百分比就是各科的權(quán)重,數(shù)學(xué)占比40%,則說明學(xué)校對學(xué)生的數(shù)學(xué)更加重視。
權(quán)重的計算方法有很多中,如:加權(quán)計算法、加權(quán)平均數(shù)法、AHP層次法、優(yōu)序圖法等等,今天我們通過最簡單的加權(quán)計算法來實現(xiàn)一個商品的權(quán)重模型,對其它權(quán)重算法感興趣的朋友可以自己搜索學(xué)習(xí)。
二、加權(quán)法
什么是加權(quán)法呢?
還是上面的例子,如果有個考生的成績?nèi)缦拢赫Z文(85)、數(shù)學(xué)(90)、英語(80),那么他的加權(quán)計算過程為:85*30% + 90*40% + 80*30% = 85.5——就是簡單的【成績 * 比例】 再累加的過程。
把上面的科目映射到商品中,則有如下關(guān)系:
- 科目 = 商品屬性
- 分值 = 屬性分值
- 成績 = 屬性得分
- 占比 = 屬性的權(quán)
這都是什么意思呢?下面我們來一一說明。
1. 確定權(quán)重指標【科目=商品屬性】
權(quán)重指標這個比較好理解,前面我們講的標題、品類、品牌等等都屬于商品屬性。
需要注意的是在權(quán)重模型中,并不是商品的所有屬性都會參與權(quán)重計算的,影響用戶搜索習(xí)慣、以及銷量的屬性才會參與計算。
如:品牌、價格、總銷量、月銷量、瀏覽量、收藏量、商品評分等;對于不同的品類,部分特有屬性也會參與計算,如:服飾品類的材質(zhì)、適應(yīng)季節(jié)等,手機品類的內(nèi)存大小、存儲大小等。
2. 定義指標滿分值【分值=屬性分值】
指標滿分值就好比給科目定義的滿分值一樣,只有設(shè)置了上限,數(shù)據(jù)才有對比性,我們才能判斷出一個具體的分值所代表的好壞程度。
在商品屬性中,部分屬性在系統(tǒng)設(shè)計之初就已經(jīng)有分值的定義,如評分,通常都設(shè)置為10分制或者5顆星的記分方式。
但是在這里依然需要給他們再重新定義一套權(quán)重中的滿分值,而不能使用原始的10分制或5顆星來計算,因為后面涉及到了自定義權(quán)重的高低,需要動態(tài)進行調(diào)整。
還有一個需要注意的地方,滿分值的定義需要根據(jù)屬性值的多少來作為依據(jù);如平臺有500個獨立的品牌,那么品牌的滿分值就不應(yīng)該定義為100,而是1000;否則就會出現(xiàn)扎堆現(xiàn)象,某個分值會出現(xiàn)多個品牌的情況,應(yīng)該盡量避免這種情況發(fā)生。
3. 劃分指標分值【成績=屬性得分】
對于科目來說,卷面分已經(jīng)規(guī)定好了,具體能考出多少成績,這個就得看各位同學(xué)自己的發(fā)揮了。
商品也一樣,屬性的滿分定義好后,某個具體屬性能得多少分值就需要根據(jù)統(tǒng)計數(shù)據(jù)和評分標準進行打分。
首先需要定制評分標準,標準的規(guī)定有兩種方式:
- 人工經(jīng)驗定義:根據(jù)后臺的銷售數(shù)據(jù)人為的決定分值,搜索比較多的,銷售量高的可以得分高點,反之亦然;如手機品類中的品牌,通常比較火熱的就是華為、蘋果、小米,其次vivo、oppo、三星等等,人為的依次可以為它們設(shè)置得分值:華為(500)、蘋果(450)、小米(400)、vivo(380)、oppo(350)、三星(320)。
- 有明確數(shù)據(jù)參考:根據(jù)系統(tǒng)反饋的統(tǒng)計數(shù)據(jù),通過計算獲得分值;如月銷量,默認滿分定義為1000分,如果月銷量超過5000單,則得1000分,未超過的根據(jù)比例計算動態(tài)獲得的分值。
4. 確定指標的權(quán)【占比 = 屬性權(quán)】
與各科的占比一樣,權(quán)重模型需要為每個參與計算的屬性設(shè)置相應(yīng)的權(quán),這里之所以沒有叫占比,是因為通常我們理解的占比是以百分制來計算的,所有參與因素占比最終加起來需要等于百分百。
但是商品模型參數(shù)屬性比較多,采用百分制會試最終的權(quán)重值很聚集,搜索效果并不好。
所以通常采用權(quán)的設(shè)計方法。什么是權(quán)呢?
舉個實例,如:數(shù)字8692 = 8* 1000 + 6*100 + 9*10 + 2*1,其中千分位的權(quán)是1000,百分位的權(quán)是100,十分位的權(quán)是10,個位的權(quán)是1。
我們采用類似的方式給參與權(quán)重的商品屬性定義權(quán),如比較重要的屬性:品牌(100000)、價格(100000)、總銷量(10000)、月銷量(10000);重要的屬性:瀏覽量(1000)、收藏量(1000);一般的屬性:庫存(10)、材質(zhì)(10);其中不同的屬性是可以定義相同權(quán)的。
理解了以上幾點,權(quán)重模型的基本框架就設(shè)計好了,最終權(quán)重值通過累加分值乘以權(quán)就可以得到。
三、優(yōu)化
1. 品類影響
在上述的權(quán)重模型中,受品類的影響比較嚴重。
比如小米品牌下有多款不同品類的商品,假如有手機和電視兩個品類,大家對他的手機認可度比較高,所以手機品類下品牌的得分和權(quán)相對就會設(shè)置的比較高一些;而電視是剛進入市場,大家對他的接受度與老牌廠商比就略顯遜色,所以電視品類下品牌的得分和權(quán)就應(yīng)該設(shè)置的低一些。
再有一個原因就是如果有品類的特殊屬性要參與權(quán)重,不同品類的特殊屬性是不同的。所以在維護權(quán)重模型的基本配置時,應(yīng)該是以品類為單位去維護,這樣才能做到個性化的權(quán)重設(shè)計。
2. 人工干預(yù)
上面通過設(shè)置好權(quán)重配置后,內(nèi)部都是通過代碼邏輯計算獲得的權(quán)重值。
但是如果平臺需要推廣新品,由于新品沒有銷售數(shù)據(jù),所以它的排名默認肯定都靠后;這時就需要設(shè)計一個維護入口,通過人工單獨為商品增加權(quán)重數(shù)值,將新品排名提到前面已達到推廣目的。
3. 外界因素影響
對于部分商品的個別屬性,它的權(quán)重值會受一些外部因素的影響。
如服飾和鞋類,它們材質(zhì)屬性受季節(jié)的影響;如材質(zhì)分別為棉絨和滌綸的登山鞋,夏天搜索【登山鞋】這個關(guān)鍵字時,滌綸材質(zhì)的應(yīng)該被排在前面,棉絨材質(zhì)的應(yīng)該被排在后面;冬天搜索【登山鞋】時,棉絨材質(zhì)的應(yīng)該在前,滌綸材質(zhì)的應(yīng)該在后,這個在做計算時應(yīng)該是有依賴條件的。
以上就是加權(quán)權(quán)重模型的設(shè)計方案,希望對你有幫助。
這里再多說一下,為了能夠保證商品權(quán)重的及時性,生產(chǎn)環(huán)境下通常每天晚上都會對商品重新做權(quán)重值計算。
最后給出一個商品的模擬示例,有需要的同學(xué)根據(jù)自己的場景優(yōu)化一下。
作者:JackLiu;個人微信公眾號: 揚帆去遠航(ID:Jackai_liu)
本文由 @Jack 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
作者:Jack;個人微信公眾號: 揚帆去遠航(ID:Jackai_liu)
本文由 @Jack 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
價格權(quán)重下,滿分值為1000,評分標準中1000元以下的是怎么得到7000分的,這個數(shù)據(jù)是錯的吧
很有幫助,什么規(guī)模的電商平臺會用到這么精細的搜索,如果我不過幾千個SKU,該怎么設(shè)計搜索?
大佬你微信多少,能求教一下權(quán)重的這塊么
權(quán)重有的是百分制 有的千分制 有的十分制 有的5分制 如何選擇使用哪一種呢?這點請詳細指點一下吧!多謝多謝
我想請教一下,品牌的屬性得分的設(shè)置是針對關(guān)鍵詞還是全局的?
作者能再仔細講講價格這塊是如何處理的嗎?比如:淘寶的價格帶,非常感謝,方便的話,可以加我下微信::LixueStudy,這廂有禮了!哈哈
產(chǎn)品一枚。正在做電商搜索,就看到了樓主的文章,讓小白的我對搜索有了一些初步了解,喜不自勝,哈哈。
這個東西看下來對店鋪有啥幫助嗎?影響最大的是品牌和價格,品牌你沒得選,價格你也沒得選,所以你知道這個東西有啥用呢?
理論上來說你知道一套模型,可以幫助你解決一些問題,但如果是這個模型,你沒辦法解決任何問題!就算你把收藏、評分、服務(wù)優(yōu)化到極致,從權(quán)重的增幅來看對你的幫助微乎其微!
對你沒用,對其他人有用
作者寫的是普適性底部邏輯,理論知識肯定需要根據(jù)現(xiàn)實進行調(diào)整再用噻
找出一篇,讓LZ看看
求繼續(xù)更新
大神咨詢下,如果維度里面加上標簽,但是每個商品涉及多個標簽,計算的時候又不能把所有的標簽的屬性得分加起來,這樣很影響權(quán)重,能不能幫忙解答下有啥方法呢
1
第四點的權(quán)的概念和第二點分值的概念有點混淆,沒理解。根據(jù)考生成績的例子,考生=商品,考生的排名即商品的排名,考生排名的計算通過各科成績(商品屬性的得分)*權(quán)重(即百分比)。但是第四點權(quán)的概念又不是通過百分比表達,這里沒理解
作者在文中2-4里有標識:【占比 = 屬性權(quán)】,本質(zhì)是一樣的。
受益!
學(xué)到了,謝謝
感謝
優(yōu)秀
謝謝分享
很受益!