電商運(yùn)營(yíng)之站內(nèi)搜索全面指南(二)

5 評(píng)論 8856 瀏覽 62 收藏 9 分鐘

筆者在上一個(gè)章節(jié)中,給大家初步的講解了一下,站內(nèi)搜索的前端和后端人工干預(yù)的一些邏輯與頁(yè)面呈現(xiàn)。那么,接下來(lái)就順著這條敘事主干,帶領(lǐng)大家更加深入地了解一下:站內(nèi)搜索接下來(lái)需要明白的雜七雜八和主干。

?站內(nèi)搜索邏輯的基本組成:怎么被搜到以及怎么排序靠前?

怎么描述呢?

對(duì)商家而言,商品怎么才能被搜索到解決的是有無(wú)問(wèn)題,而怎么排序靠前被消費(fèi)者看到解決的是溫飽問(wèn)題。透過(guò)這兩個(gè)問(wèn)題我們來(lái)好好聊一聊搜索的兩大要素:索引和排序。

索引

搜索其實(shí)是依靠爬蟲(chóng)來(lái)提取信息的。

什么是爬蟲(chóng)?說(shuō)的簡(jiǎn)單點(diǎn)就像是幫你搬運(yùn)信息到倉(cāng)庫(kù)的小哥,爬蟲(chóng)只負(fù)責(zé)幫你收集信息,且會(huì)給你存放在倉(cāng)庫(kù)里,分門別類安排的整整齊齊。然后,你這個(gè)老板只需要查看這些信息就好了。

那么,相比互聯(lián)網(wǎng)的廣域搜索比如百度 和谷歌。電商網(wǎng)站的搜索就顯得簡(jiǎn)單和閉塞多了,所有的商品都存在一個(gè)庫(kù)里,你的爬蟲(chóng)甚至都不需要每天無(wú)時(shí)不刻的勞作,只需要每天跑一次就夠了。所以,一個(gè)商品能否被搜索抓取到是能否展現(xiàn)給用戶的必要條件。

索引指的就是:被爬蟲(chóng)抓取到并整理好的商品庫(kù)。

索引分為全量索引增量索引兩部分。

全量索引為全站商品的一次更新,所有的商品變化包括上下架,名稱屬性標(biāo)簽庫(kù)存信息等的變化通過(guò)全量索引進(jìn)行更新;增量索引為實(shí)時(shí)更新(也不一定是實(shí)時(shí)更新,可能是按照整點(diǎn)規(guī)則進(jìn)行更新)更新的內(nèi)容主要是商品的部分屬性。

下圖是我一同事為了宣講做的ppt? 不是本人原創(chuàng),直接截圖復(fù)用了。

那么商品的哪些信息會(huì)被納入索引呢?

——商品名稱、銷售地區(qū)、庫(kù)存量、商品屬性(尺碼顏色款式等)、商品掛靠的類目名稱、商品編號(hào)、商品的標(biāo)簽信息和價(jià)格等。

除了以上的一些固有信息外,商品的數(shù)據(jù)信息,比如:銷量、評(píng)價(jià)、曝光點(diǎn)擊等數(shù)據(jù)也會(huì)被納入索引,用來(lái)介入接下來(lái)的排序步驟,計(jì)算排序得分。我們舉個(gè)簡(jiǎn)單的例子,比如:我早上上架了一款蘋果耳機(jī)。但是,我的商品標(biāo)題和屬性里都沒(méi)有對(duì)這個(gè)款耳機(jī)的英文 AirPods的描述。

那么,用戶在搜索AirPods時(shí),是否會(huì)搜索到這款產(chǎn)品呢。顯然是無(wú)法搜索到的,因?yàn)樗阉魇轻槍?duì)文本信息的精確匹配,此時(shí)解決辦法有兩個(gè)。

  1. 是給AirPods和蘋果耳機(jī)配置同義詞。
  2. 在商品標(biāo)題屬性或者標(biāo)簽上給商品加上AirPods關(guān)鍵詞。這樣改產(chǎn)品才會(huì)被搜索到。

以上即當(dāng)商品的標(biāo)題,屬性,類目,標(biāo)簽,描述等屬于索引范圍的文本信息都不包含用戶輸入的關(guān)鍵詞以及系統(tǒng)中的同義詞時(shí),這款產(chǎn)品是無(wú)法被搜索引擎搜索到的,當(dāng)然也無(wú)法呈現(xiàn)給用戶。

那么,各位對(duì)索引的概念是否有了直觀的認(rèn)識(shí)?沒(méi)有也不要緊,我肯定不會(huì)講第二遍。

排序

能不能被搜索到的問(wèn)題解決了,接下來(lái)就是商家們最關(guān)心的問(wèn)題,就是:怎樣讓自己的商品在搜索中讓更多的用戶看到?

這個(gè)就涉及到搜索的排序算法了。每家電商的搜索排序都是按照自己的算法邏輯進(jìn)行的。排序的算法邏輯也是各有千秋和特色。排序算法應(yīng)該是站內(nèi)搜索里面各大電商的核心機(jī)密。

但是,排序的因子就不那么機(jī)密了,基本上你想得到的就這么些。只是各家在各個(gè)因子上的權(quán)重不一樣,計(jì)算方式也不一樣。

我們先來(lái)列舉一下這些因子有哪些:銷量(淘寶用成交筆數(shù))、點(diǎn)擊、收藏、加購(gòu)、好評(píng)率、商品質(zhì)量分(商品信息的完善和準(zhǔn)確程度)、用戶行為偏好(用以做千人千面?zhèn)€性化)、店鋪評(píng)分等信息。

我這里倒是有一些 排序算法的公式,但是還是算了,我看了也頭疼,大家只要知道影響排序算法因子就行,知道哪些因子起了決定性作用就ok。

下圖為我為自家公司在初期版本上的排序因子,看看能得出什么結(jié)論?現(xiàn)在很多淘寶商家削尖了腦袋想一探這個(gè)排序算法的究竟,其實(shí)大可不必,電商千千萬(wàn),搜索一條路。對(duì)于產(chǎn)品和運(yùn)營(yíng)而言,只要知道哪些是直接能夠提升銷售和轉(zhuǎn)化就夠了。

其實(shí)排序分為兩個(gè)主要的階段,一個(gè)是大范圍的排序(類目排序),一個(gè)是商品范圍的排序。

什么意思呢?首先,用戶在輸入一個(gè)關(guān)鍵詞后,大概率是一個(gè)物品詞或者品牌詞,用戶在電商網(wǎng)站使用搜索,95%的概率是要尋找想要購(gòu)買的商品。此時(shí),我們需要給到他們?cè)谶@些商品的集合。我們稱之為列表或者類目或者叫分類。

大家在電商app首頁(yè)的底部 一般會(huì)看到這個(gè)模塊,這個(gè)項(xiàng)目我將在后面的章節(jié)中給大家更加深入的講解。如下圖所示(紅框部分就是分類)):也就是說(shuō)先要定位用戶想要尋找的商品在哪個(gè)分類中。只有找到這個(gè)商品的集合類目,然后再該類目中進(jìn)行商品的排序,這才是排序的兩步走戰(zhàn)略——第一步,類目預(yù)測(cè);第二步,商品排序。

目前類目預(yù)測(cè)主要是兩種方式互為補(bǔ)充:人工和機(jī)器算法。

人工也就是我上一章中提到的人工后臺(tái)干預(yù)。機(jī)器類目預(yù)測(cè)目前主要的方式有:類目文本+商品量集群算法;貝葉斯預(yù)測(cè)算法;中心詞類目預(yù)測(cè)算法。這幾種算法各有優(yōu)劣,我將會(huì)在之后的搜索算法章節(jié)進(jìn)行詳細(xì)介紹。

好了,總結(jié)一下本章:第一步是解決有無(wú)問(wèn)題,第二步是解決溫飽問(wèn)題。要先能被搜索到才能被更多用戶看到。以上內(nèi)容不代表絕對(duì)準(zhǔn)確,有個(gè)人的觀點(diǎn)在里面,謹(jǐn)慎采納!

預(yù)告下一章內(nèi)容:

  1. 站內(nèi)搜索的物料基礎(chǔ):目錄與商品描述
  2. 站內(nèi)搜索運(yùn)營(yíng)的邏輯與數(shù)據(jù)指標(biāo)

#專欄作家#

作者:王歡,微信:wanghuan314400,運(yùn)營(yíng)小灰一枚。

本文由 @王歡 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,不得轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 索引講正排、倒排更合理一些

    來(lái)自廣東 回復(fù)
    1. 寫給小白看 估計(jì)就聽(tīng)繞了

      來(lái)自浙江 回復(fù)
  2. 可以給個(gè)排序算法的計(jì)算公式嗎?不曉得如何計(jì)算各個(gè)維度來(lái)給商品打分,還有想問(wèn)下這種排序因子及分值需要給運(yùn)營(yíng)工具人工干預(yù)嗎

    回復(fù)
  3. 商品基礎(chǔ)權(quán)重排序因子感覺(jué)較少, 有更多可以分享的排序因子嗎

    來(lái)自湖南 回復(fù)
  4. ??

    來(lái)自上海 回復(fù)