簡(jiǎn)單多指標(biāo)綜合評(píng)價(jià)三大方法

2 評(píng)論 14459 瀏覽 27 收藏 8 分鐘

本文介紹了多指標(biāo)評(píng)價(jià)的幾類(lèi)方法:離差標(biāo)準(zhǔn)化、z-score標(biāo)準(zhǔn)化、非線性標(biāo)準(zhǔn)化。

多指標(biāo)評(píng)價(jià)常用于需要對(duì)一些對(duì)象進(jìn)行比較的場(chǎng)景,在保有明確目的的情況下,通過(guò)多個(gè)維度的表現(xiàn)數(shù)據(jù),賦予不同權(quán)重進(jìn)行綜合評(píng)判,最終形成排序。

首先涉及到的就是這些數(shù)據(jù)的歸一化(normalization),或者說(shuō)標(biāo)準(zhǔn)化,本質(zhì)上就是去量綱,把量綱理解成計(jì)量單位也OK。這一步的重要性在于,多維度的評(píng)判,收集到的多方面數(shù)據(jù),橫向來(lái)看沒(méi)有強(qiáng)耦合性,性質(zhì)不同,量綱&數(shù)量級(jí)則大概率不同,直接用原始數(shù)值分析,那你得在不同維度的最終權(quán)重賦予上下大功夫,而且也不是很好解釋。

縱向來(lái)看,同一維度下不同對(duì)象的值極端情況下可能差異巨大,歸一化可以減弱這類(lèi)影響??傊チ烤V轉(zhuǎn)化為純數(shù)值后,會(huì)更方便得進(jìn)行不同對(duì)象之間的差距評(píng)估。

以下是幾類(lèi)方法簡(jiǎn)介:

一、離差標(biāo)準(zhǔn)化

名字很多,也叫線性標(biāo)準(zhǔn)化,最值歸一化,min-max法,都是一個(gè)意思,即?處理后X = (處理前X – 最小值)/(最大值 – 最小值),這里的最大最小值,指的是同一維度下不同對(duì)象的值的集合中的最值。這樣的處理可以把這個(gè)集合中的所有數(shù)值根據(jù)大小差距,映射入[0,1]區(qū)間內(nèi),也有的處理是最小值默認(rèn)0,那就是看集合中的值和最大值的比例關(guān)系。

舉兩個(gè)實(shí)際例子:

①現(xiàn)在想給a,b,c三個(gè)商家打分,0~10分,有兩個(gè)維度的數(shù)據(jù),各占比40%和60%,這就意味著在維度一上滿分是4分。

每個(gè)維度下最大值得分最高,其余數(shù)值按照與最大值的比例得分,最終把兩個(gè)維度的分?jǐn)?shù)相加,即為總分,如下表。需要注意的是,并不是所有的維度下,最大值都是最高分,存在值越高分越低的情況,比如差評(píng),針對(duì)這種情況在數(shù)值處理上要取其倒數(shù)。

②現(xiàn)在要給一個(gè)用戶(hù)推薦一些餐館,它們的Rank如果除了以往的評(píng)價(jià),裝潢等,我還要考慮餐館和用戶(hù)的距離,或者餐館和用戶(hù)搜索的POI的距離。此時(shí),得分y = 1-(x-min)/(max-min),x = 用戶(hù)或者POI與餐館的距離,min = 用戶(hù)或POI與該城市內(nèi)餐館的最小距離,max = 用戶(hù)或POI與該城市內(nèi)餐館的最大距離。空搜或關(guān)鍵字搜索,不同場(chǎng)景。

二、z-score標(biāo)準(zhǔn)化

也叫z標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化,均值方差歸一化。適用于數(shù)量較多,沒(méi)有明顯邊界的數(shù)據(jù),而且最好滿足高斯分布。公式是處理后X = (處理前X – 均值)/ 標(biāo)準(zhǔn)差。這里的均值和標(biāo)準(zhǔn)差都是指同一維度下不同對(duì)象的值的集合的均值和標(biāo)準(zhǔn)差。通過(guò)這樣,就可以把一種分布的數(shù)據(jù)變換為標(biāo)準(zhǔn)正態(tài)分布,均值為0,標(biāo)準(zhǔn)差為1,處理后的數(shù)值,符號(hào)為正就是超出平均水平,符號(hào)為負(fù)就是低于平均水平,很清楚。

處理前:

處理后:

同樣需要注意的是,如果有的值是越低越好,那么,最終正負(fù)號(hào)需要做一個(gè)相反處理。

三、非線性標(biāo)準(zhǔn)化

這個(gè)方法很適合處理極值,要用到這個(gè),就需要看你有沒(méi)有一個(gè)需求,比如,我還是要給用戶(hù)推薦一批餐館,排序要去考慮UGC,就是用戶(hù)評(píng)價(jià)的數(shù)量,但是我研究了一下我所有的餐館,發(fā)現(xiàn)大部分餐館的評(píng)價(jià)數(shù)都在100~300之間,有一些是1000+,就也不多,但是對(duì)于用戶(hù)來(lái)說(shuō),評(píng)論數(shù)無(wú)非是一個(gè)評(píng)價(jià)可信的佐證,一個(gè)踩坑的概率剪枝,300多條勉強(qiáng)足夠了,所以盡管有些餐館的評(píng)論數(shù)特別多,它在這一項(xiàng)上的得分也不應(yīng)該是正常水平的幾倍,于是你就需要一個(gè)非線性的評(píng)價(jià)曲線,讓評(píng)論數(shù)超過(guò)了一定閾值之后,增長(zhǎng)相同的評(píng)論數(shù),得分增長(zhǎng)越來(lái)越低。這里一般會(huì)取用y=a*log10(x)+b的形式,通過(guò)調(diào)整a與b來(lái)根據(jù)數(shù)據(jù)調(diào)整曲線。

標(biāo)準(zhǔn)化處理時(shí)也要考慮數(shù)據(jù)可能存在的問(wèn)題,比如由于維度拆分過(guò)細(xì),樣本量較少,數(shù)據(jù)異常,可能會(huì)導(dǎo)致在單項(xiàng)上某個(gè)對(duì)象沒(méi)有數(shù)值,針對(duì)此類(lèi)情況,是否考慮在單次評(píng)價(jià)中將該項(xiàng)上的權(quán)重按比例轉(zhuǎn)移?還是有一個(gè)兜底分?jǐn)?shù)?等等。

不同的標(biāo)準(zhǔn)化方式其實(shí)適用于不同的業(yè)務(wù)要求(數(shù)據(jù)精準(zhǔn),顆粒度等),在多指標(biāo)評(píng)價(jià)中你最終可能還會(huì)覺(jué)得權(quán)重的設(shè)置起了更重要的作用,但是說(shuō)到底還是2部分:數(shù)據(jù)+算式(處理)。清楚你要評(píng)估的對(duì)象的哪些方面,清楚地定義口徑,是評(píng)價(jià)體系的客觀性的重要體現(xiàn)。

其實(shí)很明顯,多指標(biāo)的評(píng)價(jià)是一個(gè)描述不同對(duì)象的差距程度的,可以理解是描繪競(jìng)爭(zhēng)關(guān)系的,是相對(duì)的,橫向的,就比如在自媒體的后臺(tái)中,平臺(tái)給的分?jǐn)?shù)的絕對(duì)值并不能完全代表你的水平浮動(dòng),但是努力提高創(chuàng)作水平,爭(zhēng)取提高你的分?jǐn)?shù),一定是有用的,因?yàn)槟愀淖兞烁?jìng)爭(zhēng)關(guān)系~

 

本文由 @寒鴉jackdow 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 非常受用。就如文中所說(shuō),最后還是權(quán)重設(shè)置更重要,可惜文章沒(méi)有講到綜合了所有歸一化指標(biāo)以后如何做整體評(píng)價(jià)

    來(lái)自北京 回復(fù)
  2. 沒(méi)有完全看懂 ??

    來(lái)自浙江 回復(fù)