评价方法有哪几种(简单多指标综合评价三大方法)

评价方法。本文介绍了多指标评价的几类方法:离差标准化、z-score标准化、非线性标准化。多指标评价常用于需要对一些对象进行比较的场景,在保有明确目的的情况下,通过多个维度的表现数据,赋予不同权重进行综合评判,最终形成排序。首先涉及到的就是这些数据的归一化(normalization),或者说标准化

评价方法。本文介绍了多指标评价的几类方法:离差标准化、z-score标准化、非线性标准化。

多指标评价常用于需要对一些对象进行比较的场景,在保有明确目的的情况下,通过多个维度的表现数据,赋予不同权重进行综合评判,最终形成排序。

首先涉及到的就是这些数据的归一化(normalization),或者说标准化,本质上就是去量纲,把量纲理解成计量单位也OK。这一步的重要性在于,多维度的评判,收集到的多方面数据,横向来看没有强耦合性,性质不同,量纲&数量级则大概率不同,直接用原始数值分析,那你得在不同维度的最终权重赋予上下大功夫,而且也不是很好解释。

纵向来看,同一维度下不同对象的值极端情况下可能差异巨大,归一化可以减弱这类影响。总之,去量纲转化为纯数值后,会更方便得进行不同对象之间的差距评估。

以下是几类方法简介:

一、离差标准化

名字很多,也叫线性标准化,最值归一化,min-max法,都是一个意思,即 处理后X = (处理前X – 最小值)/(最大值 – 最小值),这里的最大最小值,指的是同一维度下不同对象的值的集合中的最值。这样的处理可以把这个集合中的所有数值根据大小差距,映射入[0,1]区间内,也有的处理是最小值默认0,那就是看集合中的值和最大值的比例关系。

举两个实际例子:

①现在想给a,b,c三个商家打分,0~10分,有两个维度的数据,各占比40%和60%,这就意味着在维度一上满分是4分。

每个维度下最大值得分最高,其余数值按照与最大值的比例得分,最终把两个维度的分数相加,即为总分,如下表。需要注意的是,并不是所有的维度下,最大值都是最高分,存在值越高分越低的情况,比如差评,针对这种情况在数值处理上要取其倒数。

②现在要给一个用户推荐一些餐馆,它们的Rank如果除了以往的评价,装潢等,我还要考虑餐馆和用户的距离,或者餐馆和用户搜索的POI的距离。此时,得分y = 1-(x-min)/(max-min),x = 用户或者POI与餐馆的距离,min = 用户或POI与该城市内餐馆的最小距离,max = 用户或POI与该城市内餐馆的最大距离。空搜或关键字搜索,不同场景。

二、z-score标准化

也叫z标准化,标准差标准化,均值方差归一化。适用于数量较多,没有明显边界的数据,而且最好满足高斯分布。公式是处理后X = (处理前X – 均值)/ 标准差。这里的均值和标准差都是指同一维度下不同对象的值的集合的均值和标准差。通过这样,就可以把一种分布的数据变换为标准正态分布,均值为0,标准差为1,处理后的数值,符号为正就是超出平均水平,符号为负就是低于平均水平,很清楚。

处理前:

处理后:

同样需要注意的是,如果有的值是越低越好,那么,最终正负号需要做一个相反处理。

三、非线性标准化

这个方法很适合处理极值,要用到这个,就需要看你有没有一个需求,比如,我还是要给用户推荐一批餐馆,排序要去考虑UGC,就是用户评价的数量,但是我研究了一下我所有的餐馆,发现大部分餐馆的评价数都在100~300之间,有一些是1000+,就也不多,但是对于用户来说,评论数无非是一个评价可信的佐证,一个踩坑的概率剪枝,300多条勉强足够了,所以尽管有些餐馆的评论数特别多,它在这一项上的得分也不应该是正常水平的几倍,于是你就需要一个非线性的评价曲线,让评论数超过了一定阈值之后,增长相同的评论数,得分增长越来越低。这里一般会取用y=a*log10(x)+b的形式,通过调整a与b来根据数据调整曲线。

标准化处理时也要考虑数据可能存在的问题,比如由于维度拆分过细,样本量较少,数据异常,可能会导致在单项上某个对象没有数值,针对此类情况,是否考虑在单次评价中将该项上的权重按比例转移?还是有一个兜底分数?等等。

不同的标准化方式其实适用于不同的业务要求(数据精准,颗粒度等),在多指标评价中你最终可能还会觉得权重的设置起了更重要的作用,但是说到底还是2部分:数据+算式(处理)。清楚你要评估的对象的哪些方面,清楚地定义口径,是评价体系的客观性的重要体现。

其实很明显,多指标的评价是一个描述不同对象的差距程度的,可以理解是描绘竞争关系的,是相对的,横向的,就比如在自媒体的后台中,平台给的分数的绝对值并不能完全代表你的水平浮动,但是努力提高创作水平,争取提高你的分数,一定是有用的,因为你改变了竞争关系~

本文由 @寒鸦jackdow 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

声明:该文观点仅代表作者本人,《家在公租房生活网》系信息发布平台,家在公租房生活网仅提供信息存储空间服务。
(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫

相关推荐

  • 星尚湾二手房价(这几个小区,6年不涨#上海不涨)

    星尚湾二手房价。上海这几个小区6年不涨。6年不涨价,青浦华新恒文星尚湾。2017年3月恒文星尚湾,毛坯单价4.2万。但现在装修好的二手房都卖不到4.2万。业主真是欲哭无泪。这种没地铁没规划的地方最好远离普陀中鹰黑森林,中鹰黑森林卖了很多年,2017年时已经卖到12万单价。现在新房还在卖,单价依旧是1

    百科 2023年7月16日
    00
  • 小米笔记本bios如何恢复出厂设置

    大家好,今天小编关注到一个比较有意思的话题,就是关于笔记本电脑重置键的问题,于是小编就整理了3个相关介绍笔记本电脑重置键的解答,让我们一起看看吧。1、如何重置笔记本?2、小米笔记本bios如何恢复出厂设置?3、笔记本电脑怎样恢复初始设置?如何重置笔记本?1. 在关机状态下按下电脑上一键还原按键。如果

    2024年3月5日
    00
  • 容易成为毒妇的三大星座女(最毒的女人)

    容易成为毒妇的三大星座女,人们常说:“蛇的嘴是绿色的,黄蜂的尾巴在针的后面。两个都不毒,最毒的是女人的心。”那么,女人真的天生就这么恶毒吗?答案是否定的,那只是因为有些女性受刺激后思维变得偏激,内心变得复杂,外人很难猜测。所以这很可怕。那么,十二星座中哪一个会受到刺激而中毒呢?接下来,我们来看看!

    2024年2月7日
    00
  • 沂南地图(中国行政区划——山东省临沂市)

    沂南地图。山东省临沂市临沂市下辖3个市辖区、9个县,共计12个县级行政区。临沂地处中国华东地区、山东东南部、黄海西岸,长三角经济圈与环渤海经济圈结合点、东陇海国家级重点开发区域和鲁南临港产业带。总面积17191.2平方千米,建成区面积231.0平方千米,常住人口1062.4万人,城镇人口547.56

    2023年9月30日
    00
  • 上海莱士股票可以长期持有吗(上海莱士 | 杀出一条血路)

    上海莱士股票可以长期持有吗?作者 | 格隆汇 熊大数据支持 | 勾股大数据在开始介绍上海莱士前,我们先回顾下血制品的起源。20世纪40年代,人类历史上规模空前的一场全球性战争正在进行,为了抢救战场上的伤员,哈佛医学院的E.J.Cohn教授和他的同事们发明了一种”低温乙醇法”的工艺从血液中提取人血清白

    2023年8月30日
    00
  • dellsoga是什么

    大家好,今天小编关注到一个比较有意思的话题,就是关于戴尔平板电脑品牌介绍的问题,于是小编就整理了5个相关介绍戴尔平板电脑品牌介绍的解答,让我们一起看看吧。1、Dell是什么牌子的电脑?2、dellsoga是什么?3、inspiron是什么档次的电脑?4、DELL是什么品牌?5、DELL是什么牌子电脑

    2024年2月28日
    00

发表回复

登录后才能评论
关注微信

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:296358331@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息