评分、评星、投票是很多网站的标配,比如淘宝的宝贝评价、知乎的赞同。有些网站甚至以这些功能为生存根基,比如大众点评、豆瓣等应用,用户的打分、评论是它们的主要功能,目的就是对不同对象进行排序,从而为有需求的用户提供决策依据。
存在问题
1.针对单一项目:
由于偏好等主观因素和专业性等客观因素导致结果失真。
以大众点评为例,吃是一件很个性化的事情,是完全基于主观感受的,这就导致结果的参考性并不强。
举个例子:
两个人同时去吃泰国菜,对于喜欢这种酸辣口味的人来说,会觉得这家餐厅很好吃,那么他在打分的时候就会偏高了打;而对于吃不惯泰式口味的人就会觉得这家店很难吃,打分的时候自然会往偏低了打。
假设在短时间内,去这家泰国餐厅吃饭的人以吃不惯泰国菜的人居多,最后评分总体偏低,此时一个喜欢吃泰国菜的人在大众点评上看见这家店评分太低就不去吃了,但其实总的来说这家店的口味是中上水平的,那这时候这个评分就会对用户产生误导作用。而这个误导作用的根源就是因为没有对用户进行划分,所有用户的打分占比的权重是一样的,没有把其中真正有效的打分从众多无效打分中区分出来。
通过划分用户属性改变权重来增强结果的有效性:
针对大众点评而言,我认为合理的打分机制应该是这样的:首先对用户的偏好口味和商家的口味都进行标签化,然后当用户打分的时候,将用户的偏好和商家的进行匹配,再根据两者的匹配度给用户分配一定的权重。为什么这样合理呢?我举一个有点极端的例子:
原来的打分机制就好像一群身份完全不同的人,医生、律师、投资人、学生、家庭主妇、清洁工等等聚集在一起讨论一个医学问题,然后得出了一个平均答案。而我说的这种投票机制也是同样一群人,不同的是我把其中的医生区分出来,给他们赋予了更多的权利,在统计结果的时候主要参考他们的意见,然后再辅之以其他人群的意见。对两种打分机制进行比较,显然后者统计的结果更具参考意义。
归根究底就是权重两个字。
首先,划分用户身份;然后,根据具体情况分配权重;最后,计算出加权分。其实最根本的问题是如何区分用户身份。我前面提供了一种标签化的方法,根据一定的属性来细化用户身份。
我设想的大众点评打分机制其实就是根据两者的共同点来匹配双方。像知乎,也有人提议对赞同根据专业领域进行加权。比如中医的讨论,就应该以医界人士的意见为准,那么学医人士的一票赞同就应该等于普通人的1.5票(1.5票只是举例,没有科学依据)。
2.针对多个项目:
由于参与人数差异导致的不可比较性 。
以电影点评网站为例,这里就有一个问题:热门电影与冷门电影的平均得分,是否真的可比?举例来说,一部好莱坞大片有10000个观众投票,一部小成本的文艺片只有100个观众投票。这两者的投票结果,怎么比较?如何才能公平地反映出一部电影真正的质量?
通过加权分来弥补差异:
一个合理的思路是,如果要比较两部电影的好坏,至少应该请同样多的观众观看和评分。既然文艺片的观众人数偏少,那么应该设法为它增加一些观众。
IMDB网站是目前互联网上最为权威、系统、全面的电影资料网站,它所特有的电影评分系统深受影迷的欢迎,注册用户可以给任何一部影片打分并加以评述,网站又会根据影片所得平均分、选票的数目等计算得出影片的加权平均分并以此进行TOP250(最佳250部影片)和Bottom100(最差100部影片)的排行。
根据IMDB网站上公布的TOP250评分标准,IMDB top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下:
WR = ( v/(v+m) )×R + (m÷(v+m) )×C
其中:
R是用普通的方法计算出的平均分;
v是参与投票的人数;
m是进入IMDB top 250需要的最小票数;
C 是目前所有电影的平均得分。
仔细研究这个公式,你会发现,IMDB为每部电影增加了m张选票,并且这些选票的基本评分都为C。
这样做的原因是:假设所有电影都至少有m张选票,那么就都具备了进入前250名的评选条件;然后假设这m张选票的评分是所有电影的平均得分;最后,用现有的观众投票进行修正,长期来看,v/(v+m)这部分的权重将越来越大,得分将慢慢接近真实情况。这样做拉近了不同电影之间投票人数的差异,使得投票人数较少的电影也有可能排名前列。
权重是否违背了公平原则?
无论打分还是投票,我们都是秉着公平公正公开的原则,如果给一个人多一点权利,是不是就违背了公平?其实并不然。
什么是公平?我的老师曾这样给我解释:
真正的公平是:公交上所有的女性、儿童、老人都有座位,而不再这范围之内的男性都站着。
我们并不是生而平等的。我所谓的生而不平等是指:术业有专攻,在不同的专业领域我们这些业余的就是没有专家的科学和权威。那么如何突出他们的身份?加权。因为只有这样,我们才能得出最精准、最科学的结果。
加权的其他意义
区分核心用户,避免恶意打分/投票
下面再给大家分享一种付费用户权重大的例子。
造作是一个C2B的家具电商平台。在家具设计方面,用户通过投票参与设计;造作给出用户使用场景、材料、解决方式等命题,设计师会给出设计方案,用户进行投票,得票高的设计进入后续生产。在投票过程中,造作会考虑到所有用户的意见,但付费用户的权重更大。
造作为什么要这样做呢?在我看来,造作是为了通过付费这一行为,一方面使来筛选出平台的核心用户。用户行为代表了他的消费倾向和消费潜力。平台可以把这些消费倾向和消费潜力直接和产品挂起钩来,这会让平台的销售显得无比精准。另一方面,付费用户较高的权重可以从一定程度上弥补部分捣乱分子的乱投票、恶意打分。我们不可能保证每一分每一票都是有效的,只能通过某些手段尽量减少这些无效打分无效投票。
避免同票同分的尴尬场面
当我们做决策的时候最害怕出现平局的现象,这往往使得我们陷入选择困难或者重选的局面。那么在这种情况下,权重就发挥其作用了。怎么理解呢?举一个通俗易懂的例子:
玩过狼人杀的朋友都知道,警长是拥有1.5票投票权的,为什么呢?因为白天票人的时候很有可能出现平票的情况,那就要进行二次陈述、二次投票,而第二次的投票结果说不定仍然是平票,陷入死循环。此时警长那多出来的0.5票就可以完美解决这个问题了。
以上纯属个人的一些小想法,欢迎大家指错、讨论。
作者:Lighthouse_长腿哥哥,Lighthouse互联网实验室一员,微信公众号ID:Lighthouse
本文由 @Lighthouse_长腿哥哥 原创发布于人人都是产品经理。未经许可,禁止转载。