专栏名称: 月光博客
月光博客 http://williamlong.info
目录
相关文章推荐
Python见习室  ·  “李飞飞团队50 美元炼出 ... ·  11 小时前  
飞鲸投研  ·  绑定DeepSeek,科大讯飞,势不可挡! ·  2 天前  
飞鲸投研  ·  绑定DeepSeek,科大讯飞,势不可挡! ·  2 天前  
连州点点网  ·  假的! ·  2 天前  
连州点点网  ·  假的! ·  2 天前  
烂板套利  ·  AI智能体,最热门的7家公司 ·  3 天前  
财联社AI daily  ·  都来了,DeepSeek“朋友圈”再扩容 ·  3 天前  
财联社AI daily  ·  都来了,DeepSeek“朋友圈”再扩容 ·  3 天前  
51好读  ›  专栏  ›  月光博客

豆瓣250评分排名算法机制

月光博客  · 公众号  · 科技自媒体  · 2021-03-25 23:33

正文

据豆瓣的创始人阿北称,豆瓣评分机制,简单地说,就是把豆瓣用户的“正常打分”(一到五星换算为零到十分)加起来,再除以用户数。豆瓣也是有 “非正常打分” 规避机制的。基于 “所有能判断属于非正常评分的一概不算” 原则,豆瓣的程序会 “判断” 出那些 “非正常分数”,将其剔除在评分之外。

豆瓣250,则是豆瓣根据每部影片看过的人数以及该影片所得的评价等综合数据,通过算法分析产生豆瓣电影 Top 250。


豆瓣250的进榜算法,估计是和IMDB250类似,也用了所谓加权平均分的算法。


根据IMDB网站上公布的TOP250评分标准:


imdb top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下:


weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C


用中文表示就是:加权平均分= [经常投票者投票人数÷(经常投票者投票人数+进入TOP250需要的最小票数)]×普通方法计算出的平均分+[进入TOP250需要的最小票数÷(经常投票者投票人数+进入TOP250需要的最小票数)]×目前所有电影的平均得分


其中:


R = average for the movie (mean) = (Rating) (是用普通的方法计算出的平均分)


v = number of votes for the movie = (votes) (投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)


m = minimum votes required to be listed in the top 250 (currently 25000) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的,目前是25000票)


C = the mean vote across the whole report (currently 7.0) (目前所有电影的平均得分,目前是7.0)


对于豆瓣250来说,m值和C值会与IMDB 250不同。


如何将刷票行为排出到最终的分数外,关键点就在于“经常投票者投票人数”这个值上,只有“经常投票者”(regular voter)的投票才会被计算在top 250之内。







请到「今天看啥」查看全文