对于玩家或者用户来说,游戏评分这件事既有购买游戏的“导购价值”,也有从传统上的信任所在,评测即是选购游戏的最佳向导,这套说法玩家们深信了很多年。
但是游戏评测的标准和定义,实际上又没有一个完全统一、客观的标准,比如说游戏是怎么评的、怎么测的,标准是什么?
本身来说这样一个细分科目就没有一个市场公认和规定的标准,像纸媒时代的老编辑可能会从画面、剧情、音乐、玩法、操作等多个维度取个平均值。
新一代编辑可能注重于多人分别打分取平均值,Fami通采用的就是这种形式。但即便是采取多人,这个体量也就无外乎十几个,这样的评价样本量去对应可能上千万的玩家群体,本身从统计的观点来看,也是相当不合理的一面。
近年来游戏评测评测争议频发,或许以下几点原因:
1. 评测人员自身的专业程度
比如IGN有一群编辑,但一般来说每一个游戏也就会安排一个编辑去测评,那么不同的编辑本身就对擅长的游戏领域和了解程度有一定局限性,很难做到说相对全面整体细致的评测。
《风暴英雄》在IGN评分只得到了6.5分的评价,然后这款游戏却被分公司IGN西班牙给予了9.0分的高分评价,造成如此巨大的差距原因是,随后就有玩家爆料,给《风暴英雄》打分的IGN编辑只打了24盘游戏,然后只赢了8盘人机。游戏中创新的地图机制以及天赋经验系统在IGN的口里却成为评分低下的元凶。
更为搞笑的一个例子出现在“GameCritic”网站测评《尼尔:
机械纪元》上,编辑在文章中说,这游戏我玩一半就玩不下去了,后半部分是在油管上云通关的,现在我来给你们评测一下……
2. 评测群体与玩家群体的相对割裂
近年,影响游戏打分的因素越来越多,譬如多元元素等要点,对有些编辑很重要,对有些编辑则不置可否,这一点本身在玩家内也有很大争议,分歧点也因此产生。
再比如忽视一些“最基本的游戏体验”,比如当年《刺客信条:大革命》发售时,几家媒体都打了8分以上的高分,但游戏发售后频发的Bug,导致测评的编辑都遭受了迅猛的舆论压力;近年来的《赛博朋克2077》也遇到了类似的情况。
3. 标准不统一,过于放大其中某一方面
比如说对于一些小游戏,游戏媒体往往一般会抱着相对宽容的态度,会自动回避小游戏投入不足的缺点,反而会主动寻找亮点。
还有一个比较明显的例子就是对手游(包括三端互动的游戏)评价标准比主机和PC端游戏要宽松很多,对独立游戏和大厂的评价标准也是不一样的。
错误小厂可以犯大厂不可以,有的环节在独立游戏是能忍受的,但3A就不能容忍,或者说“是否符合玩家”期望也是评分中的一环。
4. 玩家群体对于游戏厂商可能插手,导致对评分的不信任
标准难以捉摸并不是现如今玩家对于评分不信任唯一的理由,毕竟从最早的纸媒时代开始,游戏媒体和厂商之间的关系,也很难真正去用“独立客观第三方”来形容。
没有证据的时候,当然不能诛心去说“收了钱”,然而,给游戏打分这件事本身,或许就存在天然的矛盾——要求绝对客观,但有人的地方就有江湖,不同的参与人和不同的媒体机构立场就决定了这件事几乎不可能客观。
曾经游戏评测更多被视为游戏行业的“导购员”,和当时游戏内容生态相对较少,信息相对闭塞,玩家们接受相关内容参考的来源相对有限不无关系。
如今纸媒早已式微,各种内容生态百花齐放:社交媒体、播客、视频网站、综合媒体、垂类媒体等应有尽有,玩家早不需要凭借曾经“权威”式的意见作为自己的参考标准。
早年的游戏市场,盘子还没有如今这么大,可以做到对游戏进行全方位多维度的评测,如今游戏本身就越来越多,平台也多。厂商发布游戏的节奏也越来越快,玩家对内容获取的需求也越来越快,也确实会导致没人好好静下心来认真去做评测,这的确是一个不容忽视的内容消费现象。
而且游戏评分吸引力的立足之本,是本身游戏媒体机构的专业性和权威性。像近年来一些引发争议的评分事件本身就是在伤害玩家对于评分机构的认可度,长此以往游戏评分有可能会像一些硬件测评分数一样,“不够专业,更像是娱乐评分”。所以,测评机构和测评人员的专业性就至关重要。