专栏名称: 艺恩数据
艺恩是泛娱乐大数据平台领航者,从电影数据情报为起始,并将产品与服务逐步渗透至泛娱乐产业;通过数据洞察驱动行业变革;整合多屏终端消费数据,为市场洞察、项目孵化投资、营销发行、渠道经营提供策略支持和运营辅助。
目录
相关文章推荐
数据派THU  ·  【ICLR2025】VEVO:基于自监督解耦 ... ·  2 天前  
数据派THU  ·  DeepSeek背后的技术基石:DeepSe ... ·  3 天前  
人工智能与大数据技术  ·  Meta被曝AI训练「黑幕」!下载81.7T ... ·  5 天前  
人工智能与大数据技术  ·  41岁DeepMind天才科学家去世:长期受 ... ·  4 天前  
51好读  ›  专栏  ›  艺恩数据

郭靖宇愤怒后的冷思考,数据困境究竟何解?

艺恩数据  · 公众号  · 大数据  · 2018-09-16 14:51

正文

买收视率一集90万,80集一共7200万,不买就不能播出。明码标价,言之凿凿,而且是卫视相关领导亲自约谈。一旦“不听从劝告”,换来的就是对方的报复,从要求其他平台撤档,到豆瓣和微博下的种种恶评……

截止目前,郭靖宇导演的《娘道》已经播出了11天(9月5日开播),艺恩播映指数为68.3,居电视剧日榜第四位,其媒体热度(63.8)、好评度(77.0)、观看度(81.6)均排在了同档所有电视剧中的前三位。

可以看出,虽然市面上的数据充斥着一些杂质,但《娘道》的表现在艺恩数据上总体上得到了一个相对公正的还原。

可以说虽然收视造假早已成为行业内公开的秘密,但郭靖宇导演的一席话还是让所有人有了一种身临其境的感觉。这种感觉几乎等同于“犯罪现场再现”。

我们都明白,收视率决定广告投放,收视率造假等于欺骗广告主,是一种商业诈欺行为。而公开的强制片方去买收视率则是对片方的一种勒索,这两种行为无疑都是违法犯罪。

而从行业自身来讲,假数据的横行则彻底破坏了行业的衡量标准,让大家失去了参考标准。许多质量低下的作品通过买数据成为了所谓的“剧王”,而坚持不买数据的片方则成了牺牲品。长此以往,必定造成行业评价标准的失序,以及作品质量的整体下降。

买收视率大大推高了片方的成本,而不愿意屈从的人则受到了不公正的待遇,甚至是肆意的打击报复,这些都严重影响了市场秩序。这也是郭靖宇导演异常愤怒的原因。

那么我们究竟需要怎样的数据?这些数据又该如何生成呢?

多维度:不再只盯住单一数据

不仅仅是收视率和播放量,在近期的一场关于影视IP的论坛上,就有人控诉了前几年网文圈里的一些乱象,其中之一就是数据造假。他提到,当初就有一些网文网站为了捧出自己的作家,大肆的篡改后台数据,以制造出爆款的假象,进而吸引到了许多影视公司的关注。

可以发现,这与今天的收视和播放量造假有一点非常类似。无论是今天的广告主,还是当时的影视公司都只把收视率(阅读次数)当作了唯一的衡量数据。而无论是电视台、视频平台还是网文网站,当明白了这一点之后,在强大的利益驱使之下便会“投其所好”,制造“人工爆款”。

而且,正如郭靖宇导演所说,假数据背后有着强大的利益链条。不仅仅是播放平台一家,许多经纪公司、制作公司等影视相关公司为了提升自身知名度,都会去主动维护这些假数据,这也就让真实数据的获得难上加难了。

可见如果想在根本上解决这个问题,除了使用法律手段,给涉事人员以严惩之外,还要解决数据的单一性,可靠性的问题。让更科学、更有效的数据公布在阳光之下。

那既然如此,之前为何又没有人去改用其他数据呢?

这主要是因为收视率等数据是最直接的数据,有其难以替代性,更何况其他数据的获得也非常困难,获取成本也非常高,而替代数据的真实性也难以保证。

也就是说,想要替代现有数据,新的数据就必须能够客观的衡量一部作品的真实情况,而且不会被那些假数据所“欺骗”。这既需要新数据有足够的说服力,也要求其得出背后有严谨的科学统计方式,将虚假数据排除在外。

更科学的计算方式

用大数据去除杂质

面对这个棘手的问题,业界已经有很多人在开始着手解决。本月初,爱奇艺宣布关闭前台播放量,之前爱奇艺还曾将起诉过制造假数据的公司。勇敢的对不实数据说不,切断造假之源,爱奇艺已经迈出了第一步。

同样,就在上周,艺恩数据也推出了播映指数,该指数就摒弃了之前只有播放量单一数据维度的做法。改为使用媒体热度、用户热度、好评度和观看度加权平均,通过大数据算法,最终得出播映指数。

媒体热度 反映了某一影视内容营销宣发的效果变化情况,覆盖影视内容制宣发全阶段,监测期提前到播出前180天,实时跟踪营销效果以便动态调整营销策略。

用户热度 主要基于社交媒体(微博话题、点赞、转发、评论、贴吧发帖数、讨论数及豆瓣长短评数量)、长短视频(预告片观看、评论、弹幕等用户行为)等数据综合获得, 旨在衡量用户参与全媒体平台互动效果。

好评度 主要反映观众对于某一影视内容喜爱程度的变化,主要通过对影视内容在映前一个月至映后一段时间内其在视频、社交平台的口碑变化以及通过自然语言处理的正负面热词综合计算得出。

观看度 通过剔除异常波动数据等处理视频前台播放量、OTT收视率等跨屏数据拟合,以求真实、客观的反应一段时间内容观众在某一影视内容上的观看变化的合理分布。

可以看出,这四大维度涵盖了内容营销在媒体上的传播情况,社交媒体上的热度,观众评论,剔除异常数据后的观看数据,能够相对客观的描摹出公众对于一部作品的真实反映。同时尽可能绕开那些数据造假的高发区,让数据更具客观性和真实性。







请到「今天看啥」查看全文