专栏名称: 尼尔森Nielsen
关注尼尔森市场研究,即时获得前沿市场营销和消费者资讯
目录
相关文章推荐
架构师之路  ·  你的提示词根本只是在浪费算力,能让deeps ... ·  3 天前  
51好读  ›  专栏  ›  尼尔森Nielsen

【科普篇——双管齐下,澄沙汰砾】线上无效流量的净化与过滤

尼尔森Nielsen  · 公众号  ·  · 2019-11-08 09:00

正文


300万转发评论点击仅需RMB2300?

流量网红带货的背后可能是

“机器人助手”带来的无效流量?

破解无效流量,拒绝交付“流量智商税”

线上广告媒体花费近年来逐年上升,随着更多购买形式的出现,以及平台间的高频率交互作用,线上流量的重要性越发重要,在这其中,怎样才能有效避免流量浪费?


纯净流量需经过三层净化


根据尼尔森标准,将全量流量分成3层进行过滤。

和自来水净化一样,流量在不同阶段,需要有不同的方法过滤。对于第一层的一般无效流量,我们使用的过滤方法像物理过滤,像家用净水器一样,通过滤网的粗细过滤沙石,用活性炭吸附杂质。而第二层的复杂无效流量,则更像化学过滤。在这一阶段,尼尔森会纳入更多维度的数据,通过数据挖掘,使得数据之间发生化学反应,最终使复杂无效流量结晶显现,完成第二阶段过滤。第三层则是甄别出没有展现在有效页面的不可见曝光。通过物理和化学过滤的结合,加上对不可见曝光的甄别三层过滤,最终完成流量净化,触达真实用户。


一般无效流量过滤

关键在于遵循标准和洞悉媒体环境


根据行业标准无效流量分为一般无效流量(GIVT)复杂无效流量(SIVT)

一般无效流量(GIVT)

具有回传非法参数的,来自服务器中心,具有异常行为等特点的流量。

这是可以被可固化成例行规则或者使用标准化参数进行过滤的流量,行业标准是其判定的重要准则。从国内外的行业标准来看,大家都关注以下两个方面:

规范参数类型和回传值

制定和维护统一的黑名单(户代理,IP,统一设备标识等)



尼尔森会同时对照国内外的黑名单过滤GIVT,但这种做法会有一定的风险标准则意味是公开,某种程度上等于给恶意作弊方学习研究GIVT判定的标准的机会。

尼尔森很早就认识到这个问题,所以建立专门数据科学家团队定期研究国内的媒体环境和流量模式。经过大量的数据挖掘和科学分析后,尼尔森认为应该从点到面全面分析流量行为模式

点是个体层级的比较,比如通过变异系数可以更好理解人类流量和机器人流量的不同。

如下图所示,尼尔森研究发现,该图描述的是曝光行为时间戳记录。左边是正常人类流量行为的分布,右边是无效流量的行为分布。明显看到,人类曝光行为相对无序,而机器的曝光行为分布均匀。通过变异系数指标,衡量数据的离散型,可以快速的区别出人类和机器流量,实现点的比较。  

面的比较则是基于不同情况,设定不同的阈值

曝光频次进行标准化之后,可以拟合出反应DeviceID数和曝光频次的曲线,并且找到异常频次拐点。但不同平台的流量模式不同,所以电脑端,手机端,OTT需根据不同时间颗粒度界来设定不同阈值。除此之外,很多已被发现的无效流量行为判定都已同步应用到尼尔森的GIVT判定规则中。

总体来说,GIVT流量的物理净化需要洞悉本土媒体环境点面兼顾。滤网过滤之后的水还达不到饮用水的标准,因为里面潜伏着看不见的病菌细菌等有害物质,需要杀菌消毒,流量也是一样,潜伏着伪装得更深的恶意流量,需要化学过滤的过程。


复杂无效流量过滤

关键在于基于IP的数据点串联


伪装性更强的流量被称为复杂无效流量(SIVT)。

复杂无效流量(SIVT)

Iab(互联网广告署)将它定义为需要高级分析多点佐证/协调,以及重要人为干预判断的流量,即无法通过单一的监测字段识别,需要多维度的高级分析,机器学习识别出来的无效流量。

当我们不仅只分析当下静态的1s的曝光行为,而是放眼全局





请到「今天看啥」查看全文