为自己代言:《零基础学Python数据分析与挖掘》视频教程上线啦
对于一枚数据分析师而言,监控日常指标数据是必不可少的工作之一,
数据异常分析是数据分析工作中最常见且重要的分析主题
。
一般来说,这些数据都有固定的波动周期,每个周期内的数据变化应该是趋于稳定的,如果某天某周某月的数据不再符合预期的稳定变化,也就是我们所说的数据异常。
这种情况下,我们需要去深挖数据异常产生的原因。
通过一次次的异常数据分析来明确造成数据波动的原因,建立日常的的运营工作和数据波动之间的相关性以及贡献程度的概念,从而找到促进数据增长的途径,改变数据结果。
关于异常数据分析,
其实总结起来就是四个方面:
经常我们收到的数据分析需求可能是「XXX,转化率最近在下降,询盘量有点上升。分析下什么情况」(敲黑板,数据分析面试的时候高频率问题之一!!!),这种需求其实并没有把问题界定描述清楚。
所以作为数据分析师来说,首先要做的事情便是对数据波动进行界定,如果问题没有界定清楚,后续的数据分析也就失去了价值。
接到这样的需求,需要解决以下疑问:
-
判断数据波动是否为异常(对比前后一段时间内的变化情况)
-
确定异常的范围(异常发生的维度,主要从时间维度看)
-
波动的程度(理论上有【3个西格玛】,实际中一般通过观察趋势图)
-
是否需要深入分析
注意:
如果数据有明显的周期性和季节性,需去除相关因素之后再利用以上办法计算阈值。
当然,其实一般都是新手数据分析来处理分析的,你可能会觉得两眼一抹黑不知如何下手,ok,一般都是核心指标或者基础指标异常监测和分析,所以想要进一步分析,只有一个字,拆!!!
第 1 种,根据指标计算逻辑来拆。
第2种,根据相关维度来拆。
第3种,从产品、运营、技术以及用户四个角度来考虑原因。
下面有一个简单的思维导图,可供参考。
关于第二步,这个主要根据每个人对业务的理解水平,要尽可能做到发散发散再发散。。。
这一点的不二法宝还是拆,下面介绍一些常见的细分维度及其案例。
-
分步:
假设某产品的转化率数据出现降低的情况,而这个转化率是多步漏斗转化的最终转化,我们可以细分每一步的转化情况,查清是否因为某一步出了问题。比如微信支付服务器的故障会造成下单到支付的转化降低从而造成转化率降低,列表加载速度增加造成列表到详情转化率降低影响整体转化等等。
-
分平台/版本:
假设某产品列表页到详情页的转化提升,我们猜测是iOS新版本中优化列表布局方式,我们需要分iOS和Android以及分iOS新版老版对比这个转化数据来证明我们的猜测。
-
分区域/城市:
假设某年8月31日某OTA的交易额呈现大幅增长,我们猜测是因为大学生开学造成酒店需求增加,这时我们可以选取部分高校较多的城市如北京、武汉、西安等城市的数据来对比其他城市来侧面验证我们的猜测。
-
分时间:
假设某日某产品转化率数据下降,我们猜测是10:00-11:00支付服务器故障造成的,那我们只需要分时间段和上一个波动周期同期的数据对比,如果当日这个时间段转化率确实下降很大,就可以证明我们的猜想。