专栏名称: 王镇雷
分享我的互联网思维与理念,提供纯原创最精华的产品相关文章
目录
相关文章推荐
51好读  ›  专栏  ›  王镇雷

没有AB测试,我上了一张新图片

王镇雷  · 公众号  ·  · 2020-02-14 21:00

正文

请到「今天看啥」查看全文


下图所示,是我们家某个商品的详情页。且有一个后台工具,可以看到每天多少人访问了这个页面,又有多少人最终下单了。


我接到一个任务,很多客户反应没有篮球不真实,所以想优化一下商品的图片,来提高页面的转化率。




换完了,我们怎么验证这张图的效果是好还是坏呢?


最理想的情况,进行一次 AB 测试,把访问到这个页面的人分成两拨,一部分看到旧页面,一部分则看到新的,比较两拨人的转化率。


转化率 = 下单人数/访问人数



Day7我们换了图片,很显然,大家对有篮球的更加喜欢。


但是很多时候,AB 测试是需要开发成本的,像我们这种小商家,换商品图这种事就没办法使用科学的 AB 测试了。所以,我们会看上线前后的转化率对比。


如果日常我们的数据比较稳定,转化率曲线可能是这样的:


可以看到,虽然有波动,但是明显换了图之后整体都比之前要好一些。


转化率稳定的意思其实是,每天这个商品页面基本不变,没改价、没刷单、平台没搞大促等。同时,进来的用户数量够大且也相对稳定,每个人都差不多。


很不幸,我们是一家小店,每天来店里的人数也就几百个,和那些几万人访问的大店没法比。有可能今天5个人买了,明天10个人买了(相差一倍)。


所以,我们的真实转化率曲线可能是这样的:


这时,就没办法直接从图中读出效果了。 我想了想,既然每天波动这么大,就算个平均值看看吧。


于是,我把新图片上线前一周的转化率算了一个平均值 X,并且把上线后一周算了个平均值 Y。


日转化率周平均 = 每天转化率之和/7


哎呀,看来大家并不是很喜欢篮球呢。



吃午饭的时候,我和同事小张交流大家更喜欢没有篮球的照片。


但他告诉我他不是这么计算的。他把每一天的下单人数加起来,除以每一天的访问人数加起来。


周累计转化率 = (7天下单人数之和)/(7天访问人数之和)


我按照小张的方法把我的数据算了一下。


嗯? 跟原来的不一样了。 有篮球的图反而效果更好了。


(仔细观察每天数据,会发现第二阶段有几个非常极端的数据:极少成交)


那么,哪种方式更适合呢?


这个问题本质上,是一个大样本,和将这个大样本拆分成若干个小样本再取均值的区别。我咨询了数学系的同学,并查阅了一些文档,发现有个数学定理与此相关。


中心极限定理:给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。然后把这 m 组抽样分别求出平均值。这些平均值的分布接近正态分布。
百度百科


为了理解,就不在此进行数学推导,我用最大白话做不严谨的阐述,有兴趣可以看文章最后的参考文献[1][2]。


简单拿骰子举例。如果你把一枚骰子丢1000次,会得到如下这张分布图(每个数字出现的概率都是1/6,所以分布图大家差不多高,抛的次数越多,越接近)。


(图来自 https://bbs.pinggu.org/thread-7602877-1-1.html)


如果你丢2次骰子,然后取两次的平均值(3和4,就计3.5),再把丢2次这个动作重复1000次,会得到这样一张分布图。


(图来自 https://bbs.pinggu.org/thread-7602877-1-1.html)


可以看到,楼上这张图是典型的“土堆形”正态分布。如果你把2次骰子变成20次、30次,这张正态分布图会越来越窄,越靠近中轴线 —— 均值 3.5。


(图来自 https://bbs.pinggu.org/thread-7602877-1-1.html)


回到我们最初的问题。假设商品的转化率,在各种条件固定之后,是一个客观存在的概率。其实,每一个用户来店铺,都是一次采样。


那么我们手上7天的数据,如果加在一起使用,就是一个“大样本”,如果拆开,那就是7个“小样本”。


同时,这7个“小样本”,又是这个“大样本”的样本。


理论上来说,各个小样本的均值,当7变成30或者更大时,也是一个正态分布,中轴线是大样本的均值(其实,如果每天来访人数是相同的,不管哪种方式算出来的结果是一样的)。


通常,样本数大于30之后,正态分布已经很契合了。但因为我们只取了7天,还是非常容易受到某一天的极端数据影响,导致最后的计算出现偏差(如有些天没有成交)。


综上,条件允许能取大样本时,就尽量使用大样本去估计你的目标吧。


后话


其实,真正工作中类似商品转化率的数据,还有很多统计分析方法。


除了最严谨的 AB Test 以外,我们还可以用“拟合法”来判断一组数据的总体趋势,进而判断效果。


可惜,像电商商品详情页这种自变量极多的场景,是很难通过简单的数据分析得出结论的。


尤其天猫淘宝,无时不刻在进行大促。商家总在购买各种流量入口(影响了进入用户的特性)。甚至天气好不好,有没有肺炎肆虐,都会对你的商品转化产生巨大的影响。


所以,有机会的话,还是尽量用 AB Test 来验证你的新功能吧。


最后,在公众号给我发消息“我想打篮球”,可以随机获取一张商品图片(有篮球/没篮球),喜欢的可以搜藏:)


参考文献

[1]《 中心极限 理通俗介绍 》,https://www.zhihu.com/search?type=content&q=中心极限定理

[2]《 样本量大于30就可以认为是正态分布吗? 你可能对中心极限定理有误区! ,https://bbs.pinggu.org/thread-7602877-1-1.html









请到「今天看啥」查看全文