“设计可以像科学一样去定义并解决问题”,在设计的过程中总会有诸多不同意见的纷争,当方法无法作出决策的时候,进行AB测试可以更科学的去协助我们进行决策。本篇文章将基于快递场景下的AB测试,分别从“基础篇”“探索篇”“实战篇”来具体介绍为什么做AB测试、测试组如何设置变量及分组、以及后续依据数据如何进行后续的分析和解剖,以期望帮助设计者更系统化的进行AB测试工作。
一、基础篇
A/B测试的定义
A/B测试是什么?
A/B测试(也称为分割测试或桶测试)是一种将网页或应用程序的两个版本相互比较,用以确定哪个版本性能更好的测试方法。
我们也可以简单的理解为,将用户随机进行分组,分为对照组和实施策略组,
对比这些实验用户组的核心数据表现,检测哪个试验组的转化目标效果更好
,以此评估方案收益。
为什么进行A/B测试
——
过去我们判定
一个设计产出的优劣往往依靠各方的主观判断,为了避免设计的主观性以及无效沟通,可以尝试进行AB测试:
-
通过AB结果数据来
辅助决策、帮助我们找到问题重点
,检测哪个方案核心数据表现更好;
-
通过构建假设,更好的了解为什么修改某些元素会影响用户行为,从而
抓住用户喜好
,指导后续设计方向;
-
通过长期的实验,
探索影响数据增长的变量
,如风格样式、排版布局、装饰元素、利益点曝光等,并
形成可复用的设计规范
AB测试主要分为策略实验和样式实验,其中策略实验包含推荐策略和运营策略,日常的算法实验就是推荐策略实验的一种,设计师经常遇到的是UI样式的AB测试,也就是样式实验;本篇主要讲解的也是这一部分的实验方法和思路。
如何进行A/B测试
1、确定实验目标
目标是用于确定变体是否比原版本更成功的指标。
如
资源位的点击率、链接到优惠券的领取量、活动的分享量
等。以此作为考核目标,可以更清晰的看出实验组的数据效果优劣。
2、创建实验变量
在原版本的基础上进行
元素上的更改
。
如在视觉样式方面可以通过
更改按钮的颜色、文案的展现形式、金额的放大缩小、视觉风格的转变、主体物的更换、重点信息的位置调换
等;
功能方面也可以通过突出和隐藏该功能、功能及操作步骤的变化进行实验变量的确定。
需要确定好以上变量中哪些可以作为核心指标去衡量效果,哪些可以作为辅助指标协助决策。
3、生成想法假设
根据已经确定的目标,生成AB测试的想法和假设,以便统计分析实验变量是否会优于原版本。
这里可以根据方案的变量,设置实验的分组,以下是两个常用的实验设计方法;
1.单因素实验设计
单因素实验设计是
指实验中只有一个影响因素变量,如颜色变化、文案变化等,其他内容保持不变
。
可以直接分为【对照组】、【实验A组】、【实验B组】每组变量保持唯一。
通过对【实验A组】和【实验B组】进行实验对比,判断哪组的数据反馈效果更好,那么我们就认为这个是【实验A/B组】起到了作用
2.多因素实验设计
多因素实验设计是
指实验中有多个影响因素变量
,如同时测试【实验图片风格AB组】和【实验利益点是否突出AB组】,这里面有两个变量,对应就有四种组合条件即:
-
图片风格A,利益点突出
-
图片风格A,利益点不突出
-
图片风格B,利益点突出
-
图片风格B,利益点不突出
多因素实验的优势点在于,除了可以同时检测同一个变量不同实验条件之间产生的差异之外,还可以对变量之间的组合效果进行检验。
这种方法适用于在单因素的AB实验内,我们发现风格A比B效果好,利益点突出比不突出效果好,但是不代表这个组合情况的数据反馈是最好的,也有可能产生其他的效果,这种情况下我们就可以使用多因素实验。
4、收集实验数据并分配流量运行实验
提取埋点数据,针对指定区域的假设收集对应的数据用户进行AB测试分析。通过流量的分配,将用户
随机分配控件或者变量
。测量、计算比较他们之间的相互作用。
在实验组流量分配方面,可以参考以下分配逻辑
1.实验不影响用户体验
如部分样式实验、文案实验等,可均匀分配流量实验
2.实验不确定性较强
如产品新功能上线、可先小流量进行实验,分析数据,在规定的时间范围内得出结论并进行调整
3.希望收益最大化的实验
如一些运营活动等,目标尽可能将效果最大化,一般需要大流量的实验,流出小部分对照组用于评估ROI
5、实验结果分析
实验完成后,通过
对照组以及实验组版本之间的数据差异进行统计和分析
。
如果实验组的关键数据指标呈正向收益,可以考虑全量使用此方案或设置新的实验组逐步剥离变量,得出更精确的结论;
如果实验组的关键数据指标呈负向,可继续优化后再次尝试;
如果监测到关键数据指标变化不大,但本身改动较大,可以考虑扩大流量继续观察。
二、探索篇:京东快递小程序下单完成页锦鲤红包弹窗测试
锦鲤红包作为京东快递小程序在下单完成页面重点投放活动,在下单完成页分流投放占比高达90%以上,是下单完成页重要复单转化活动,旧版的下单锦鲤诞生于2年前,现如今存在诸多视觉体验问题,本次更新在保留旧版的玩法框架基础上,对视觉样式及结构进行更新。并持续监测视觉更新后的数据反馈。
用户通过下单完成页弹窗进入锦鲤红包活动落地页,提示可获得的优惠券红包,若分享红包则可获得更多奖励,用户也可选择直接领取红包得到小额优惠券奖励。
旧版暴露的问题
优化的目标及设计方案
除了在视觉风格方面更新视觉样式,结合当下视觉风格,给用户全新的视觉体验以外;
-
调整视觉展示形式,主体更突出
,打开的红包相较于未打开整体获得感更强,白底卡片在热闹的营销页面中,视觉上更有呼吸感,也更易让视线聚焦;
-
强化按钮点击感、引导性
,相较于旧版左右布局的按钮展示方式,上下布局的按钮引导性更强,按钮尺寸更大,同时突出分享按钮,在视觉和位置上都做了强突出,增强引导性,强化营销感激励感;
-
优化视觉层级,突出利益点信息
,旧版更突出有多少好友参与,新版通过将利益点突出放大,关注信息优先级提前,不重要信息减弱,从而提升用户的获得感;
-
利用光源引导焦点,光效晕染氛围,
增强活动氛围感沉浸感
。
新版上线后数据反馈
新版活动上线后,我们拉取了上线前10天以及上线后20天,共一个月的数据量进行对比,可以看出,在新版活动上线后,
“弹窗点击率”大幅提升
。
除了入口点击率的提升,活动内的用户行为数据如红包分享率以及下单跳转率也有较大的提升,由此引发了我们的思考,
活动的整体数据是否会因为入口视觉的变化而发生改变?
为什么选择下单完成页弹窗进行AB测试?
下单完成页弹窗,弹出逻辑为当用户完成当前下单操作流程后,在下单完成页默认弹出该弹窗。用户可进行关闭和跳转。这类用户首先具备了下单的诉求,均为已经下单的用户,用户行为较为纯净,较为容易检测他的后续行为数据。
在以往的运营行为中,我们多数时候更关注与流量较大的首页弹窗等,该页面的视觉和活动一直处于未更新优化的状态。在后续我们在该位置增加了资源位分层的逻辑,辅助业务去配置一些重要时间的被分流出去活动资源位,在项目初期我们发现,在更换新的资源位的时间段,弹窗点击率都有小幅的提升。
但由于下单页暂无法进行同时间投放不同的资源位,结合以上,最终选择通过不同时间段投放不同视觉同一活动的方案,作为初期AB弹窗测试的探索。
锦鲤红包弹窗测试
1、通过转化漏斗确定实验目标
我们对锦鲤红包整体活动的转化漏斗进行分层,提取出我们想要对比和想要做AB的关键数据指标。
监测数据的主要目的:
整体活动视觉改版的数据是否有提升?
-
入口视觉/利益点是否足够吸引人——
检测入口点击量 点击率
-
用户的参与度/分享欲——
检测拆红包按钮点击量(分享按钮点击量)分享率
-
优惠券的领用情况(优惠券核销率)——
业务反馈的领券量
-
用户在活动内的下单行为转化——
用券寄件按钮的点击量 点击率
入口的视觉样式是否足够吸引用户?
2、创建实验变量
建立了数据目标后,我们开始思考影响该数据的可能会有哪些元素。从以往的投放经验来看,用户对利益点刺激较大的、优惠力度突出的、一些红包优惠券促销等元素表现较为敏感,此类入口往往点击率也会更高。
以此为依据,我们最终确定第一轮AB主要的探索方向在
【利益点是否突出、金额是否放大展示】
3、生成想法假设并创建实验分组
我们设定三个实验分组【对照组】【方案A】【方案B】
【对照组】为旧版红包方案
【方案A】和【方案B】利益点相同,均为“99元红包”,在展示形式上做了区别;
【方案A】与对照组形式一致,均为红包优惠样式,区别仅仅在视觉元素方面进行丰富;
【方案B】同样也为红包优惠样式,但突出展示“99元”利益点,金额放大,按钮也更明显。
由于下单页弹窗数据一直较为稳定,结合以往的数据反馈,我们选择长周期进行观察,对【方案A】和【方案B】进行
反复交替上线
,检测数据反馈。根据两个方案给出的数据得出结论再进行下一步的探索。
4、数据反馈及分析结论
截止到12.21周,我们一共整理了近2个月的数据反馈,数据反馈如下:
通过两个多月的数据观察,我们得到了初步的结论:
-
保持
更换视觉可以提升用户新鲜度
,达到点击率的提升
-
比起红包这类刺激,
用户对金额以及利益点放大这类展示形式敏感度更高
三、实战篇:京东快递小程序首页弹窗AB测试
项目背景
快递小程序首页的弹窗一直是我们面向
全量用户流量、点击量最大
的入口资源位,弹窗形式多变,也是我们探索视觉风格,掌握用户喜好的一个有效途径。日常投放该弹窗主要分为四类:
-
周期内当前节日促销领券活动
-
每周四上线周四领券活动
-
每周六、日上线周末领券活动
-
亲情卡办卡活动
除此之外会额外针对新人用户发放新人礼包活动。
在实验之前,我们日常活动中经常会通过更换不同种类的弹窗样式,多变的视觉风格去吸引用户关注。
怎样的视觉风格和展示形式吸引度更高,能够一定意义上提升点击转化,是否可以通过AB实验得到答案?
首页弹窗第一轮AB测试
12.4日首页弹窗支持AB测试后,我们可以在统一时间段在线上投放AB方案。并在子午线查看数据,在视觉风格及方案选择的同时我们也优化了视觉的投放策略。
冬日暖心寄活动AB版方案在12.4日投放,周末活动在12.2日投放,周四活动在12.14日投放。第一批数据监控周期为2-3周。
1、确定实验目标
本次AB的关键数据指标较为明确,即
资源位入口的点击量/点击率
以及业务反馈的优惠券领券量;前者为主要监测的指标。
监测数据的主要目的:
入口的视觉样式是否足够吸引用户?
通过风格差异较大的AB版弹窗视觉的输出,在同一时间段进行投放,检测投放期间点击情况。不断的去探索哪种视觉风格吸引力更高。
2、创建实验变量
针对以往我们对首页弹窗视觉风格的尝试和了解,同样也是为了验证之前锦鲤红包得出的结论,我们第一批创建的实验变量同样为
【利益点是否突出、金额是否放大展示、优惠券展示样式是否更吸引人】
3、生成想法假设并创建实验分组
我们初步定位为两类三组实验组,在三组内又分别设定两个实验分组【方案A】【方案B】
由此我们得出:
优惠券样式对用户吸引度组
:
【冬日方案A】&【周四方案A】
突出展示优惠券样式