举一个赌场的例子。有一个大型的博彩集团叫做美高梅集团,在澳门、拉斯维加斯都有。
做赌场生意,关键是什么?人流,因为赔率相对比较稳定,只要有足够的人流量,赌场赚钱。所以这个生意跟零售业很像,沃尔玛做的也是人流量的生意。
对于赌场来讲,他们的数据分析里面非常关键的一点就是引流和降低流失率,尽量提高客户留存率。
赌博行业是一个市场竞争非常激烈的行业。开赌场的人太多了,像拉斯维加斯那条大街上面,很多家赌场,大大小小、金碧辉煌,赌场为了能够更好地留住客户,一般都不只是有赌场,还有餐饮、酒店、演出、购物等一站式服务。当然其中肯定是赌博的利润最大了,所以为了争取客户、留存客户,精准营销是非常重要的。
赌场关注精准营销这么多年,他们现在要做的一个工作是,把原有的精准营销模型更进一步地去优化。其中很重要的一点是,我需要去
量化我的促销力度跟赌博总消费之间的关系
。
这个问题其实很复杂。原因有:
第一,数据很多很杂很乱。
第二,促销的结果有时候因果是模糊的。
第三,赌客来赌场消费,他的决策过程是很复杂的。我选择你家赌场,可能不是因为你家赌场有多好,可能是因为你家的饭好吃,可能是因为你家的酒店好住,可能是因为你家的演出好看。
还有一个非常复杂的问题是,新赌客越来越多,历史上他们没有出现过,怎么给他们做精准营销?
赌场使用的模型是很经典的针对人流量生意的数据模型,叫RFM模型(Recency-Frequency-Monetary)。
Recency就是最近一次消费的时间,时间越近你的价值越高;Frequency 也就是消费频率;Monetary就是你花的钱。但是你也可以看出,这样也有一个问题,就是你没有办法区分天性豪赌和促销敏感的人。
所以,他们的新模型就要解决这些类似的问题。那具体怎么解决?
刚才我们说到
内生性,实际上它就需要采取一种所谓的“差别中的差别”(difference in differences)的方法
。
就是说,我需要在RFM分数类似的这些人里面再去看你们之间的差别。因为只有RFM分数相同的人,才有比较性。同时使用
协同过滤等技术
来解决新顾客问题,等等。
现在,我们有一个新的模型,但是万一最后用起来不好呢?
这个时候要去做
随机实验
,将部分顾客随机分三组,分别使用新模型、老模型、无模型进行精准营销。然后对比一下,哪个组的ROI(转化率)更高,才能验证新模型到底好不好。
最后发现,的确是新模型更好,所以在2015年加上了一个新模型以后,他营销的ROI提高了58%。
我们讲数据分析、数据挖掘、数据建模,
实际上我们目的最终不是数据,而是希望通过数据理解背后产生数据的东西。
是什么产生了数据?人产生了数据。
我们总是希望通过数据,找一下背后人的行为和特征,然后基于这些去做数据的变现。
所以,数据分析的逻辑不是以数据预测数据,而是通过数据预测人,人再来产生新数据。我们必须关注产生数据的人,这才是数据分析的本质。