作者:
悟乙己,CSDN人工智能领域优秀作者
在常用的机器学习算法中,关注的是特征之间的相关性,而无法去识别特征之间的因果性,而很多时候在
做决策与判断的时候,我们需要的是因果性
。通过本文让我们利用因果推断决定在营销领域,应该给什么样的人发什么样的优惠卷
废话文学一下:入门学习因果推断三周,总算是入了个门…
就着智能权益方面的两个问题(给什么人发券?+ 发什么券?)简单总结一下两个问题的通用框架
(借一张哈罗顺风车的图,如上)
可以从很多已经落地工程化的案例中看到,在智能补贴或智能营销场景,常常需要解决两个递进的问题以及各自的解决方式,这里小结通用框架(这个套路又有点像之前学的预算分配的通用框架:
A Unified Framework for Marketing Budget Allocation
[1]
):
类型
|
解法
|
选人:给什么人发券?
|
Uplift model的各类模型
|
权益:发什么券?
|
线性规划、贪心分配、背包问题
|
1 选人、圈人
很显然,活跃转化是最主要的人群,大多的方法都是uplift model,那么uplift model也有几类:
•
uplift方法一:元学习方法(Meta-learning methods)
•
Conditional Outcome Modeling (COM) / S-learner
•
Grouped COM (GCOM) / T-Learner
•
X-Learner
•
R-learner
•
特殊meta学习:The Class Transformation Method
•
uplift方法二:Tree-Based Method(增量直接建模)
• 分布散度下的Uplift-Tree
• CausalForest
• 对uplift直接建模的CTS Tree
•
NN-Based Method
还有uplift model评估问题也很关键后面可以再看看。
1.1 腾讯看点的meta learning
1.2 滴滴的国际化外卖团队 meta Learning
在实践中使用的方法是用一个新的LightGBM
去拟合离线评估最优模型产出的
,并用这个新模型的特征重要度来近似评估各个维度特征的重要性,以此来决策是否加入和剔除特征。
选择LightGBM的原因是我们对于这个模型的精度并没有太高的要求,相反我们希望它能够比较快速地在训练流程中对新加入特征的给出反馈。
LightGBM高效地训练速度和不需要过多特征工程的优点比较契合我们的需求。
1.3 阿里飞猪广告应用的 NN -Based
例如广告的CTR/CVR预估模型;该类模型对广告效率的预估,会预先将原始的复杂特征做汇总。基于此,整体的思想就是基于原生的广告搜索模型做迁移学习。
将所有特征都连到一个DNN里面,采用了ResNets的思想,如上图所示:左侧网络对用户搜索请求预期的转换效率进行建模,右侧网络对“广告是否投放”产生的影响进行建模,最后通过线性模型加以合并。对于广告效应的推断方面,这种模型相比于DNN会有一定的提升(uplift Qini指数提升至0.6)。
1.4 哈啰顺风车的meta-Learning
除了meta-learning外还尝试了Tree-Based,uplift model 下的树模型通过对增量直接建模,对特征点进行分裂, 将 X 划分到一个又一个 subspace 中,那划分准则与传统的决策树信息熵或者基尼系数不一样,这边主要是采用分布散度或者CTS分裂准则。
nn-based我们还没有尝试,他是将propensity score估计即倾向性得分和uplift score估计合并到一个网络实现。
1.5 阿里文娱的meta-learning
2 每个人发什么券
这里基本是线性规划占主导