为什么把业务定义放在最底层呢?
从商务智能的角度说,模型,评分,策略等都是为业务服务的,脱离了业务场景的模型和评分是无本之木,无源之水;脱离了业务场景谈模型的准确性,没有意义。
不同的业务场景,产生了不同的数据,不同的数据包含的规律,体现在数据分析中就是不同的模型、不同的参数和不同的评分。
比如,同样是网上的个人信用贷款,主要包含个人和企业主两大类客群。在中国,由于小微企业贷款困难,如果小微企业有了贷款需求,一般都是企业主以个人名义在网上贷款,但是这类客户显然是和普通个人信用贷款客户是不同的,所以这类客户的属性信息一般都包含了一些企业的信息,如资产,对公、对私流水等等。我们在做模型的时候,就会把他们分开:个人消费信贷模型和企业主信贷模型,企业主模型会包含一些反应小微企业财务状况的变量。
但是互联网金融所包含的业务种类远不止这两个,单纯的信用贷款类,就有专门放贷给学生的学生贷;在朋友圈之内贷款的朋友贷;给外企白领贷款的白领贷……
如果你拿学生贷的模型给农民贷客户来用,或者拿给上海白领开发的模型给甘肃、西藏的白领用会怎么样呢? 我不说你也明白了。
业务定义之后,还有一个要求,即业务模式的稳定性。即在一定时间范围内,用于构建模型的数据依赖的业务模式是相对没有变化的,前后一致的。只有满足这个条件,历史数据模拟出来的模型,和后面的数据才是匹配的。这在学术上有个术语,稳定性,Stationary/stability.
同理,我们也假设,符合同一类属性特征的个体,其表现行为也是一样的,即打分相同的人,表现也相同。这也回答了有人提出的另一个问题“我以前从没贷过款,也没信用卡消费记录,能用你的模型打分么?”