风控大咖教你四步开发风控模型

大数据风控联盟 · 公众号 · 大数据 · 2017-03-18 09:07

正文

“你的模型准么？”

“你的模型真的有用么？”

“你的模型对风控有价值么？”

在为P2P公司建立风控评分模型过程中，这是最常见的问题。为了回答这一问题，我们想先讨论下如何从实际业务出发，以怎样的开发流程才能建立一个有效、有用、有价值的模型，希望读后能给你一定的启发。

在互联网金融风控体系中，量化分析需要贯穿始终，评分卡模型是其中非常重要的一环。

在互联网金融评分卡开发过程中，我们仔细研究了企业风控操作流程，反复推敲了模型构建步骤，最后我们认为从业务应用角度，评分卡开发应用应遵循：

业务定义➡️ 风险定义 ➡️ 风险分解 ➡️ 风险策略

业务定义

为什么把业务定义放在最底层呢？

从商务智能的角度说，模型，评分，策略等都是为业务服务的，脱离了业务场景的模型和评分是无本之木，无源之水;脱离了业务场景谈模型的准确性，没有意义。

不同的业务场景，产生了不同的数据，不同的数据包含的规律，体现在数据分析中就是不同的模型、不同的参数和不同的评分。

比如，同样是网上的个人信用贷款，主要包含个人和企业主两大类客群。在中国，由于小微企业贷款困难，如果小微企业有了贷款需求，一般都是企业主以个人名义在网上贷款，但是这类客户显然是和普通个人信用贷款客户是不同的，所以这类客户的属性信息一般都包含了一些企业的信息，如资产，对公、对私流水等等。我们在做模型的时候，就会把他们分开：个人消费信贷模型和企业主信贷模型，企业主模型会包含一些反应小微企业财务状况的变量。

但是互联网金融所包含的业务种类远不止这两个，单纯的信用贷款类，就有专门放贷给学生的学生贷；在朋友圈之内贷款的朋友贷；给外企白领贷款的白领贷……

如果你拿学生贷的模型给农民贷客户来用，或者拿给上海白领开发的模型给甘肃、西藏的白领用会怎么样呢？我不说你也明白了。

业务定义之后，还有一个要求，即业务模式的稳定性。即在一定时间范围内，用于构建模型的数据依赖的业务模式是相对没有变化的，前后一致的。只有满足这个条件，历史数据模拟出来的模型，和后面的数据才是匹配的。这在学术上有个术语，稳定性，Stationary/stability.

同理，我们也假设，符合同一类属性特征的个体，其表现行为也是一样的，即打分相同的人，表现也相同。这也回答了有人提出的另一个问题“我以前从没贷过款，也没信用卡消费记录，能用你的模型打分么？”

风险定义

简单地说就是判定哪些是好客户，哪些是坏客户。

互联网金融业务模式的多样性，导致了对好客户和坏客户的定义标准也不尽相同。这里有人会问：“怎么会呢？欠钱不还的不就是坏客户么。”好吧，我来举个例子。

在我们清洗数据的时候，看到对客户信用评价中有这么一类“少量逾期”，这个类别占了相当大的比重，而且在模型中作用也比较显著，和其它类别“信用好”“信用差”等比肩。

一开始我们的技术人员对这个“少量逾期”这个分类很疑惑，不能理解这个分类到底是好还是坏。直到我们和某P2P公司的风控经理实际交流后才明白这其中的含义。在传统银行信用卡业务中，是很喜欢这类少量逾期的客户的，因为他们能给银行创造罚息，但是又不是恶意违约那种客户。但对于P2P公司来说，是不敢养这类客户的,一旦有了逾期情况，就必须马上采取措施……

说到这里您可以明白了吧，“少量逾期”是传统银行信用卡业务中经常出现的一个分类，而且算一个银行比较喜欢的类别，但是你把它也用到互联网金融试试？

风险分解

风控大咖教你四步开发风控模型

正文

请到「今天看啥」查看全文