专栏名称: 金科应用研院
Share Technology Happy Finance
51好读  ›  专栏  ›  金科应用研院

如何用策略挖掘降低逾期风险

金科应用研院  · 公众号  ·  · 2024-11-27 08:33

正文

关注 金科应用研院 ,回复“ 礼包

领取“ 风控资料合集

文末还有惊喜小福利,记得看到底呦


随着金融科技的迅猛发展,数据驱动的风控手段在金融机构中扮演着越来越重要的角色。其中,决策树作为一种简单、高效、可解释性强的机器学习算法,被广泛应用于风控策略的挖掘和特征生成。本文将从实际案例出发,探讨如何利用决策树技术提升风控策略的效果。



在风控中的优势


决策树模型以树状结构直观地展示了决策路径,每个节点代表一个特征的判断条件,叶子节点则代表最终的决策结果。其主要优势包括:

  • 可解释性强 :决策路径清晰明了,便于业务人员理解和分析。

  • 数据预处理要求低 :对缺失值和异常值不敏感,减少了数据清洗的工作量。

  • 适用性广泛 :既可处理分类问题,也可处理回归问题,灵活性高。



策略挖掘

1. 数据背景
某金融机构希望通过挖掘现有客户数据,提高对逾期风险的预测能力。公司提供了客户的收入、贷款金额、还款金额、商品价格等多维度数据,以及是否逾期的标识。

2. 策略挖掘过程
Step 1:构建初始决策树
利用客户的特征数据和逾期标识,构建一棵初始决策树。模型的目标是最大化节点的纯度,即使得同一叶子节点内的客户逾期情况尽可能一致。

Step2:分析节点纯度
在初始节点,逾期率为8.27%(5242个逾期客户 / 63355个总客户)。通过决策树的分裂,发现某些叶子节点的逾期率显著低于平均水平。例如,满足以下条件的客户群:
  • 贷款金额 > 677,889元

  • 还款金额 > 57,003元

  • 收入 > 60,750元


在该叶子节点中,有1788个客户,其中只有52个逾期,逾期率仅为2.83%,远低于总体水平。

Step3:提取高效策略
基于上述分析,可以制定一条风控策略:对于满足上述条件的客户,可以降低风险评估力度,甚至给予快速审批。这不仅提高了业务效率,还能有效控制风险。

3. 序贯覆盖挖掘更多策略
为了挖掘更多有价值的策略,可采用序贯覆盖的方法:
  • 第一步,构建初始决策树,提取高纯度的节点策略,并将对应的客户从数据集中移除。

  • 第二步,在剩余数据上重新构建决策树,继续挖掘新的策略。

  • 重复以上步骤,直到无法提取出高纯度节点为止。


通过这种方式,快速建立一系列风控策略,覆盖更多客户群体,提升整体风控能力。



特征生成


除了直接挖掘策略,决策树还可用于生成新的特征,提升模型的预测能力。


1. 思路概述

利用决策树的分裂节点,将高阶非线性关系转化为新的特征。例如,某些组合条件下的客户风险显著增加,那么可以将这些条件编码为新的变量。


2. 实践案例

Step1:训练梯度提升决策树(GBDT)模型

GBDT集成了多棵决策树,能够捕捉复杂的特征交互关系。训练过程中,每棵树的结构和节点都有重要信息。


Step2:提取叶子节点编码

对于每个客户,让其通过训练好的GBDT模型,记录其在每棵树上到达的叶子节点。由于每个叶子节点代表了特定的特征组合条件,可以将这些节点编码为新的类别型特征。


Step3:将新特征加入模型

将提取的叶子节点编码作为新特征,加入到后续的模型训练中(如逻辑回归、深度神经网络)。这些新特征能够显著提高模型的预测性能。


3. 数据效果对比







请到「今天看啥」查看全文