专栏名称: 大数据风控联盟
传递大数据风控前沿讯息;聚合顶尖信贷行业精英;分享云风控实操案例 。
目录
相关文章推荐
大数据文摘  ·  欧洲「DeepSeek」发布了全世界最好的 ... ·  昨天  
软件定义世界(SDX)  ·  2025年大模型应用落地白皮书:企业AI转型 ... ·  3 天前  
数据派THU  ·  如何运行本地 DeepSeek 模型并在 ... ·  2 天前  
CDA数据分析师  ·  《CDA考试模拟题库》助你轻松拿下一级考试! ·  4 天前  
天池大数据科研平台  ·  立即部署超越DeepSeek的QwQ-32B ... ·  3 天前  
51好读  ›  专栏  ›  大数据风控联盟

python评分卡建模—实现WOE编码及IV值计算

大数据风控联盟  · 公众号  · 大数据  · 2018-04-04 19:53

正文


在往期的文章中,小编多次写到过WOE和IV值的内容,也贴过相关的SAS代码,感兴趣的同学可以翻阅历史消息。这篇文章就不多介绍WOE及IV值的概念,主要讲讲怎么用python实现WOE编码和IV值的计算。


代码











实例


下面用UCI信用卡逾期数据集介绍一下以上代码的用法。


数据集如下:


数据集有20多个变量,其中响应变量是 'default payment next month',为了方便,将其改名为 'y'。


现在小编想要对年龄(AGE)变量做WOE编码。


这里的年龄是连续型变量,首先需要进行分箱。方法有很多种,这里我们可以用上一篇文章中介绍的卡方分箱算法对AGE进行分箱。


  1. cutoffs = chiMerge(df,'AGE','y',max_groups=6)

  2. cutoffs

分箱的切分点

  1. array([21, 26,







请到「今天看啥」查看全文