我发现很多人喜欢用很老的理论来指导实践,说要怎么做怎么做,但其实这个怎么做是过时的。那些做法不是定理,也谈不上原则,只是惯例,惯例不符了就不能盲目遵守。没错,我是在说风控。
别人告诉你要做什么不重要,重要的是你想要做什么。你看,做人和做风控是一样的。
本文接下来说的具体而细节的东西,远远没有上面两段话重要,如果你能真正理解的话。
我要说的新思路并不是什么大不了的东西,只是相对所谓的传统所谓的惯例那些老古董而言,它有一点点不一样。我并不能给当下的大数据风控指出一条崭新的道路。如果没有外来文明入侵的话,基于我的认识,没有这样的路。
1、风险标签不要光看滚动率、
vintage
,看你要干什么,产品特性、业务目标、数据可用性等,需要短期就短期,需要长期就长期。
2、建模过程不要老想着逻辑回归评分卡那套筛选,逻辑回归是那样做,但是机器学习模型不需要那样做,保证结果的稳定性就可以了,复杂系统会以你无法理解的方式解决你担心的问题。
3、征信数据会越来越没用,因为人人都是多头,下沉用户得用互联网平台数据。在社会范围内找聪明的学生,按学校去找就可以了,在一个学校里去找,得看别的。
4、
iv<0.02
怎么了,
iv>0.5
又怎么了,谁告诉你不能用?贷中行为变量
iv
值大的多了去了,下沉客群
iv
值大的都没有,模型不做了吗?
5、额度策略看收入负债,这当然很严谨,但收入取不到、负债算不准,没有就不用了呗。消费现金贷谁的收入负债你算得准,谁的收入负债不会变。引入不准的东西来解决精细化的东西,大多数都不可行。
6、上一条,你可以说我在点拒绝推断。推断拒绝样本表现永远是推断,不是准确的,用来建模试图提升效果就是
to be or not to be
的问题。其实你怎么建模都可以,没有人真正关心模型是怎么建的,效果稳定地好就行。但是你不能用虚构的样本去评估,那样,你改变了问题。