专栏名称: 雷帅快与慢
经验让工作更简单,风控让人生更自由。
相关文章推荐
人民网舆情数据中心  ·  翻新卫生巾黑幕曝光,舆论呼吁构建全链条闭环治理体系 ·  21 小时前  
中国中医  ·  【媒体聚焦】央视《正点财经》| ... ·  昨天  
中国中医  ·  【媒体聚焦】央视《新闻直播间》| ... ·  昨天  
北京厚朴中医  ·  新生的快乐 ·  3 天前  
人民网舆情数据中心  ·  国家邮政局对上海韵达货运立案调查、部分厂商回 ... ·  2 天前  
51好读  ›  专栏  ›  雷帅快与慢

十道题测试你的风控水平

雷帅快与慢  · 公众号  ·  · 2024-12-03 10:45

正文

我设计了十道题,测试一下你的风控水平。我要测的是你的经验,你的感觉,你的认知,不是你的计算能力。

没有一道题需要你的计算,更不用你记住psi、iv、ks、auc、lift的计算公式,不需要你了解vintage、滚动率的概念,不需要你知道xgb、lr、nn的算法原理,需要的是你用心去思考。

我对你的风控是什么水平毫无兴趣。我们唯一的关联是,我是写作者,你是阅读者,你花了时间,我得了快乐。为了放大这份快乐,回馈你的时间,我希望你能得到最大的收获。 ‍‍‍‍‍‍‍‍‍‍

你可以先作答这十道题,但不要以快速答完为第一目的,有所启发是最好的。我后面会给出答案。 ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

大部分人都会答对大部分题,不要因此而高估自己的水平。因为给出了题目,就给出了启示。重要的是什么呢?是你所有的决策和选择,工作也好,生活也罢,有没有将其融化在内。 ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

我会给答案的,但请不要直接划下去。你还可以回到前面去反复思考。 多写一点相关又不相关的东西吧,这样可以延缓你看到答案的时间。

我有一个朋友,她奉行试验出真知。不能证伪皆为可能。

我奉行逻辑与哲学。逻辑是就是是,不是就是数据是错的。

你很容易发现这一点。

我继续说,我感觉人就应该不断地去干自己不太懂的事情。

她表示赞成,说体验最重要。

我说,我的理由是主要可以避免觉得别人是傻逼。

学习,应该学事物的本质,而不是事物的表现形式。当你回顾过去时,事物表现出了某种形式,但你看向未来时,事物将呈现出无数种可能。而这无数种可能,背后由一种本质决定。 ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

我所有的文章,都是想让你搞明白,你应该做什么,以及为什么这样做。 ‍‍‍‍‍‍‍‍‍‍‍‍‍‍



1、流量质量 vs 风控水平

不要标榜你的风控水平,流量质量好比风控水平高重要一百倍。所以我回复了一个留言说,获客质量的重要性远高于风控,但市场变红海了之后,运营就没啥用了,这是需要认清的客观现实。

如果你不能理解的话,想想这个例子吧。有些机构搞白名单邀请制,它们的风险能高到哪去,它们的风控水平可以说是没有。你再想想黑名单,你要真触及黑灰产了,风控水平高又能好到哪去。

你交朋友,交那些正直的、诚信的、见识广的,你心多大都没关系。交那些卑鄙的、虚伪的、见识浅的,你心眼多也不够。


2、通过率 vs 风险

如果你要看一个业务的风险高还是低,其实,看业务的批核率就行了。

一个业务,如果它的天然批核率很高,那它的风险就一定很低,而如果一个业务的批核率本身到了10%左右,那它的风险肯定是高的。

原因是业务一定是理性的,收益为负的拒绝掉,收益为正的留下来,而不是通过率不断压低,从而获得一个最低的风险。 ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

通过率高是因为风险低,而不是因为通过率低而风险低。因果关系别搞反了。


3、模型效果过拟合

工程实践中,复杂模型往往训练验证效果差异大,简单模型差异小,这是大家都知道的一种过拟合。但如果复杂模型验证集上效果好于简单模型,它几乎会永远好。

根本就不是你以为的,35变到了30,然后很快就28,到25,到23,到20,而27的会永远是27。

过拟合从来不是什么问题。 除非,,,你的数据有问题。

例如企业端贷款,样本太少了,而且一企一策,工商、财报、司法等数据被策略差异化应用,贷后管理也各有不同,结果使得样本特征规律非常混乱。例如企业注册资金、公司股东人数和风险关系不单调。这时候,你去分箱,去用LR,去做简化,不做复杂,避免过拟合,这是对的。

对个人信用贷款,样本规模大,人为干预小,数据规律都有效,模型过拟合根本就不是问题。


4、识别逾期后结清的用户,营销他促活他

这是建模目标的过拟合。它是真正重要的过拟合,而不是上面的建模效果。

表现期Ever逾期但期末不逾期的用户,带来了最大的收益,既得到了利息,还多收了罚息,本金也没有损失。那为什么不能建模预测这部分人,营销他们促活他们呢?

当我们用过去的表现建模预测未来的表现时,我们首先相信的是一点,未来是过去的某种重复。过去好,未来也好,过去坏,未来会坏。但是在逾期后结清上你绝对不相信这一点:逾期后还款的人倾向于一直逾期后还款。

你用计算可以轻易证明。逾期30+后结清的人,未来的风险肯定显著大于大盘的风险。那些某个时点之后逾期又结清的人,并不主要来自过去逾期结清的人,而是由过去的好用户恶化而成。

由于此点论据颇为明显,我就不帮你算了。

建模目标可以是ever逾期,也可以是期末逾期,但不能是ever逾期且期末不逾期。


5、用户变坏的特征

其实我们就是在说bad case分析。请描述你的坏用户的特征,按重要性顺序。

他们都是逾期30+的用户。这,这,这,except this one。我们分析特征是为了事前做管控,逾期30+已经是无奈的事后了。







请到「今天看啥」查看全文