专栏名称: 雷帅快与慢
经验让工作更简单,风控让人生更自由。
51好读  ›  专栏  ›  雷帅快与慢

为什么模型快速迭代不一定有效

雷帅快与慢  · 公众号  ·  · 2024-06-28 12:07

正文

严格一点,我想说的是,模型快速迭代基本是无效的。适用场景是风控模型,什么是快速我不能给你明确定义,但是按周按月一定在里头。‍‍‍‍‍‍‍‍‍‍
我来论证下这个观点,目的呢,一个是让你别去瞎搞,另一个是让你别去信别人的瞎搞。
我对风控的写作一直是哲学艺术层面的,技术层面的我不能写,也不想写。你不用太相信数据,因为数据有适用性,不一定是定论,但你可以相信我。
那就先来哲学层面的吧。‍‍
论据一:信用是稳定的,那么信用模型也应该是稳定的。‍‍‍‍
信用是稳定的,这句话是可以直接在前面用 这个数学符号的, 才有所谓的无信不立,那信用模型应该是很稳定的。但是风险模型却要频繁迭代,那只有一个解释,那就是风险模型的建模目标不等同于信用,而是信用的一个表示,它具备一定的不稳定性。
但总归这个事情是比较稳定的,所以风控模型没必要过于频繁迭代,像搜广推那样。
你得有个度。至于这个度具体是什么,当然也没有定论。我只能说,当你感到不对劲的时候,很可能就真的没有用,如果你对自己的能力有信心的话。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
其实上面有几个字很重要: 建模目标不等同于信用,而是信用的一个表示 。它解释了风险表现的不确定性,因为当A是B的一种表示时,就意味着A是实例而不是B本身,还可以有别的表示。风险呈现了什么样的形态,由用户、平台、市场环境等多方面确定。‍‍‍‍‍‍‍‍‍‍‍
论据二:动量策略不一定适用于信贷风控领域。‍‍‍‍‍‍‍
固定策略下,一万个用户通过了,用前八千样本和后八千样本建模有区别吗?没有区别,因为这里不受策略影响。
当然你硬要说的话,还有一个因素是时间。这个当然是可忽略不计的,行吧,我们也别忽略不计。
时间,可能会使得这两者建模有差别,但却不一定是哪个好哪个坏。用后八千样本建模更好的可能性稍微大一点点,这是认为用最近的样本建模用于未来的预测是更好的。 这就是动量策略,其思想是趋势总是倾向于继续。 神经网络中的动量优化算法核心思想也是如此。‍‍‍‍‍‍‍‍‍‍‍‍
如上图,斜线和波动线,动量策略效果会差别很大。实际上,除非把波动线切分地足够细,不然,它是不适用的。
信贷市场环境是斜线还是波动线呢?‍‍‍‍‍‍
动量策略还存在一个更大的问题是,风险预测里有一个很长的表现期,例如mob6甚至mob12,也就是说你的样本离现在已经隔了半年甚至一年了。因为这个gap的存在,动量还行不行实际上很不好说。gap一长也可能是周期你说对不对。






请到「今天看啥」查看全文