专栏名称: 雷帅快与慢
经验让工作更简单,风控让人生更自由。
目录
相关文章推荐
彼岸的潘恩  ·  真被国货惊到了!59元蓝牙音响竟还能语音识别 ... ·  6 小时前  
彼岸的潘恩  ·  真被国货惊到了!59元蓝牙音响竟还能语音识别 ... ·  6 小时前  
CINNO  ·  诺视Micro-LED微显示芯片量产线投产 ·  3 天前  
爱否科技  ·  【广告】爱否回收,欢迎比价 ·  4 天前  
爱否科技  ·  三星 Galaxy Z ... ·  3 天前  
51好读  ›  专栏  ›  雷帅快与慢

什么是好算法

雷帅快与慢  · 公众号  ·  · 2024-08-28 16:09

正文

其实,在应用科学领域,这是最微不足道的。 AI ,就是数学的游戏,这不能算贬义,因为数学真的是皇冠。

算法带来的超额效果很小。除了逻辑回归复杂度较低之外, xgb lgb ,神经网弱等学习能力都很强,算法的增益几乎可以忽略不计。

选择算法,最重要的是考虑部署问题。如果你们工程上只会逻辑回归的线性计算,那你就只能选逻辑回归。选择别的算法,要先解决工程问题。但其实都好解决,也不好解决,主要看系统能力,其次看个人能力。

从线性和非线性的角度说吧,逻辑回归当然是线性的,神经网络和树模型是非线性的。这个问题带来的结果是,线性的需要分客群,非线性的可能可以不特别需要分客群。为什么?

ln(odds)=a1x1+a2x2+... 你看表达式就知道了, 不同客群的系数矩阵 A 肯定是不一样的,实际上连组成 X 矩阵的 woe 值都不一样。不一样的表达式,采用线性的方式强行合成一个,肯定是有损的。

那树模型呢?分客群可以看作第一层分裂进行了手动分群,其实还不如不分,留给算法自己分。如果你保证总的复杂度不变的话,我相信算法自己分效果会更好。

也就是说,假如分了 n 个客群,建了 n 个模型,对比的那一个不分客群的模型,在相同的参数下,评估器的数量应该乘以 n

我们这里说的是做模型分不分客群。建模不分客群不代表策略不分客群,做策略的时候自行去划分就好了。







请到「今天看啥」查看全文