《金融数据分析》第一期
田野:硕士毕业于新加坡国立大学统计专业。先后在国内外的银行、互联网金融公司工作,有丰富的银行、互联网金融的数据分析经验。期间负责信用风控量化模型的开发,主要用统计模型和机器学习模型对贷款的违约风险和损失进行预测。此外,对银行客群的行为分析也有相关经验,包括流失预警和消费预测等业务场景。
在金融行业中,营销部门和风控部门是两大主要业务部门。本课程将介绍数据分析技术如何应用在营销部门面临的客户流失预警,和风控部门涉及到的零售业违约预测。课程中将使用贴近真实业务场景的数据,并且给出切实可行的解决方法。
1. 对金融业感兴趣,想从事风控或营销业务的学员。
2. 金融行业数据分析从业人员
通过本课程的学习,学员将会收获:
1. 熟悉金融行业业务,助力快速适应金融行业数据分析
2. 掌握客户营销中的流失预警的建模方法,熟悉哪些特征会影响到客户流失
3. 掌握风控业务中的违约预测技术,熟悉构建怎样的特征和模型来降低信贷业务中的违约损失
2017年3月25日,共10次,每次2小时
在线直播,共10次
每周2次(周四、周六晚上20:00-22:00)
直播后提供录制回放视频
可在线反复观看,有效期1年
第一讲:数据分析基本知识复习(2课时)
1. 数据分析的基本概念
a. 目的
b. 数据获取和清理
c. 数据的描述性统计
2. 数据可视化
3. 数据分析的常用模型
a. 监督式模型:(广义)线性回归,决策树,随机森林,支持向量机,神经网络
b. 非监督式模型:聚类分析,因子分析,主成分分析
c. 半监督式模型
4. 数据分析的常用工具
a. R和Python
第二课:银行内客户流失预警模型的介绍(2课时)
1. 银行客群和产品的类别
2. 为什么要做客户流失预警模型
3. 数据介绍和描述
第三课:金融客户流失预警模型中的数据预处理和特征衍生(2课时)
1. 流失数据中的极端值和缺失值的处理
2. 构建流失行为的特征
第四课:GBDT模型在流失预警模型中的应用(2课时)
1. GBDT模型如何应用在金融客户流失预警模型中
2. 如何从客户流失数据中推导GBDT模型的参数
3. GBDT模型对防范客户流失的指导意义
第五课:神经网络模型在流失预警模型中的应用(2课时)
1. 神经网络模型如何应用在金融客户流失预警模型中
2. 如何从客户流失数据中推导神经网络模型的参数
3. 神经网络模型对防范客户流失的指导意义
4. 神经网络模型和GBDT模型在客户流失预警工作中的功效比较
第六课:信用卡账户违约预测模型的介绍(2课时)
1. 信贷违约的基本概念
2. 为什么要做违约预测模型
3. 信贷违约预测模型的特性
4. 数据介绍和描述
5. 非平衡样本问题的定义和解决方法
a. 过抽样和欠抽样
b. SMOTE算法
第七课:违约预测模型中的数据预处理和特征衍生(2课时)
1. 构建信用风险类型的特征
2. 特征的分箱
a. 分箱的优点
b. Best-KS分箱法和卡方分箱法
3. 特征信息度的计算
第八课:违约预测模型中的数据预处理和特征衍生(续,2课时)
1. 分箱后如何编码
a. WOE的概念、优点和计算
2. 信用风险中的单变量分析和多变量分析
第九课:逻辑回归模型在违约预测模型中的应用(2课时)
1. 逻辑回归在违约预测模型中的作用的概述
2. 降维的方法
a. 主成分法
3. 变量选择的方法
a. LASSO方法
b. 逐步回归法
c. 随机森林法
4. 带误判惩罚的逻辑回归模型
第十课:违约预测模型的评价标准(2课时)
1. 模型对违约与非违约人群的区分度
2. 模型的准确度衡量:
a. 尽可能抓住足够多的违约人群
b. 尽可能不误抓非违约人群