2017年6月9日,第八期CDA数据分析业班学员毕业答辩成功举办,现将优秀学员作品分享出来,以飨读者。
数据为2009-2016年某商业银行中部分客户的基本交易情况,主要含交易信息、人口基本属性以及相关衍生变量,行方想根据既有信息,推出一款理财产品-'g基金',根据以上信息,想知道哪些客户是他们的目标客户。
此数据缺失值极多,数据不平衡,并且变量过多易陷入虚拟变量陷阱。因此首先采用欠采样将响应变量控制在1:5;然后使用随机森林和WOE算法进行变量筛选;最后填补缺失值处理异常值。之后应用logistic回归在训练组得出模型,再用测试组检验模型。
给出的模型AUC值适中,预测合理,模型比较稳健。同时,这是一个结构模型,可分析自变量的偏效应,更便于模型落地。
感谢第八期CDA数据分析就业班学员第四、五组同学带来的精彩分享!
PS:想要获取「答辩完整视频和PPT」,请加入QQ群:171896680,下载链接见群公告
CDA数据分析就业班是为解决当下企业招人难、学员就业难的问题所研发的精品课程。课程以数据分析理论与实践案例结合的方式讲授,内容覆盖了国内企业招聘数据分析师岗位所需的技能,学员经过三个月系统全面的脱产学习(统计学、Excel、SQL、SPSS、SAS、R、Python),达到企业用人标准,快速在大数据时代找准工作定位。
第一阶段:Excel数据分析(5天)
第二阶段:数据分析理论基础(5天)
第三阶段:数据库管理(4天)
第四阶段:SPSS数据分析(10天)
第五阶段:数据挖掘实战案例(3天)
第六阶段:R语言数据分析(13天)
第七阶段:案例分析实战(5天)
第八阶段:SAS数据挖掘/python数据分析(15天)
(1) 各行业数据分析、数据挖掘从业者 ;
(2) 在校数学,经济,计算机,统计等专业教师和学生 ;
(3) 经济,医学生物研究院科研人员 ;
(4)数据分析,数据挖掘兴趣爱好者及转行人士。
六期CDA大数据就业班6月18日于北京开课(仅有少量名额)
十一期CDA数据分析就业班6月25日于北京开课(现场还有5个名额)
十二期CDA数据分析就业班7月9日于深圳开课(现场还有10个名额)
十三期CDA数据分析就业班7月23日于上海开课
点击阅读原文了解课程详情
快点加入我们,一起玩转数据分析吧!
电话:010-53605625
手机:18810531180(曹老师)
QQ:2881989706
邮箱:[email protected]