可能是国内最通俗易懂的数据挖掘课程!
本文不是技术文,也不是经验贴,仅分享CDA一位遍历CDA数据分析员,LEVEL I,LEVEL II SPSS Modeler,Python,SAS等课程的学员心得体会。
有很多小伙伴觉得最近大热的是Python 或者是R,我课程几乎都听过,但最后我却独爱李老师的SPSS Modeler,只有经历过,才知道什么最适合自己,李老师的课给了我很大的自信,也让我在数据分析的道路上不惧困难的越走越远。
李老师是台湾人,说话确实是有一些台腔,但这并不影响听课,因为说话很好听喔,有一种让你想学习听课的魔力,我个人很喜欢。李老师是个很耐心也很可爱的人,他不会说你遇到的提问的问题,是多么浅显,就不会好好回复,我上次因为软件安装盘的问题,分析数据一直报错,我的课就一直卡在那里,没办法继续(我是看的录播,直播没赶得上,很遗憾),我通过课程老师找到李老师,一直再试问题,都晚上十一点多了,才解决好,让我无比感动,在看录播的时候,有同学问的问题很简单,李老师也没有嫌烦,一点一点直到同学可以明白,大家要知道现在很多老师,耐心是很缺乏的,别说简单的问题,就是稍微深一点的问题,他觉得你烦的,一般都会直接忽略,很感激在数据分析的路上可以遇到这样一个好老师。
SPSS Modeler和像Python R这类的软件不太一样,它适合编程基础较弱,或者是没有基础的伙伴们进行数据分析,我是从审计行业想转行的,所以我在二级的道路上一直都比较迷茫,我该学什么软件才好呢,可是我的基础不强,我该怎么办才好呢,别说是其他的SAS 我也听得没SPSS Modeler这么明白,可能是我生性愚钝吧,那些大热的软件,我有些应付不过来,我就想着好好把这个软件学好,以后再去涉及到其他的部分。真正的学习并不是说你学的东西有多热门,你学的东西有多讨人喜欢或者是其他原因,而是适合自己最重要。
我是今年六月的二级,二级的几门课我几乎全报了,像sas、Python我都报了名,可也都跟着听了一遍,老师讲的是很好,但转了一圈,我还是更喜欢李老师的课,我跟课程老师说,李老师还有其他的课程吗?他有什么我就去报什么,没有别的原因,只是因为人格魅力很强。
讲课风趣幽默,能把复杂的东西简单化,这不就是我们想要的学习结果吗?我们不都是想把硬骨头啃下来,以后就会好很多不是吗?
学习了这么久,有一套自己的学习方法才是最重要的,李老师推荐了很多的书都很棒,我准备二级考完好好看一看,光是输入没用,你要去做,转化成输出,知识才真正是你的,要学会内化,总结,不断反省才能成长。
李老师的课,十六个课时,很惭愧我才听了一遍多,第二遍还没有听完,在各个课程的比较中,我也花了不少时间,所以进度有些慢,在第一遍听课的时候可以听慢一些,方便有时间思考和记笔记,到了第二遍的时候,你就可以稍微加快一些进度,这里的加快是指老师讲的一些生活小事我们可以先跳过去不听,毕竟时间有限。考纲这次好像也是李老师出的,深得我心呐。考纲一定要看,至少两遍,不能再少了,我考纲的时间分配是这样的:在开始听李老师课之前,我先看了听了一遍考纲视频,那时候云里雾里的,不过有好处就是带着问题去听课,你更能听明白。第二遍是在你听完第一次课之前,考纲的知识点你就可以拿出来整理和总结了,以前不会的问题,现在应该几乎都能明白,当然一定会有一些依旧不是很会的地方,那第二遍视频就可以开始了,找准目标的听课,比较容易找到答案,不断查漏补缺,才能更好的进步。考纲上的习题一定要看,都是比较简单的基础题。如果之后做题还是有不太会的地方,可以对着考纲找知识点回看,若还是不能明白,建议去找老师解答,不管哪个方向的,找李老师他应该都是很热情的来回答大家的问题。
祝大家都可以考一个好成绩!
小北
2016.6.13
结论:数据分析和数据挖掘更重要的是分析思维,模型原理和对业务的深刻理解应用。软件只是分析的工具,选择合适自己的是最重要的。借用邓小平总理提出的“猫论”,即“不管黑猫白猫,抓得到老鼠就是好猫。”
最后,请允许小编打个广告~~~
CDA level II SPSS modeler 数据挖掘课程,
4月1-6日(连续6天),北京&远程直播,
台湾李御玺老师亲自授课。
一、课程安排
北京&远程:2017年4月01日-4月06日-连续班
授课安排:
(1) 授课方式:周末培训,视频赠送,中文多媒体互动式授课方式
(2) 授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)
(3) 学习期限:现场与视频结合,长期学习加练习答疑。
二、课程大纲
第一阶段:数据挖掘基础
1.数据挖掘在政府及各行业的应用
2.数据挖掘的起源、定义及目标
3.数据挖掘的发展历程
4.数据挖掘的知识发掘步骤(KDD)
5.数据挖掘的产业标准(CRISP DM)
6.数据挖掘的功能分类
7.数据挖掘相关网站介绍
a.案例:信用评等数据集、天气数据集、玻璃制品数据集
第二阶段:基础数据挖掘及数据前处理技术
1.描述性统计分析技术
2.数据可视化技术
3.数据前处理技术
a.案例:新车设计数据集、信用评等数据集
b.案例:药物治疗数据集、电信客户组合营销案例
第三阶段:进阶数据挖掘技术1
1.训练数据与测试数据拆分
2.统计方式的变量选择
a.卡方检定
b.T检验级ANOVA检定
3.模型方式的变量选择
a.决策树算法
b.罗吉斯回归选择法
c.包装法
第四阶段:进阶数据挖掘技术2
1.分类之贝叶斯网络
2.分类之决策树
3.分类模型的评估
a.案例:细胞样本数据集、零售促销数据集、电信客户分类
第五阶段:进阶数据挖掘技术3
1.分类之支持向量机
2.分类之多模型整合
3.预测之简单线性回归、复回归
4.预测之回归树
5.预测之神经网络
6.关联分析:Apriori算法
7.时间序列分析
a.案例:零售购物篮数据集
第六阶段:项目实作案例
1.企业使用之范围:电信商品营销项目
2.企业使用之范围:银行信用评分卡建置
3.企业使用之范围:零售大数据促销项目
三、课程讲师
李御玺
台湾铭传大学教授/中华数据挖掘协会理事
台湾大学博士,在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。 其还兼任厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问。服务过的客户包括:中国工商局、中信银行、台新银行等。
四、报名流程
1.在线填写报名信息(扫描二维码报名)
官网端:
微信端:
2.给予反馈,确认报名信息
3.网上缴费
4.开课前一周发送电子版课件和教室路线图
五、联系我们
电话:010-68411404
手机:13001066694(张老师)
QQ:2881989710
18811331062(田老师)
QQ:2881989709
邮箱:[email protected]
[email protected]
—— Join Learn!