R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
从R的普及来看,国外的普及度要明显好于国内,跟盗版windows的泛滥会影响linux在中国的普及一样的道理,破解的SAS与SPSS的存在也影响了R在中国的使用人群。但在国外高校的统计系,R几乎是一门必修的语言,具有统治性的地位。在工业界,作为互联网公司翘楚的google内部也有不少的工程使用R进行数据分析工作。那么,如果你是一个R入门的新手,你可能会存疑,如果对于没有编程经验的人来说,R是否很难掌握?
1,学R的价值要看你未来的工作中涉及到数据的难度和频繁程度。如果你的职业生涯永远只是偶尔用一下透视表这种难度和频度,那你可以不学R。如果你会更频繁的使用重复性简单的数据操作,或者更深入的探索数据,那你需要R。R不止是统计中用到,它同样可以看作是一个脚本语言,一个比excel强大很多的工具,会让你在前期投入的时间得到回报。Head first data analysis这本书最后就谈到了R,可以看看它的建议。
2,学习R的前期难度是一般的语法规则,这并不太难,到后期真正比较难的是背后的理论知识。SPSS这种软件把理论包装成一个菜单点击,这很方便初学者,但也隐藏了理论上的为什么。这类菜单点击软件就好像是跟团旅游,方便、省心、适合新手,但不够深入。R语言就好像是自由行,自由、灵活、定制性强,但对自身的能力要求高。SPSS就像一把砍刀,简单好用,但等你功力提升后就没有兴趣再用它。R就是一柄剑,它需要使用者有足够的内力(理论)去使用它,而且是使用在合适的场景下,功力不足者容易受伤。
3,我鼓励题主学习R这样的强大工具来优化自己的思维方式,不过有一个前提是,最好是先把计算机本身弄熟练一些,再使用计算机中更加高级的工具,例如先把Excel这种容易上手、可见即可得的工具掌握熟练一些(先满足务实的基本需求),之后才比较容易上升到较为抽象的编程世界(再满足更高层次的精神需求)。
总之,因此,我对「对于没有编程经验的人,R语言是否很难掌握?」这个问题的回答是「比较难」。就好像「对于没有游泳经验的人,游泳是否很难掌握?」「对于没有素描经验的人,素描是否很难掌握?」「对于没有炒股经验的人,炒股是否很难掌握」,回答都是「如果只是跳进去泡两下」「如果只是勾几笔」「如果只是下单撤单」,那么回答就是「很简单」;如果真的要严肃的「游泳」「素描」「炒股」...天下的任何事情,回答都是「比较难」。
如果不是「比较难」的话,那么R在数据科学中领域中的薪资回报就不可能是最高的了。
如果你有足够的信心和需求去挑战这一门有魅力的语言。CDA数据分析师讲师团队致力于开发最领先的数据分析专业和行业应用教育,针对R语言系列,开设了CDA LEVEL I R 数据分析和LEVEL II R数据挖掘两个专题的课程,并通过实际的金融、电信、市场调研、客户关系等案例演练,让学员真正体验数据分析与R语言的魅力。新手完全能够通过本课程学习,成长为优秀的R语言数据分析行家。
R语言最近开课: (CDA LEVEL I R 数据分析)
深圳:2017年4月22日~5月14日(周末8天)
北京&远程:2017年5月06日~5月29日(周末8天)
授课安排:现场班6900元,远程班4900元
(1) 授课方式:面授直播两种形式,中文多媒体互动式授课方式
(2) 授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)
(3) 学习期限:现场与视频结合,长期学习加练习答疑。
1. 在线填写报名信息
官网端:
微信端:
2. 给予反馈,确认报名信息
3. 网上缴费
4. 开课前一周发送电子版课件和教室路线图
第一阶段:数据分析概念与R编程
1.商业数据分析的本质
2.R介绍、R与RStudio安装
3.R语言编程与数据整合
4.R基本数据类型
5.R基本数据结构
6.R程序控制
7.函数与包
8.数据合并与规整
第二阶段:数理统计与SQL数据库
1.R语言编程与数据整合
2.SQL及关系型数据库基本概念
3.SQL语言与R SQL实现
4.描述性统计分析和特征选取
5.描述统计与探索数据分析
6.APPLY函数族
7.R基础绘图包
a.案例:畅销品分析
b.案例:产品销售情况指标分析
第三阶段:数理统计与数据可视化
1.描述性统计分析和特征选取
2.GGplot2绘图介绍
3.使用SQL进行数据汇总
4.统计推断基础
5.假设检验与单样本T检验
6.两样本T检验
7.方差分析
a.案例:产品销售情况指标展现
b.案例:房价影响因素分析
第四阶段:统计推断与精益管理
1.统计推断基础
2.相关分析、卡方检验
3.简单线性回归
4.精益化管理
5.Dashboard 设计与应用
6.特设分析(Ad Hoc Analysis)
7.对比测试(A/B testing)
a.案例:基于宏观经济指标的产品产量预测模型
b.案例:注册方式对客户转化率的影响
第五阶段:市场分析方法与模式识别模型
1.市场调研与数据采集方法
2.连续变量间关系探索与压缩
3.聚类分析(客户分群)
4.对应分析与多维尺度
a.案例:信贷综合打分
b.案例:各地经济发展数据分析
第六阶段:客户分析方法与分类模型
1.线性回归介绍
2.线性回归诊断
3.分类变量分析
a.案例:信用卡客户价值预测
b.案例:电信客户流失预测
第七阶段:时间序列与综合案例
1.时间序列的定义
2.指数平滑法
3.时间序列模型ARIMA方法
4.信用卡产能预测案例
5.营销效果评估
6.某品牌香烟市场调研案例
7.业务数据分析师课程总结
a.案例:人口数据预测
b.案例:航空公司客运量预测
如果你有R语言统计分析和业务分析的基础,对R数据挖掘和模型的知识有兴趣,也欢迎报名参加R数据挖掘的课程:
http://www.cda.cn/kecheng/31.html
1级2级连报更有8折优惠!
常国珍
CDA数据分析师讲师/北京大学商学博士
曾就职于亚信科技商业运营咨询部(BOC)、方正国际金融事业部、德勤管理咨询信息技术系统咨询部,多家金融信息部门和金融高科技公司数据分析顾问。主要从事征信数据集市与信用风险建模、客户价值提升等项目。擅长将基于个体行为分析的微观经济学研究范式与量化模型向结合的客户终身价值建模。
曾珂
CDA数据分析研究院讲师/管理科学工程硕士
从事数据分析与数据挖掘的研究与教学,研究方向为互联网、电子商务数据分析与挖掘,擅长基于客户关系管理的数据挖掘、数据可视化、文本挖掘。
电话:010-68411404
手机:18010006628(陈老师)
QQ:2881989709
13001066694(张老师)
QQ:2881989710
邮箱:[email protected]
[email protected]
—— Join Learn!