刚开始学习数据科学的人都会面对同一个问题:
我给你的建议就是:先学习
R
语言
一、专注于一种语言
在说明为什么你应该学习
R
语言之前,我想强调的是,在开始学习数据科学时,你应该学习一种语言。
有些人问
我是否应该学习在学
R
语言的同时学习
Python
。我的答案基本上是否定的,除非你需要使用一种以上的语言,否则你应该选择一种语言进行学习。
专注于一种编程语言的原因是,你需要更多地关注过程和技术,而不是语法。你需要掌握如何通过数据科学工具来分析数据,以及如何解决问题。事实证明,
R
语言是最佳的选择。
二、最常用的编程语言之一
我建议你将
R
语言作为你的第一个“数据科学编程语言”。虽然也有例外,比如特定的项目需要。
因为
R
语言正在成为数据科学的“通用语言”
这并不是说
R
语言是唯一的语言,也不是说它是每个工作的最佳工具。然而,它是使用最广泛的,而且越来越受欢迎。
O' reilly media
在过去几年中进行了一系列数据科学调查,分析了数据科学趋势。在
2016
年的调查报告中,
R
语言是最常用的编程语言
(
如果排除
SQL
的话,在本文中它不能称为编程语言
)
。
57%
的调查人群使用
R
语言
(
使用
Python
的比例为
54%)
。
另一个常见的语言排名系统是
Redmonk
编程语言排名,它由
GitHub(
代码行
)
和
Stack Overflow(
标签数
)
的流行指数派生而来。截至
2016
年
11
月,
R
语言在所有编程语言中排名第
13
。此外,
R
语言多年来一直呈持续上升趋势
:
此外还有
TIOBE
指数(按搜索引擎搜索次数对编程语言进行排名)。在
TIOBE
指数上,
R
语言十年来呈现出稳定上升趋势。
三、使用
R
语言的公司
在招聘数据科学家的几家顶级公司中,
R
语言使用程度非常高。在我认为现代经济中最优秀的两家公司——
Google
和
Facebook
都有使用
R
语言数据科学家。
除了像
Google
,
Facebook
和微软这样的科技巨头,
R
语言在美国银行,福特,
TechCrunch
,
Uber
和
Trulia
等众多公司都有广泛的应用。
四、
R
语言在学术界和商界都很受欢迎
R
语言不仅仅是一个行业工具。它在学术科学家和研究人员中也非常受欢迎,最近著名《自然》杂志上发表的
R
语言概况也证实了这一点。
R
语言在学术界的备受欢迎,因为它创造了供应行业的人才库。
换句话说,如果最优秀、最聪明的人群在大学学习了
R
语言,这将加大
R
语言在行业中的重要性。当学者、博士和研究人员离开学术界从事商业活动时,他们又将产生对
R
语言人才的需求。
此外,随着数据科学的成熟,商业届的数据科学家将需要与学术届的科学家进行更多的沟通。我们需要借鉴技术和交流观点。随着世界转变为数据流时,学术科学与面向商业的数据科学之间的界线会变得模糊。
五、一点小建议
如果你是初学者,
R
语言是很好的选择。同时需要专注于学习数据科学的技能。
在学习过程中,你可能会看到很多新技术和新工具,或者一些令人眼花缭乱的数据可视化。
看到其他人的成果(并发现他们正在使用不同的工具)可能会导致你想尝试其他的东西。相信我:你需要集中注意力。你需要花上几个月(或更长时间)才能真正投入到一个工具中。
如上所述,如果你确实希望在数据科学工作流程中提高技能。至少在数据可视化和数据处理方面,你得具备扎实的技能。
在
R
语言上花费
100
个小时,将比在
10
个不同工具上各花费
10
个小时得到更高的回报。最后,通过集中精力,你的时间回报率将更高。不要因为
“
最新,最炫的事物
”
而分心。
R语言最近开课:
(CDA LEVEL I R 数据分析)
北京
&
远程:
2017
年
10
月
21
日
~11
月
12
日(四周线下
&
直播)
+
两周线上
授课安排:
现场班
6900
元,远程班
4900
元
(1)
授课方式:面授直播两种形式,中文多媒体互动式授课方式
(2)
授课时间:上午
9:00-12:00
,下午
13:30-16:30
,
16:30-17:00(
答疑
)
(3)
学习期限:现场与视频结合,长期学习加练习答疑。
1.
在线填写报名信息
官网端:
微信端:
2.
给予反馈,确认报名信息
3.
网上缴费
4.
开课前一周发送电子版课件和教室路线图
第一阶段:数据分析概念与
R
编程
第二阶段:数理统计与
SQL
数据库
第三阶段:数理统计与数据可视化
第四阶段:统计推断与精益管理
第五阶段:市场分析方法与模式识别模型
第六阶段:客户分析方法与分类模型
第七阶段:时间序列与综合案例
第八阶段:综合案例分析
第九阶段:
[
线上选修
]Mysql
数据库基础知识(一周)
第十阶段:
[
线上选修
]Tableau
数据可视化(一周)
如果你有
R
语言统计分析和业务分析的基础,对
R
数据挖掘和模型的知识有兴趣,也欢迎报名参加