专栏名称: 经管之家
经管之家官微,每个经济、管理、金融、统计的学习和从业者,都应该有的帐号。经管之家(论坛),是国内成立十年的大型经济、金融、管理、计量统计社区,十年磨一剑,我们共同的家园!我们提供“经管爱问”答疑微服务,以及相关数据分析及金融培训课程。
目录
相关文章推荐
南半球聊财经  ·  扒一扒一些省市已公布的财政账本 ·  2 天前  
互联网那些破事  ·  公告!苏宁集团破产重整 ·  2 天前  
互联网那些破事  ·  公告!苏宁集团破产重整 ·  2 天前  
神嘛事儿  ·  我回答了 @似火流云2016 ... ·  2 天前  
神嘛事儿  ·  我回答了 @告诉你别惹我z ... ·  2 天前  
21世纪经济报道  ·  突然大批涌现!有人几天收入超5万元,事关De ... ·  4 天前  
51好读  ›  专栏  ›  经管之家

为什么R语言是学习数据分析的第一选择

经管之家  · 公众号  · 财经  · 2017-10-09 11:08

正文

刚开始学习数据科学的人都会面对同一个问题:

不知道该先学习哪种编程语言。

我给你的建议就是:先学习 R 语言


一、专注于一种语言


在说明为什么你应该学习 R 语言之前,我想强调的是,在开始学习数据科学时,你应该学习一种语言。


有些人问 我是否应该学习在学 R 语言的同时学习 Python 。我的答案基本上是否定的,除非你需要使用一种以上的语言,否则你应该选择一种语言进行学习。

专注于一种编程语言的原因是,你需要更多地关注过程和技术,而不是语法。你需要掌握如何通过数据科学工具来分析数据,以及如何解决问题。事实证明, R 语言是最佳的选择。

二、最常用的编程语言之一


我建议你将 R 语言作为你的第一个“数据科学编程语言”。虽然也有例外,比如特定的项目需要。


因为 R 语言正在成为数据科学的“通用语言”


这并不是说 R 语言是唯一的语言,也不是说它是每个工作的最佳工具。然而,它是使用最广泛的,而且越来越受欢迎。


O' reilly media 在过去几年中进行了一系列数据科学调查,分析了数据科学趋势。在 2016 年的调查报告中, R 语言是最常用的编程语言 ( 如果排除 SQL 的话,在本文中它不能称为编程语言 ) 57% 的调查人群使用 R 语言 ( 使用 Python 的比例为 54%)


另一个常见的语言排名系统是 Redmonk 编程语言排名,它由 GitHub( 代码行 ) Stack Overflow( 标签数 ) 的流行指数派生而来。截至 2016 11 月, R 语言在所有编程语言中排名第 13 。此外, R 语言多年来一直呈持续上升趋势 :



此外还有 TIOBE 指数(按搜索引擎搜索次数对编程语言进行排名)。在 TIOBE 指数上, R 语言十年来呈现出稳定上升趋势。

三、使用 R 语言的公司


在招聘数据科学家的几家顶级公司中, R 语言使用程度非常高。在我认为现代经济中最优秀的两家公司—— Google Facebook 都有使用 R 语言数据科学家。

除了像 Google Facebook 和微软这样的科技巨头, R 语言在美国银行,福特, TechCrunch Uber Trulia 等众多公司都有广泛的应用。

四、 R 语言在学术界和商界都很受欢迎


R 语言不仅仅是一个行业工具。它在学术科学家和研究人员中也非常受欢迎,最近著名《自然》杂志上发表的 R 语言概况也证实了这一点。


R 语言在学术界的备受欢迎,因为它创造了供应行业的人才库。


换句话说,如果最优秀、最聪明的人群在大学学习了 R 语言,这将加大 R 语言在行业中的重要性。当学者、博士和研究人员离开学术界从事商业活动时,他们又将产生对 R 语言人才的需求。


此外,随着数据科学的成熟,商业届的数据科学家将需要与学术届的科学家进行更多的沟通。我们需要借鉴技术和交流观点。随着世界转变为数据流时,学术科学与面向商业的数据科学之间的界线会变得模糊。

五、一点小建议


如果你是初学者, R 语言是很好的选择。同时需要专注于学习数据科学的技能。

在学习过程中,你可能会看到很多新技术和新工具,或者一些令人眼花缭乱的数据可视化。


看到其他人的成果(并发现他们正在使用不同的工具)可能会导致你想尝试其他的东西。相信我:你需要集中注意力。你需要花上几个月(或更长时间)才能真正投入到一个工具中。


如上所述,如果你确实希望在数据科学工作流程中提高技能。至少在数据可视化和数据处理方面,你得具备扎实的技能。

R 语言上花费 100 个小时,将比在 10 个不同工具上各花费 10 个小时得到更高的回报。最后,通过集中精力,你的时间回报率将更高。不要因为 最新,最炫的事物 而分心。

R语言最近开课:

(CDA LEVEL I R 数据分析)


一、课程信息

北京 & 远程: 2017 10 21 ~11 12 日(四周线下 & 直播) + 两周线上

授课安排: 现场班 6900 元,远程班 4900

(1) 授课方式:面授直播两种形式,中文多媒体互动式授课方式

(2) 授课时间:上午 9:00-12:00 ,下午 13:30-16:30 16:30-17:00( 答疑 )

(3) 学习期限:现场与视频结合,长期学习加练习答疑。

二、报名流程

1. 在线填写报名信息

官网端:


微信端:


2. 给予反馈,确认报名信息

3. 网上缴费

4. 开课前一周发送电子版课件和教室路线图

三、课程大纲

第一阶段:数据分析概念与 R 编程

第二阶段:数理统计与 SQL 数据库

第三阶段:数理统计与数据可视化

第四阶段:统计推断与精益管理

第五阶段:市场分析方法与模式识别模型

第六阶段:客户分析方法与分类模型

第七阶段:时间序列与综合案例

第八阶段:综合案例分析

第九阶段: [ 线上选修 ]Mysql 数据库基础知识(一周)

第十阶段: [ 线上选修 ]Tableau 数据可视化(一周)

如果你有 R 语言统计分析和业务分析的基础,对 R 数据挖掘和模型的知识有兴趣,也欢迎报名参加







请到「今天看啥」查看全文