自打微软喊出开源口号的那一天,就一改往日的傲娇,除了自己参与开源还收购了一些开源公司。微软公司还宣布了一系列R语言工具的更新。R语言已经成为其数据战略的重要组成部分,在Azure和SQL Server中均提供了支持(这就是要搞仕途啊!)。更重要的是,在Azure机器学习服务中,
在数据提交到机器学习管道之前,R语言用于预处理数据。
可见,R俨然成为微软关键的跨平台产品之一。
开源的R已经成为数据科学的关键工具(根据IEEE,它目前在所有语言中
排名第五
)
,这其中统计学专家对R格外青睐有加,因为Comprehensive R Archive Network(CRAN,一个R语言应用程序的公共库)现在有超过9,000个统计模块和算法可以使用。
R
是数据科学家的工具。虽然R语言相对简单,但需要对统计分析有深入的了解才能从中获得最大利益。因为许多基本概念需要对复杂统计函数进行研究层面的理解。
问题不在于能否编写R代码,而在于它是否能理解你的思想。
7月22-27日@北京,R语言大牛讲师方匡南教你如何让自己的思想被R完美地展示
时间:
2017
年7月22-24日 (三天)初级;7月25-27日 (三天)高级
地点:
北京市海淀区首都体育学院
费用:
初级:3300元 / 2800元 (仅限全日制本科生及硕士研究生优惠价)
高级:3600元 / 3100元 (仅限全日制本科生和硕士研究生优惠价)
全程:6600元 / 5600元 (仅限全日制本科生和硕士研究生优惠价)
(
食宿自理)
安排:
上午9:00-12:00;下午2:00-5:00;答疑
方匡南老师,统计学教授,博士生导师,耶鲁大学博士后。
2007
年出版了国内第一本R语言中文教程《R语言统计分析软件简明教程》,并于2015年2月出版了《R数据分析:方法与案例详解》,该书在同类书籍中销售名列前茅,并被引入到台湾地区出版。
有10多年的R语言使用经验和丰富的数据挖掘和机器学习实战经验。曾先后在在 Journal of Multivariate Analysis、ScientificReports(Nature子刊)、ComputationalStatistics and Data Analysis等国内外权威期刊发表论文70多篇。先后主持了国家自然科学基金、国家社科基金等多个项目。承担了多个企业数据挖掘项目,有丰富的实战经验。
长期讲授《R数据挖掘》、《R机器学习》等课程,讲课生动活泼、深入浅出、以实际案例引出统计方法,再通过编程讲解实际操作和结果分析。
(1)提供一份精心准备的非常全面的R软件入门和数据挖掘与机器学习讲义。
(2)提供课程源代码1份和相应数据若干份。
Special
大礼包:
赠送方老师主讲的R初级和高级视频,价值1000元!
【初级班】
(1)让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。
(2)结合统计分析的思想和实际案例,深入浅出地讲解如何使用R语言进行实际数据的统计分析,让学员不仅掌握R语言的使用,更重要的是学会统计分析的思想。
(3)
学完本课程后,使学员基本上可以使用R语言进行实际的统计分析工作。尤其学会使用R语言对批量处理的实务数据分析,大大提高工作效率。
【高级班】
(1)让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会高级的编程方法。
(2)本课程结合数据挖掘的思想和实际案例,深入浅出地讲解如何使用R语言进行实际数据挖掘。
(3)
学完本课程后,使学员基本上可以使用R语言进行实际的数据挖掘工作,可以直接应聘各大公司的数据挖掘岗位。
【初级班】
第1讲 (3小时)R语言入门
目标:
掌握R语言的基本用法
1.R语言介绍
2.编辑软件Rstudio使用
3.R程序包的载入与使用
4.数据对象及运算(向量、矩阵、数组、列表与数据框处理)
第2讲(3小时)数据读写,R基本编程
目标:
掌握用R编写函数和数据的读写
1. R数据读入与读出 (读入txt、xls、SPSS、SAS、stata以及数据库文件)
2.R 函数编写
3.R的条件与循环函数
4.高效编程技巧介绍
5.利用R做迭代优化求解
第3讲(3小时)数据预处理,探索性分析
目标:
掌握数据预处理与探索性分析
1. 数据预处理
2. 缺失值处理
3. 随机数生成
4. 常用统计方法的蒙特卡洛模拟
5. 随机抽样
6.单变量数据分析与作图
7.双变量数据分析与作图
8.多变量数据分析与作图
案例1:
统计作图在调查数据中的应用
案例2:
统计作图在临床医学中的应用
第4讲(3小时)数据挖掘与机器学习入门,KNN方法
目标:
数据挖掘与机器学习入门介绍
1.何为数据挖掘与机器学习
2.数据挖掘与机器学习的主要研究内容
3.有监督学习与无监督学习区别