时间
:2017年1月14-16日 (三天)初级;1月18-20日 (三天)高级
地点
:北京市海淀区首都体育学院
费用
:食宿自理
级别
|
费用
|
初级
|
3300元 / 2700元 (仅限全日制本科生及硕士研究生优惠价)
|
高级
|
3600元 / 2900元 (仅限全日制本科生和硕士研究生优惠价)
|
全程
|
6600元 / 5300元 (仅限全日制本科生和硕士研究生优惠价)
|
安排
:
阶段
|
时间
|
上午
|
9:00-12:00
|
下午
|
1:30-4:30
|
答疑
|
4:30-5:00
|
讲师介绍
方匡南老师
厦门大学统计学教授,博士生导师,耶鲁大学博士后。主要研究:数据挖掘、应用统计。
出版了国内第一本R语言中文教程《R语言统计分析软件简明教程》,并于2015年2月出版了《R数据分析:方法与案例详解》,该书在同类书籍中销售名列前茅,并被引入到台湾地区出版。有10多年的R语言使用经验和实际的数据分析经验。曾先后在Journal of Multivariate Analysis 等权威期刊发表论文60多篇。先后主持了多个国家自科、国家社科基金等项目。承担了多个企业数据挖掘项目,有丰富的实战经验。在全国开设了多个公开课,讲课生动活泼、深入浅出、以实际案例引出统计方法,再通过编程讲解实际操作和结果分析,深受学生喜欢。
课程配套资料
-
提供一份精心准备的非常全面的R软件入门讲义。
-
提供课程源代码1份和相应数据若干份。
-
另外提供一份精心整理的R语言常用函数表,内包括统计计量函数表、作图函数表、数学运算函数表、数据导入导出函数表等,可以节省很多查找函数的时间。
Special大礼包
:赠送方老师主讲的R初级和高级视频,价值
1000元
!
R简介
R语言由新西兰奥克兰大学ross ihaka和robert gentleman 开发。R语言是自由软件,可以放心大胆地使用,且具有非常强大的统计分析和作图功能,而且更重要的是R软件具有非常丰富的网上资源,目前R软件有3000多种贡献包,几乎可以实现所有的统计方法,目前大部分的顶级统计学家和计量经济学家都使用R语言,而且越来越多的数据分析实务人员也开始使用R语言。R语言具有简单易学,功能强大,体积小(仅40m左右),完全免费,可自由开发等特点,且R语言和S语言语法基本相同,绝大部分程序是互相兼容的。学习R软件正成为一种趋势。
R软件最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。
——Google首席经济学家Hal Varian
学员对象
金融、医疗、通讯、咨询、电子商务的数据分析人员;高校硕士生、博士生、青年教师、高年级本科生。
培训目的和特色
【初级班】
-
让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。
-
结合统计分析的思想和实际案例,深入浅出地讲解如何使用R语言进行实际数据的统计分析,让学员不仅掌握R语言的使用,更重要的是学会统计分析的思想。
-
学完本课程后,使学员基本上可以使用R语言进行实际的统计分析工作。尤其学会使用R语言对批量处理的实务数据分析,大大提高工作效率。
【高级班】
-
让学员快速入门并熟练掌握R语言,掌握如何利用R丰富的网上资料和帮助系统,学会高级的编程方法。
-
本结合数据挖掘的思想和实际案例,深入浅出地讲解如何使用R语言进行实际数据挖掘。
-
学完本课程后,使学员基本上可以使用R语言进行实际的数据挖掘工作,可以直接应聘各大公司的数据挖掘岗位。
培训内容目录
【初级班】
专题名称
|
授课内容
|
第1讲(3小时)
R语言入门与基本数据分析
|
课程目标:掌握R语言的基本用法和基本数据分析
1.R语言介绍
2.编辑软件Rstudio使用
3.R程序包的载入与使用
4.数据对象及运算(向量、矩阵、数组、列表与数据框处理
|
第2讲(3小时)
数据读入、读出与R基本编程
|
课程目标:掌握用R编写函数和对实际数据描述统计分析
1. R数据读入与读出 (读入txt、xls、SPSS、SAS、stata以及数据库文件)
2.R 函数编写
3.R的条件与循环函数
4.高效编程技巧介绍
5.利用R做迭代优化求解
|
第3讲(3小时)
数据预处理与统计模拟
|
1. 数据预处理
2. 缺失值处理
3. 随机数生成
4. 常用统计方法的蒙特卡洛模拟
5. 随机抽样
案例
:蒙特卡罗模拟的应用
|
第4讲(3小时)
探索性分析与作图
|
1.单变量数据分析与作图
2.双变量数据分析与作图(列联表)
3.多变量数据分析与作图(多变量相关系数矩阵 )
案例分析:
1.统计作图在调查数据中的应用
2.统计作图在临床医学中的应用
|
第5讲(3小时)
线性回归
|
课程目标:掌握线性回归方法与实际的建模分析
1. 一元线性回归
2. 多元线性回归
3. 逐步回归
案例分析
:中国税收收入增长案例分析
|
第6讲 (3小时)
Logistic回归
|
课程目标:掌握logit模型、probit模型和决策树方法以及在信用卡违约预测的应用
1. LPM模型
2. Probit模型
3. Logit模型
案例分析:
1. 新教学方法的效果
2. 信用卡违约预测
|
【高级班】
专题名称
|
授课内容
|
第1讲(3小时)
Poisson回归
分位数回归
|
课程目标:掌握poisson回归模型以及分位数回归在收入分配中的应用
1.Poisson回归模型
2.分位数回归模型
案例
:
1.轮船事故的计数数据模型
2.医疗需求的poisson回归模型
3.恩格尔定律的分位数回归
4.社会保障对家庭消费影响
|
第2讲(3小时)
聚类分析
分类分析
|
课程目标:掌握数据挖掘中常用的聚类和分类方法及其实际应用。
1.系统聚类分析
2.K-means聚类分析
3.决策树分析
4.随机森林分析
案例:
1.信用卡违约预测
2.银行贷款违约预测
|
第3讲(3小时)
主成分分析
因子分析
|
课程目标:掌握数据挖掘中常用的主成分分析与因子分析及其实际应用。
1.主成分分析
2.因子分析
案例:
主成分在综合评价中的应用
|
第4讲(3小时)
变量选择与高维数据
|
课程目标:掌握数据挖掘中高维数据分析方法及其实际应用。
1.LASSO
2.SCAD
3.MCP
4.Group LASSO
案例:
1.基因筛选
2.股票选股
|
第5讲(3小时)
关联规则
高级作图方法
|
课程目标:掌握大数据分析中常用的关联规则方法及其实际中的应用。
1.关联规则方法
2.Aprior算法
3.高级作图方法 ggplot2
案例:
超市购物篮分析
|
第6讲(3小时)
社交网络分析
互动交流讨论
|
课程目标:掌握大数据分析中常用的社交网络分析方法及其实际中的应用。
4.无向社交网络的构建
5.加权社网络的构建
6.社交网络的图像展示
案例
:股票市场社交网络分析
|
优惠: