专栏名称: 经管之家
经管之家官微,每个经济、管理、金融、统计的学习和从业者,都应该有的帐号。经管之家(论坛),是国内成立十年的大型经济、金融、管理、计量统计社区,十年磨一剑,我们共同的家园!我们提供“经管爱问”答疑微服务,以及相关数据分析及金融培训课程。
目录
相关文章推荐
有限次重复博弈  ·  长安居然有一款跑前面去了,这款车有什么特别的 ... ·  5 小时前  
21世纪经济报道  ·  王健林,突发! ·  昨天  
洪灝的宏观策略  ·  下周开会,老马识途。市场将怎么走? ... ·  2 天前  
有限次重复博弈  ·  第二届中国智驾大赛截至2024年12月已举办 ... ·  2 天前  
21世纪经济报道  ·  突传噩耗!她因流感去世,年仅41岁 ·  3 天前  
51好读  ›  专栏  ›  经管之家

16年R语言平均薪酬最高 R数据挖掘现场+远程11月25开班 年前最后一次课

经管之家  · 公众号  · 财经  · 2016-11-21 10:55

正文

大数据的浪潮仍在继续,在巨大的数据集中进行筛选的最好工具是什么?

如果R语言排第二,那就没其他能排第一。自1997年以来,作为昂贵的统计软件,如Matlab和SAS的免费替代品,它渐渐风靡全球。

在过去的几年时间中,R语言已经成为了数据科学的宠儿——数据科学现在不仅仅在书呆子一样的统计学家中人尽皆知,而且也为华尔街交易员,生物学家,和硅谷开发者所家喻户晓。各种行业的公司,例如 Google,Facebook,美国银行,以及纽约时报都使用R语言 ,R语言正在商业用途上持续蔓延和扩散。

R语言有着简单而明显的吸引力。 使用R语言,只需要短短的几行代码,你就可以在复杂的数据集中筛选,通过先进的建模函数处理数据,以及创建平整的图形来代表数字。

Packt,一个电子书网站,发布了2016年技术提高的调查报告,涉及来自世界各地的11500名开发人员。平均年薪薪酬最高的语言是: R——$ 60,000

(以上资料摘自码农网http://www.codeceo.com/)


掌握R这门语言工具 进行数据挖掘的案例实战班

就在11月25日


并且第一次同步北京的现场班开设了远程,

一部电脑就可以学习这门包含25个案例的课程:


时间: 2016年11月25-28日 (四天)

地点: 北京市海淀区厂洼街3号丹龙大厦/远程同步

安排: 上午9:00-12:00;下午1:30-4:30;答疑4:30-5:00

费用: 现场:4500元/3600元 (仅限全日制本科生及硕士研究生优惠价);

食宿自理

远程: 3600元

优惠: 现场班老学员9折优惠;

同一单位3人以上同时报名9折优惠;

同一单位6人以上同时报名8折优惠;

折扣优惠不叠加。

Gino Chin老师,名校数学与应用数学专业学士和统计学专业硕士毕业,有海外学习和工作的经历,近二十年来一直进行着数据分析的理论和实践,数学、统计和计算机功底强悍。


曾在某一世界500强公司核心部门担任高级主管负责数据建模和分析工作,并为多家500强企业做过内训及项目,在实践中攻克统计建模和数据分析难题无数,数据处理与分析科学精准,在实际应用中取得良好的效果。

课程简介

本课程结合讲师的学习和工作经验,把R语言和数据挖掘的基本知识和重点难点很好的结合,注重学以致用,按照由深入浅的方式,层层推进使得学员拾阶而上的逐级掌握相关内容。


课程内容涵盖了R语言和数据挖掘的精华,无论是流行的数据挖掘方法,还是前沿的算法均有所涉及,课程中提供了大量丰富的案例,这些案例,集合了互联网、市场营销、金融保险等领域的数据挖掘实例,无疑对学习和工作有极大的参考和指导意义。

教学大纲

第一讲:R语言精要

本着循序渐进而又覆盖R语言重要而有用的基本内容原则,本讲从R语言入门开始,以前期的数据处理为核心,以实际案例为载体,内容包括R语言的向量、数据框、矩阵运算、缺失值和零值的处理、特别注重用R语言构造函数编程解决实际问题,详细介绍强大的数据清洗整理plyr、zoo、car等常用包和强大的作图ggplot2包,为使用R语言进行数据挖掘打下扎实的工具基础。

主要案例:

案例1:如何用R语言plyr等包合并、排序、分析数据并编制香农-威纳指数;

案例2:如何用R语言编程同时实现几十个高难度数据分析可视化图片的jpeg格式输出;

案例3:如何使用R语言进行分层或者整群抽样构建训练集与测试集;

案例4:使用ggplot2画出各种复杂的图形。

第二讲:Logistic回归与商业大数据建模

Logistic回归是商业建模的常用重要数据挖掘方法,本讲要讲清楚Logistic回归的建模原理、与多元线性模型的区别、R语言实现过程及回归诊断注意事项、预测方法和结果解释,让学员彻底地掌握Logistic回归解决问题的R语言方法。

主要案例:

案例1:利用Logistic回归帮助商业银行完成对客户提前还贷款情况的预测;

案例2:利用Logistic回归帮助医生对病人选择最佳治疗方案;

案例3:利用Logistic回归帮助厂家分析顾客做出购买决策的重要因素;

案例4:利用Logistic回归帮助寿险公司进行目标客户精准电话营销;

案例5:利用Logistic回归帮助商业银行完成对客户的信用评分;

案例6:利用Logistic回归帮助公司分析客户流失的原因并做好预测。

第三讲:关联规则和R语言实现

关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法和eclat算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析。

主要案例:

案例1:使用R语言关联规则方法帮助各个超市实现商品的最佳捆绑销售方案(即“购物篮”分析);

案例2:泰坦尼克号乘客幸存的关联规则分析;

案例3:提高个人收入的关联分析。

第四讲:决策树(回归树)分析和R语言实现

决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C4.5算法,使用rpart和J48函数进行R语言分析。

主要案例:

案例1:对汽车耗油量进行决策树分析并完成相关目标变量的预测;

案例2:使用决策树帮助电信局判断和预测客户办理宽带业务。

第五讲:机器集成学习的Bagging和AdaBoost算法

这两种方法将许多分类器的预测结果进行汇总分析,从而达到显著提升分类效果。本讲介绍这2种算法的思想,在R语言中构造训练集和测试集进一步进行分析。

主要案例:

案例1:用R语言的Bagging和AdaBoost进行商业银行定期存款的分析和预测;

案例2:用R语言的Bagging和AdaBoost识别有毒蘑菇。

第六讲:R语言随机森林(RandomForest)算法

在机器学习中,随机森林是一个包含多个决策树的分类器,本讲讲清随机森林方法的原理,以致在实际中帮助学员判断适合进行随机森林分析的情况,最终熟练掌握R语言随机森林分析的方法。

主要案例:







请到「今天看啥」查看全文