专栏名称: StuQ
实践驱动的IT教育平台
目录
相关文章推荐
超级数学建模  ·  限时领 | ... ·  3 天前  
超级数学建模  ·  燃烧后的火柴为什么能被磁铁吸引? ·  5 天前  
小学数学  ·  奥数课堂:三角形中的风车模型 ·  5 天前  
51好读  ›  专栏  ›  StuQ

手把手教你入门R语言(文末有福利)

StuQ  · 公众号  ·  · 2017-07-01 20:40

正文

作者|谢佳标
编辑|隔壁家的悦姨
R语言是一套开源的数据分析解决方案,几乎可以独立完成数据处理、数据可视化、数据建模及模型评估等工作,而且可以完美配合其他工具进行数据交互。

R语言资深研究者、微软MVP谢佳标老师6.29的免费公开课《1小时入门数据分析利器R语言》堪称火爆,谢老师特意整理出当天直播的课程精要,没赶上直播的小伙伴有福啦!后台回复 “R语言” 领取R语言快速入门》ppt和《R脚本》txt。

R语言的优势

具体来说,R语言具有以下优势:

  • R语言是一款开源软件,使用者可以随意改变源码;

  • R语言可以运行在多个平台上;

  • R语言可以轻松地导入各种不同类型的数据;

  • R语言内置了多种统计学及数据分析功能;

  • R语言拥有顶尖的绘图功能。

当然,R语言也存在一些固有的缺点:

  • R语言是一种解释型语言,和编程语言相比,速度显得略慢;

  • R所有的计算实际基于内存进行的;

  • 由于R语言的自由性,源代码和文档质量良莠不齐。

R & RStudio工具的下载及安装

我们可以在CRAN(Comprehensive R Archive Network)获取最新版本。在https://www.r-project.org/ 页面点击 download R 可以进入CRAN镜像站地址 https://cran.r-project.org/mirrors.html ,其中包含中国大陆地区的7个镜像地址,你可以选择距离你最近的地址进入其镜像的详细页面,通过该页面可以下载Linux、MacOS和Windows操作系统的安装包。


双击下载文件,每次点击下一步就可以完成R的安装。如果你的系统是64位,按照默认安装的话会同时安装32位和64位的R。普通包在这两个R均是通用的,有一些与位数相关的包会要求用不同位数的R运行,比如说rJava包、RODBC包等。我们双击桌面图标启动R,打开如下界面。


R的界面相当简洁,只有为数不多的几个菜单栏和快捷按钮。快捷按钮下面是主控制台,它是输入脚本和执行结果窗口。

与传统的数据挖掘工具SAS、SPSS和IBM SPSS Modeler等软件相比,R的缺点在于没有友好的操作菜单,这会使很多熟悉其他工具的用户起初会觉得很困难。幸好,R自由的特性得到很很好的发挥,有用户贡献的R包实现了很多功能的菜单化操作。下面介绍一个比较友好的编辑器--RStudio。

RStudio可以从其官网 https://www.rstudio.com/ 免费下载安装。一般情况下,下载安装桌面版即可。安装完启动RStudio的基本界面如下所示。


左上方的窗口是文本编辑器,具有强大的功能,我们可以在文本编辑器写好脚本,点击run按钮(或者利用Ctrl+R/Ctrl+Enter快捷键)批量运行代码;右上方的窗口包括当前环境下的信息、历史命令;右下方的窗口是标准的R控制台;右下方的窗口包括文件路径、绘图窗口、已经在本地安装的包信息、帮助文档以及交互绘图时的图形浏览界面。

R语言快速入门,包的安装和使用

R是一种区分大小写的解释型语言,程序内置的函数可以满足基本的数据分析需求,并且有丰富的帮助文档帮助新手快速上手。也有很多用户贡献了高质量的包极大扩展了R的功能。

我们可以在命令提示符(>)后每次输入一条命令,或者一次性执行写在脚本文件里的一组命令。R语言是解释型语言,输入命令后可以实时响应,就好像计算器一样,我们输入完指令点等于号输出计算结果。如果R监测到输入的命令行未结束,就会给出一个提示符“+”,提示我们要在下一行继续输入未完的命令。


R语言的标准赋值符号是

a = 1:10

此时,如果我们想查看对象a,直接输入小写a即可,但由于R是一种区分大小写的解释型语言,此时如果输入大写A,则会报错:


错误: 找不到对象'A'

R提供了大量的帮助文档,学会如何使用这些帮助文档可以让你快速上手。如果你想知道某个函数或者数据集的信息,可以输入一个问号?,后面加上函数名。如果你想查找某个函数,可以输入两个问号??,后面加上与此函数相关关键词。函数help及help.search分别等同于?及??。

例如:

?median # 等价于help("median"),查看中位数函数的帮助文档

??median # 等价于help.serach("median") 搜索包含median的帮助信息

如果你使用的是RStudio,也可以在右下角的help中的搜索框中输入median,查看该函数的帮助文档,如下所示。


默认情况下,help只能查找已经加载到内存中包中的函数和数据,如果我们想查找那些未加载到内存中扩展包的函数和数据,需要指定help函数中的package参数中的具体包名或者将try.all.package参数设置为TRUE。例如我们想查找shiny包中的runExample函数:


包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。R语言的使用,很大程度上是借助各种各样的R包的辅助,从某种程度上讲,R包就是针对于R的插件,不同的插件满足不同的需求,截止目到2016年5月18日,CRAN已经收录了各类包8417个。计算机上存储包的目录成为库(library),该库位于R软件的安装目录/library目录下。我们可以通过函数.libPaths()查看库所在的位置,通过函数library()则可以显示库中已安装的包。

第一次安装一个包,使用命令 install.packages("package_name","dir") 即可。dir:包安装的路径。默认情况下是安装在..\library 文件夹中的。可以通过本参数来进行修改,来选择安装的文件夹。

例如,我们要安装一个可以快速读取大数据集的扩展包data.table,只需要执行install.packages( "data.table")即可完成安装。


程序包‘data.table’打开成功,MD5和检查也通过

下载的二进制程序包在:

C:\Users\Think\AppData\Local\Temp\Rtmpoltpbz\downloaded_packages

我们也可以选择R的菜单:程序包->安装程序包->在弹出的对话框中,选择你要安装的包,然后确定。如果使用的是RStuido,可以选择菜单Tools -> Install Packages调出窗口,包括在线安装和本地安装两种方式,我们选择在线安装,只需要在Packages中输入包名后点击Install进行安装即可。


包安装后,如果要使用包的功能。必须先把包加载到内存中(默认情况下,R启动后默认加载基本包),加载包命令:library(“包名”)或者require(“包名”)。也可以通过RStuido右下窗口中的Packages对包进行加载。默认情况下,扩展包是未加载到内存中的。

直接将data.table前面的勾打上,即可完成包的加载。


了解完R语言的下载、包的安装和使用,你已经敲开了数据挖掘R语言学习的大门啦!不过离真正揭开R语言的面纱还差得远噢~StuQ经过三个月悉心打磨,推出系统学习R语言大课《3个月成为R语言数据挖掘分析师》让你从小白变大师!


除预售立减 2000元 外,谢老师再送 200元本课程优惠码 【U2BLV8P9FE】给大家,仅限前10人使用噢!赶快来抢占座位吧~!

点解「阅读原文」了解课程详情!~