专栏名称: 生信学霸
生物信息学笔记,学习每一个软件的各种心得,分享快速做分析的技巧,分享生信分析文献,一个从业十年的生信人的所感所惑,偶尔撒泼一下!
目录
相关文章推荐
直播海南  ·  近期大量上市,多人吃进急诊室!紧急提醒→ ·  22 小时前  
直播海南  ·  海南省中小学校学生欺凌预警平台投入使用 ·  3 天前  
直播海南  ·  事关电动自行车以旧换新补贴!最新提醒→ ·  3 天前  
51好读  ›  专栏  ›  生信学霸

【附文档】R语言绘图快速入门第一弹——必备工具安装和基础语法

生信学霸  · 公众号  ·  · 2024-11-18 15:00

正文

R语言是一种用于统计计算和图形的编程语言和软件环境,全称为“The R Project for Statistical Computing”。它是一种高级语言,语法简单,易于学习和使用。相比其他编程语言,R语言的数据可视化能力更为强大,可轻松实现复杂图形绘制。目前,R语言在各个领域应用广泛,尤其在科研绘图领域,它被视为首选工具。

分析有术、思路创新

更多个性化生信分析方案

扫码咨询,获取您的专属私人定制!


一、 安装R、Rtools和RStudio

1、安装R

https://cran.r-project.org/mirrors.html 中选择任意国内镜像,Windows系统电脑系统点击“Download R for Windows”(苹果电脑选择macOS),点击“base”选择“Download R-4.4.2 for Windows”进行下载。

双击运行“R-4.4.2-win.exe”,默认语言为简体中文,一直点击下一步直至结束。若想更改安装路径,需要注意路径内不要出现中文、空格、引号等特殊字符。


2、安装Rtools

在进入镜像后,点击“Rtools”,选择与R一样的的版本号,点击“Rtools44 installer”进行下载。

注意: 电脑处理器为ARM就下载后面那个,处理器信息可以通过设置➡关于或者按Win+R,输入msinfo32,按回车键看系统信息;笔记本可以直接看键盘面板下面贴的图标。

下载完成后,双击运行,一样是一直点击下一步直至结束。若想更改安装路径,需要注意路径内不要出现中文、空格、引号等特殊字符。


3、安装RStudio

在官网( https://posit.co/download/rstudio-desktop/ )点击“Download RStudio Desktop for windows”下载RStudio。

下载完成后,双击运行,同样是一直点击下一步直至结束。

运行RStudio,点击Tools➡Global Options➡Packages,选择中国的镜像,以免下载R包时用的国外镜像导致网络一直连不上。

RStudio界面可以分为四个区域,一般我们在代码编写区域撰写代码,运行区域显示代码运行结果。其中,代码运行去也可输入单行代码进行运行测试或者查看路径、R版本、变量信息等。

第一次打开RStudio界面看不到代码编写区域,需要新建一个R文件或者用RStudio打开一个R文件。下次再打开时,RStudio界面会记住之前的操作,直接打开上次的文件。其他更详细的RStudio使用方法,大家可以直接在网上进行搜索,这里不再赘述。


二、基础语法

1、变量赋值

当我们手上有好几个数据时,为了让软件知道具体要用哪一个数据,我们需要给这些数据取名字。名字就相当于变量名称,变量则是数据存储的位置。当我们要用到名称为“String”的变量数据时,只要把这个名字写给软件,软件就会按照这个名称去对应的数据存放位置,把数据拿出来给我们。变量名称有问题时,我们就无法获得数据进行后续操作,因此变量赋值是最基本也是最重要的一步。

在R语言中,有效的变量名称由字母,数字以及点号.或下划线_组成,但它不能以数字或一个点后跟数字开头。当然,系统的保留字也是不允许的,如 if 和 for 。

我们可以用 给变量赋值, 首选是。<


2、数据类型

R的最基本数据类型主要为三种:数字(Number)、逻辑(Boolean)和文本(Character)。

⚫数字类型:用于存储整数和浮点数。

⚫逻辑类型:用于存储布尔值TRUE和FALSE。

⚫文本类型:常用于存储字符串,字符串需要用单引号''或双引号""(英文字符)包括。


按对象分类 ,数据可分为向量(vector)、数组(array)、矩阵(matrix)、列表(list)、数据框(data.frame)和因子(factor)。


向量 是数值的有序集,从数据结构上看就是一个线性表,可以看成一个数组。我们可以用 c() 将多个元素组合起来创建向量,冒号运算符:可用来快速生成一个连续的整数序列。

在R语言中,向量化操作是一大特色,它可以让 运算符或函数能作用于向量中的每个元素 ,无需显式地使用循环。


数组能存放多维矩形数据,而矩阵是一种特殊的二维数组 矩阵可以用 matrix() 函数来创建,用于存储具有相同数据类型(通常是数值)的元素。数组可以用 array() 函数来创建,也是只能存储具有相同数据类型的元素。访问数组和矩阵内的元素时,可以通过使用元素的列索引和行索引,类似坐标形式,如 P[1,3] 是获取矩阵P第一行第三列的元素。


列表 是一种灵活的数据结构,可以存储和操作多种类型的数据对象,如数字、字符串、向量、另一个列表、矩阵、数据框等。列表可以用 list() 函数创建,通过位置索引(双括号[[ ]]和单括号[ ])或名称($操作符)来访问和修改列表元素。


数据框 是一种特殊的二维列表,可以理解成我们常说的“表格”。数据框每一列都有一个唯一的列名,长度都是相等的,同一列的数据类型需要一致,不同列的数据类型可以不一样。

数据框是我们绘图中最常用的一种数据类型。它可以用 data.frame() 函数来创建,语法格式如下:

数据框内的元素获取方式类似“表格”,可以通过位置索引[行索引,列索引]或者$列名/[[列名]]+行索引方式。


此外, 因子(Factor) 用于存储不同类别的数据类型,常用于绘图中的坐标轴标签或数据分组。因子可以用factor()函数创建。


3、基础运算

若想在R中进行数学计算,可用到以下数学运算符(优先级越小,计算顺序越靠前):


若想比较两个向量,可用到以下关系运算符和逻辑运算符:

两相比较后,结果返回一个布尔值,判断正确返回TRUE,反之为FALSE。

此外,%in%可用来判断元素是否在向量里,有的话返回 TRUE,没有返回 FALSE。


4、 函数简介

函数是一种可重复用的代码块,用于执行特定功能。在R语言中定义函数的基本语法如下:

可以看到,创建自己的函数与变量赋值类似, 固定框架为function(参数){代码块} 。我们调用函数也跟使用变量一样, 直接键入函数名称() 即可。

需要注意的是,函数花括号内的代码块是与其他区域是隔开的,另有一番小天地,在里面的变量外面是不认的。若想要函数内赋值的变量能“走出来”,就需要使用全局变量了,但初入门不建议这么做,容易自己搞混了。

当然,R语言也提供了很多可用的内置函数,我们无需定义它就可以直接使用,如seq(),mean(),max(),sum(x) 以及paste(...)等 。

此外,我们可以使用?(英文字符的问号)或help()函数来查看函数信息,如?mean、help(mean)。在RStudio也可以直接进行搜索。


三、福利







请到「今天看啥」查看全文