专栏名称: VG生信软件
国内首家从事Windows平台、可视化生物信息学桌面软件开发的公司。致力于提供领先的生物信息学软件产品和系统服务。产品和业务包括:微生物多样性分析软件、转录组分析软件、重测序分析软件、细菌基因组分析系统。
51好读  ›  专栏  ›  VG生信软件

CCA与RDA,时候选用最合适

VG生信软件  · 公众号  ·  · 2017-09-11 16:43

正文

在做微生物多样性分析的时候,面对样品、菌群、环境因子三者之间的关系或者两两间的关系,该选择CCA,还是RDA好呢?

冗余分析(RDA)或典范对应分析(CCA)是基于对应分析(CA)发展而来的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。


RDA 或CCA 的选择原则:

RDA是基于线性模型,CCA是基于单峰模型。

做直接梯度分析一般会选择CCA。

若CCA排序的效果不太好,可选择用RDA。


先用species-sample数据(97%相似性的样品OTU表)做DCA 分析,看分析结果中Lengths ofgradient 的第一轴的大小。大于4.0选CCA;处在3.0-4.0 之间选RDA 和CCA均可;小于3.0,则RDA 的结果要好于CCA。


目前,CCA比RDA用得更广泛,原因如下:


  1. 大部分情况,两者的分析结果差别不是很大。

    CCA非线性模型其实可以容纳线性模型(线性关系可以算是非线性模型的特例)。

    所有RDA能做的,CCA也能做(只是在梯度比较短的情况,RDA要精确一点)。

    如果是非线性关系,用线性的RDA来分析,那个准确度就得打个问号了(因为,本来点就不在同一条直线上,现在非得用直线去拟合,肯定不合适。这也是为什么SD小于3也可以用CCA,但是SD大于4,就不能用RDA的原因)。

  2. 目前大多数人都用CCA,使用越多,文献越多,大家为了方便比较,所有更多的选择是CCA,RDA自然就越来越少了。


CCA图里面的微生物是该分类水平下丰度在前10的微生物(默认是前10种):在特定的分类水平下(比如目水平)。首先,我们将用于作图的所有样本中的同种微生物的丰度值相加计算出各个微生物的总丰度,然后对这个总丰度值进行排序,结果取丰度排名前10的微生物来做CCA分析。









请到「今天看啥」查看全文