专栏名称: VG生信软件
国内首家从事Windows平台、可视化生物信息学桌面软件开发的公司。致力于提供领先的生物信息学软件产品和系统服务。产品和业务包括:微生物多样性分析软件、转录组分析软件、重测序分析软件、细菌基因组分析系统。
目录
相关文章推荐
新疆949交通广播  ·  两男子直播吸毒还自报家门,被举报后半小时落网! ·  昨天  
新疆949交通广播  ·  免费开放! ·  昨天  
Linux就该这么学  ·  开源办公套件 LibreOffice ... ·  昨天  
Linux就该这么学  ·  美女博主爆改 家用空调外机 ... ·  昨天  
新疆949交通广播  ·  出现这些情况可能是流感重症!警惕→ ·  3 天前  
51好读  ›  专栏  ›  VG生信软件

微生物多样性测序需要多少重复?

VG生信软件  · 公众号  ·  · 2017-08-30 17:18

正文

之前,在我们的某一期生信培训班,对“微生物群落多样性的测序是否需要重复”的问题做过细致的讲解,显然这个过程是必不可少的,并从生物学、统计学以及实操上说明了生物学重复的重要性。


那么,微生物多样性测序需要做多少重复呢?3个、5个、7个还是以上呢?下面围绕生物学、统计学、操作便捷性及成本4个方面展开讨论。


一般的分析需要多少样本重复数才能正常开展?需要确定一下分析的可行性,那么需要依靠重复样本才能实现,无外乎为t检验、秩和检验等差异检验。


每组一个重复不能开展差异检验分析,那么每组3个重复是否就可以了?从统计学来说,3个重复确实可以。例如一般的t检验,每组至少3个重复就能算均值方差,从而进行t检验。


但t检验本身需要依赖数据符合正态分布,而在多次随机抽样中,微生物的丰度分布并不一定符合正态分布,因此,有时候需要开展无监督检验方法。Wilcoxon秩和检验就是一种常用的方法,但我们通过其检验临界表可以发现,在0.01的水平下需要 至少 5个重复才能找到数据,才能开展分析。



因此,要开展有效的差异检验分析,必须至少3个样本重复(t检验)才可以。5个样本重复(秩和检验)也可以。



考虑完分析的可行性后,接下来讨论其合理性,也就是多少重复才算比较有数据代表性。就拿微生物样本来说,其影响因素繁多,且样本物种种类复杂,因此相比于转录组等样本来说,其离散程度较大。同时,由于人为误差的必然存在(如采集到极端样本、操作失误等),就算3,5个样本重复统计出来的显著差异,实际上并没有太多生物学意义。


,在进行容错率越低的研究的时候(例如药物研发,疾病机理等),需要更多的样本重复来消除背景误差,以精确的找到目标,。


同时,样本的复杂程度越高,理论需要的重复数也越多。因此推荐,一般的水体研究,可以开展5个左右重复,土壤10个以上,而人体肠道微生物研究,则推荐20个以上样本。


实验条件的差异,会造成测序结果的数据量差别很大。如:同一批数据,同一组中重复a、b的tag数目都是30万,重复c则是10万。对于这种数据量差异问题, 我们可以采用抽平分析策略来解决







请到「今天看啥」查看全文