微生物群因其独特性,在生命、环境科学等领域都发挥着重要作用,微生物个体内部有从DNA-RNA-Pro-表型的分子网络,而个体外部又涉及物种、环境因素,宿主的干扰,宿主内部的信息传递(DNA-RNA-Pro-表型)会与微生物进行一定的交流。因此,单从一个组学层面很难将这种复杂的分子网络阐述清楚,想要非常系统的解答一些生物学问题,就不可避免采用多个组学进行综合分析。
常见的多组学关联策略(图1),大体分为物种-物种(16s+ITS),物种-微生物功能(16s+宏基因组),物种-表型(16s/宏基因组+代谢),物种-宿主功能等(16s/宏基因组+转录组),那今天我们就以一篇客户文章为例,开启多组学系列的第一篇物种-物种关联研究。
葡萄表面微生物对葡萄的健康、产量、葡萄酒的品质等都起着至关重要的作用。本文旨在通过16S+ITS组学关联技术研究葡萄表皮真菌和细菌群落演替,以及葡萄生长发育阶段、葡萄园选址和宏观气候条件对表皮微生物多样性的影响。
采集3个不同地区(宁夏永宁(YN)、山东蓬莱(PL)和陕西杨凌(YL)、4个发育阶段(坐果期、开始转色期、转色结束期和采收期)的36份样品进行16S(V3-V4 )和ITS(ITS3_KYO2F-ITS4-2409R)测序分析。
16S+ITS又称物种-物种关联,通过拓宽研究范围,同时从细菌和真菌两个角度分析微生物的作用机制,来提升文章水平。常见的16S+ITS分析思路包括验证对比型+关联预测型两种:
(1)细菌和真菌的对比,从多样性、群落结构、与环境因子关联的层面,探讨细菌和真菌对分组差异响应的异同;
(2)细菌与真菌的互作关系预测,探讨由于底物竞争等存在的物种间的关联网络。
Shannon指数的ANOVA统计检验表明,真菌YN (F(3,8)=138.463,P<0.001)和YL(F(3,8)=4.822, P=0.033)的α多样性显著降低,而PL(F(3,8)=1.965, P=0.198)没有显著变化(表1)。细菌与真菌相比略有不同,3个葡萄园的α多样性均显著降低(F(3,32)=9.745,P<0.01)。整体而言,YN和YL分别具有最高的真菌和细菌α多样性(图2)。
图2 发育过程中真菌(a)和细菌(b)α多样性(Shannon指数)的变化趋势
初步揭示了不同分组在真菌和细菌层面群落丰富程度的差异,进一步通过β多样性验证分组是否符合预期,采样是否合理等。
真菌Bray-Curtis和细菌加权UniFrac的PERMANOVA统计检验(表1,P<0.05)表明,不同葡萄园以及各阶段真菌和细菌的β多样性均存在显著差异。PCoA也显示不同发育阶段、不同地理位置样品之间存在较强的分离现象(图3)。
图3 真菌(c)Bray-Curtis距离和细菌(d)加权UniFrac距离的PCoA分析
在α、β多样性分析中,无论是多样性指数(Shannon等),还是β聚类散点图(PCoA等)均可以在群体层面指示分组的差异,但是这种通过人眼的差异结果带有强烈的主观性,缺乏证据,因此需要给出统计学意义的结果。
在β多样性的PERMANOVA分组检验中R2表示不同分组对样品差异的解释度,值越大表示分组对差异的解释程度越高。
河流图揭示一些核心类群在不同葡萄园中的物种组成较为相似。比如,优势属
Alternaria
在转色早期和结束的相对丰度积累,在收获时减少(图4a、c、e)。
Sphingomonas
在YN和YL的所有发育阶段都以高丰度(>1.0%)存在,并在转色早期显着增加(图4b,f)。另外,少数核心类群只在特定发育阶段出现,
Acremonium
在YN和YL的转色早期被检测到,并在之后积累(图4a,e)。表明,转色期是每个葡萄园核心类群的关键阶段。
*a、c和e分别代表YN、PL和YL真菌群落。b、d和f分别代表细菌群落(显示前10个相对丰度)。
河流图属于堆叠图的一种变形,用于展示物种在不同分组(样本)中的变化趋势。
基迪奥在微生物omicsmart在线报告
以及OmicShare工具
中也有河流图哦!
网站链接:
https://www.omicsmart.com/home.html#/platfrom?id=5
或
https://www.omicsmart.com/home.html#/platfrom?id=7
工具链接:
https://www.omicshare.com/tools/home/report/report_river.html
指示物种分析是群落组学研究的核心,我们费尽心思采样、测序,其目是找出造成分组差异的biomaker,进而揭示表型差异的根本原因。
在β多样性中(表1)发现葡萄采收期对微生物多样性差异的解释程度更高,因此挑选此时期进行指示物种鉴定。通过LEfSe分析共得到40个差异显著的真菌以及43个细菌。其中YN中有17真菌和8个细菌显著富集;10个真菌和14个细菌在PL中;YL中有13个真菌,21个细菌(图5)。
图5 葡萄收获时期的真菌(a)和细菌(b)类群的LEfSe分析(LDA>4)
LEfse分析原理,利用LEfse软件先对所有组样品间进行kruskal-Wallis秩和检验(多组检验方法),将筛选出的差异物种再通过wilcoxon秩和检验(两组检验方法)进行两两组间比较,最后筛选出的差异使用线性判别分析LDA(Linear Discriminant Analysis)来估算每个差异物种的丰度对差异效果影响的大小,即LDA得分,得分越高,物种作为biomarker的意义越大。
进一步挑选物种组成中的核心类群进行随机森林分析,揭示哪些核心类群可最大程度解释葡萄发育阶段的变化。
结果表明,这些核心类群对各阶段样品均有较好的鉴别能力。且细菌强于真菌,可以准确识别(100%)YN中的所有样品(图6b),PL和YL的鉴别率分别为91.67%和83.33%。真菌核心分类群也是YN的分辨率最高(图6a,91.67%),其次是YL(83.33%),PL(58.33%)。
Gini指数也显示,在YN的发育阶段,
Filobasidium
和
Streptomyces
可以分别解释真菌和细菌群落最大变异(图6c,d)。暗示,可以通过相关的核心微生物群区分葡萄的发育阶段。
图6 随机森林发展阶段的核心类群YN真菌(a)和细菌(b),Gini指数(前20名)真菌(c)和细菌(d)
随机森林常用于两组间差异分析(多组也可),且生物学重复较多(30~50),至少推荐10个以上,一般认为Mean decrease Gini指数越大,则表示该物种越重要。
采用典型对应分析(CCA)探讨天气参数对微生物群落变化的影响。结果表明,大气候对坐果期间真菌和细菌多样性影响不大。基于Pearson强相关系数(︱ρ︱≥0.5;P<0.05),真菌(average degree=5.40)比细菌(average degree=2.57)连接更紧密(图7b)。真菌方面,顶孢菌属(
Acremonium
)、
Dissoconium
等与降水量呈正相关;假裸囊菌属(
Pseudogymnoascus
)、
Tetracladium
等与相对湿度呈负相关。细菌方面, 马赛菌属(
Massilia
)、
Pedobacter
等与降水量呈正相关;微杆菌属(
Microbacterium
)、
Shinella
等与相对湿度呈正相关。
图7 葡萄发育过程中环境因子与微生物的CCA(a)和Pearson(b)关联分析
*紫色vee节点代表环境因子。灰色椭圆表示微生物;正相关(粉色),负相关(蓝色)。vee节点的大小与连通程度成正比;椭圆节点的大小与相对丰度成正比。Env1:大气压力;Env2:平均高温;Env3:平均低温;Env4:相对湿度;Env5:降水;Env6:地表温度;Env7:光照时间。
CCA分析中箭头代表不同的环境因子,越长,表示该环境因子对物种分布的影响越大;
不同颜色和形状表示样本,样本在环境因子上的投影位置离原点越远,表示样本中该环境因子丰度越高。
本文在研究思路上采用物种-物种关联分析,从多样性、物种组成、指示物种、环境因子等多个方面,分层次探讨了不同地域以及发育阶段细菌与真菌群落的变化对比,找到了造成分组差异的关键物种(biomaker),进而揭示时间、空间微生物(细菌,真菌)差异的响应机制;
在分析方法层面也采用随机森林、CCA、河流图等多种新型技术进行论证。
研究思路创新+分析方法新颖,双重保障,值得借鉴!
[1]Wei R, Ding Y, Gao F, Zhang L, Wang L, Li H, Wang H. Community succession of the grape epidermis microbes of cabernet sauvignon (Vitis vinifera L.) from different regions in China during fruit development. Int J Food Microbiol. 2022 Feb 2;362:109475. doi: 10.1016/j.ijfoodmicro.2021.109475. Epub 2021 Nov 13. PMID: 34798479.