联用病毒颗粒富集和传统非富集宏基因组学方法全景解析污水处理厂病毒圈
iMeta主页:http://www.imeta.science
● 原文链接DOI: https://doi.org/10.1002/imt2.188
● 2024年3月29日,清华大学深圳国际研究生院李炳团队在iMeta在线发表了题为 “A panoramic view of the virosphere in three wastewater treatment plants by integrating viral-like particle-concentrated and traditional non-concentrated metagenomic approaches” 的研究文章。
● 本研究通过应用基于病毒颗粒浓缩(VPC,游离病毒颗粒组分)和非浓缩(NC,总微生物细胞组分)宏基因组学方法,提供了三个污水处理厂中病毒的全景图。研究结果增进了对病毒群落结构和组成的深入理解,为优化污水处理系统的运行和调控提供了重要的参考信息。
● 第一作者:张家禹
● 通讯作者:李炳([email protected])
● 合作作者:唐爱茜、金桃、孙德寿、郭芳亮、雷华新、林琳、束文圣、俞萍锋、李晓岩
● 主要单位:清华大学深圳国际研究生院、东莞理工学院生态环境工程技术研发中心
● 系统比较了病毒颗粒浓缩(VPC,游离病毒颗粒)和传统非浓缩(NC,总微生物细胞组分)宏基因组学方法在病毒组调查中的应用,解析了这两种方法在表征污水处理厂中病毒群落和功能方面的优劣;
● 真核生物病毒Cressdnaviricota是VPC宏基因组中的优势病毒,而噬菌体Uroviricota则是NC宏基因组中的优势病毒;
● 污水处理厂的病毒组中存在类型多样的辅助代谢基因(AMGs),大量的AMGs参与碳、硫、磷等生物地球化学循环,并且在污水处理系统中表现出转录活性;
● 仅在NC宏基因组数据中发现了极小比例(低于0.08%的vOTUs)的病毒携带抗生素抗性基因(ARGs),噬菌体携带的ARGs类型主要包括大环内酯类-林可酰胺类-链阳菌素类、四环素类和氨基糖苷类。
污水生物处理系统孕育了丰富多样的微生物群落,其效能在很大程度上依赖于微生物的活性。病毒在其感染阶段通过改变微生物行为和代谢过程而扮演着至关重要的角色。本研究采用了两种方法,即基于病毒颗粒浓缩(VPC,游离病毒颗粒组分)和非浓缩(NC,总微生物细胞组分)的宏基因组学,研究3个不同类型污水处理厂全流程的病毒群落组成,并评估了这两种方法在解译病毒组物种分类、多样性、宿主互作、生活方式、动态和功能基因等特征的差异。本研究发现这两种方法在病毒群落和功能组成研究中各有优劣,联合应用这两种方法能够更全面地阐明污水处理系统病毒组。本研究鉴定了近5万个病毒重叠群,其中Cressdnaviricota和Uroviricota分别是VPC和NC宏基因组数据中占主导地位的病毒门。值得注意的是:Asfarviridae和Adenoviridae等病原性病毒在污水处理系统中普遍存在。我们还观察到处理不同类型污水的污水处理厂的病毒组之间存在显著差异。此外,在RNA水平上各种噬菌体携带的辅助代谢基因(AMGs)表达活跃,在碳、硫和磷循环中发挥了重要作用。而且,本研究鉴定了29个携带抗生素抗性基因(ARGs)的病毒,具有水平转移的潜在风险,体现环境中噬菌体对ARGs传播的影响。总之,本研究通过应用VPC和NC宏基因组学方法,提供了三个污水处理厂中病毒的全景图。研究结果增进了对病毒群落结构和组成的深入理解,为优化污水处理系统的运行和调控提供了重要的参考信息。
Bilibili:https://www.bilibili.com/video/BV1Um421W7K8/
Youtube:https://youtu.be/NAU0kveYMLs
中文翻译、PPT、中/英文视频解读等扩展资料下载
请访问期刊官网:http://www.imeta.science/
市政和农业废水,特别是畜禽养殖废水,具有高化学需氧量的特点,可达数百至数千mg/L。这种富营养环境赋存了丰富多样的微生物,包括原生生物、真菌、细菌、古菌、病毒。随着污水不断地流入污水处理厂,污水中的微生物对污水处理单元的微生物群落塑造起着关键作用。原始污水中的微生物群落能够反映源头社区人群或者畜禽的粪便微生物群落的特征,可以用于评估污水厂服务人群或畜禽的健康水平。虽然大量研究广泛地探索了污水处理厂中细菌和古菌的多样性和基因组,但我们对其中病毒的认识仍然有限。
病毒是地球上数量最多、多样性最丰富的生命形式,其形态、大小和基因组结构复杂多样。病毒在污水系统中的浓度约为108/mL,远高于其他水生环境。绝大多数病毒属于原核生物噬菌体。噬菌体通过感染后的裂解或溶原作用直接影响原核生物群落,在地球生物圈的有机碳等营养物质循环中发挥重要作用。此外,噬菌体可以通过辅助代谢基因(AMGs)重新编程其宿主的代谢途径,从而影响污水生物处理系统的效率。此外,病毒介导的水平基因转移促进了细菌类群间遗传物质共享,特别是增加了抗生素抗性基因(ARGs)的传播风险,对抗微生物治疗策略构成挑战。
高通量测序技术的进步推进了宏基因组测序在DNA水平上研究微生物群落的发展。在通过宏基因组学研究病毒组时,研究人员通常采用病毒颗粒浓缩(VPC,针对游离病毒颗粒组分)或非浓缩(NC,针对总微生物细胞组分)的样本制备方法。NC方法通过离心或过滤收集真菌和细菌等较大的细胞,产生的宏基因组数据中包含病毒比例通常较低(1~19%),但因其操作简单并且包含微生物群落整体而被广泛应用。相比之下,VPC方法的目的是去除原核和真核细胞,富集游离病毒颗粒,其测序结果提供了更有效的病毒数据。病毒组研究方法在不断进展,重点在于基于特定研究目标和环境背景选择适当方法。
尽管病毒组研究方法不断进步,但对NC和VPC两种方法获得的病毒组的差异仍认识不足。本研究旨在通过以三个污水处理厂(养猪废水处理厂、养鸭废水处理厂、城市生活污水处理厂)的病毒组研究来解决这一问题,研究目的包括:(1)比较VPC和NC方法获取病毒组信息的差异,(2)解析污水处理厂中病毒群落的全景图,(3)利用宏转录组学揭示病毒在污水处理系统中的活性与功能。
污水处理系统中病毒群落组成:NC方法vs. VPC方法
在本研究中,使用VPC和NC宏基因组学方法对三个污水处理厂的病毒群落进行了全面分析(图1)。这三个污水处理厂分别处理来自养鸭场(WWTPA)、养猪场(WWTPB)和市政(WWTPC)的污水。从VPC和NC数据中分别鉴定出13,989和71,047个候选病毒重叠群(图2A,2B)。值得注意的是,这些候选病毒中92.4%可由病毒预测工具Virsorter2和DeepVirfinder鉴定(图2A,B)。经过CheckV和CAT的过滤,VPC和NC数据中分别包含11,045和38,438个病毒重叠群(图1)。NC数据中鉴定的病毒重叠群较长,平均长度和N50分别为16,250 bp和24,310 bp,而VPC数据中鉴定的病毒重叠群平均长度和N50分别为8149 bp和11,929 bp。VPC和NC方法分别鉴定到70和1600个前噬菌体(图2C,2D),NC方法检测的主要是微生物细胞表面或内部的病毒,因此NC方法在识别整合到宿主基因组中的前噬菌体方面表现出优越性。有趣的是,尽管VPC宏基因组中鉴定的病毒重叠群较少,但完整(占比30.6%)和高质量(占比13.1%)病毒重叠群的比例显著高于NC宏基因组(图2C,D)。VPC宏基因组短序列能够比对到病毒重叠群的比例大约22.1%~97.4%,而NC宏基因组短序列的比对百分比则相对较低,大约0.9%~17.4%(图S1)。VPC方法在DNA提取前对病毒进行浓缩,可以减少非病毒DNA的成分,从而在宏基因组测序中生成更多高质量的病毒序列。
通过该分析流程, VPC和NC病毒重叠群中物种分类注释的比例分别约为56.9%和40.6%(图S2A)。其中超过三分之一的病毒重叠群属于原核生物病毒。值得注意的是,与NC宏基因组(4.3%)相比,VPC宏基因组检测到更高比例的真核生物病毒(19.4%)(图S2B)。两种方法获得的病毒重叠群在门水平的分布各不相同,VPC病毒重叠群主要包括Phixviricota、Cressdnaviricota和Uroviricota,而NC病毒重叠群则主要由Uroviricota组成(图S2C)。VPC和NC病毒重叠群总共包括27个病毒门和97个病毒科,并且两种方法各自恢复了独有的病毒分类群(图S2D)。这些结果表明, VPC和NC方法在病毒群落组成分析方面是互补的,联合应用两种方法为解译污水处理厂的病毒圈提供了更稳健和全面的策略。
图1. 宏基因组组装基因组(MAG)复原、病毒重叠群识别和物种分类的宏基因组数据分析流程
vOTU为病毒操作分类单元,图中标注了主要分析工具以及病毒重叠群或MAG的数量。
图2. 来自病毒颗粒浓缩(VPC)和非浓缩(NC)宏基因组的病毒重叠群的数量和质量
(图2A,B)四种病毒检测工具鉴定的候选病毒重叠群的交集。(图2C,D)从VPC(图2C)和NC(图2D)宏基因组中识别的病毒重叠群的质量。图中标注了每个质量水平的病毒数量(括号内注明前噬菌体数量)。核密度图展示数据分布。饼图展示每个质量水平的病毒比例。
不同宿主类型的病毒在污水处理过程中的动态变化:NC方法vs. VPC方法
本研究分析了不同宿主类型的病毒在污水处理过程中的动态变化,并比较了VPC和NC的差异。将3个污水处理厂的病毒重叠群聚类成病毒操作分类单元(vOTU),VPC和NC数据获得的vOTU数量分别是8276和28,054(图1)。VPC和NC数据整合分析共获得35,647个vOTU。本研究发现NC宏基因组数据中噬菌体占据明显优势,在VPC宏基因组数据中真核生物病毒占主导地位,尤其是那些感染脊椎动物的真核生物病毒(图3A、B、E)。NC方法,则主要针对细菌等微生物细胞组分,更适合研究污水中的噬菌体。相比之下,VPC方法,针对游离病毒颗粒,对于调查游离的真核生物病毒的效率更高,尤其是那些感染动物或人类的脊椎动物病毒。
在处理养鸭场和养猪场污水的污水处理厂A和B中,细菌病毒的vOTUs数量沿着处理流程显著下降,但其相对丰度没有表现出相应的规律(图3A)。在污水处理厂A中,游离生活的真核生物病毒相对丰度显著高于污水处理厂B和C。然而,真核生物病毒的多样性表现出相反的趋势(p < 0.001)(图3B、D)。一般而言,污水环境并不适合真核生物病毒尤其是脊椎动物病毒的生存,这主要是因为污水中缺少适宜的宿主。本研究观察到3个污水处理厂的出水中真核生物病毒尤其是是感染脊椎动物的真核生物病毒的多样性显著减少(p < 0.001)(图3B、D),这表明污水处理系统对于去除这些病毒有一定的效果。值得注意的是,污水处理系统并未完全去除脊椎动物病毒,它们在出水中的相对丰度仍然较高,具有潜在的健康风险(图3C、D)。已经有多项研究表明,污水处理系统去除脊椎动物病毒的效率有限。
病毒的结构是它们在污水处理系统中生存的关键决定因素。例如,肠道病毒等双链非包膜病毒通常表现出比单链或有包膜病毒更强的抗紫外消毒能力。某些处理过程可能会削减污水处理系统对病毒的灭活作用。例如,固相吸附有助于病毒去除,但也导致其免于灭活。此外,病毒在污水中的持久性有助于它们的介水传播。在本研究中,联合应用NC和VPC宏基因组学方法检测到的病毒主要是双链DNA(dsDNA,32.5%)和单链DNA(ssDNA,11.2%)病毒(图S3A)。总微生物细胞组分主要由dsDNA病毒组成,而游离病毒颗粒组分中ssDNA病毒占优势(图S3B)。值得注意的是,ssDNA病毒的丰度在污水处理厂A的出水中显著下降(图S3B),表明消毒过程有效灭活了ssDNA病毒。相比之下,污水处理厂C 对ssDNA病毒的灭活效率较低。上述结果表明病毒灭活仍然是污水处理系统亟需解决的问题。
图3. 污水处理流程中感染不同宿主类型的病毒动态变化
(图3A,B)NC和VPC宏基因组中感染古菌、细菌、真核生物和未知宿主的病毒的相对丰度和多样性。折线表示vOTU数量。(图3C,D)脊椎动物病毒的相对丰度和多样性。折线表示vOTU数量。(图3E)NC和VPC宏基因组学方法揭示的病毒丰度和多样性的比较。NS表示无显著差异。
检测极端尺寸病毒的能力:NC方法vs. VPC方法
本研究进一步评估了VPC和NC宏基因组学方法检测极端大小病毒的能力(图S4)。属于Circoviridae和Parvoviridae的病毒通常直径小于30 nm,是典型的小病毒,本研究发现VPC方法检测Circoviridae的能力比NC方法更有效(p < 0.001)(图S4B)。然而,对于Parvoviridae,两种方法检测到的vOTU数量之间没有显著差异(p > 0.05)(图S4B)。至于较大的病毒,如属于Mimiviridae的巨病毒,该病毒科因包含丰富多样的巨型dsDNA病毒而闻名,其大小为140~750 nm。NC方法较VPC方法识别出更多归类为Mimiviridae的vOTU(图S4B)。这可能是因为某些巨型病毒(> 220 nm)的颗粒较大,在VPC方法中从自由病毒颗粒组分中被过滤去除了。因此,对于病毒组研究,根据研究目标病毒群体的大小选择适当的处理方法,或者改进病毒颗粒富集方法,对于获取准确的结果至关重要。
烈性噬菌体与温和噬菌体在污水处理系统中的动态变化:NC方法vs. VPC方法
本研究发现总微生物细胞组分(NC宏基因组)与游离病毒颗粒(VPC宏基因组)组分中烈性噬菌体与温和噬菌体的比例差异显著。具体来说,NC宏基因组中约56.1%的噬菌体为烈性噬菌体,而在VPC宏基因组中,烈性噬菌体的比例平均为87.7%(图S5A、B)。因此,VPC宏基因组中烈性噬菌体的多样性和相对丰度显著高于NC宏基因组(p < 0.001)(图S5C、D)。烈性噬菌体进入裂解周期会导致宿主细胞的裂解。它们通过裂解周期复制并最终释放到细胞外环境中,这也是为什么它们在游离病毒颗粒组分中占优势地位。对噬菌体生活方式的理解对环境工程应用具有重要意义,特别是在污水生物处理过程中。尽管已知噬菌体在污水生物处理系统中数量丰富,但我们对其在废水生物处理过程中的生态作用和潜在影响仍未完全清楚。本研究的发现强调了在聚焦噬菌体生活方式的宏基因组学研究中方法选择的重要性,选择不同的样品处理策略往往会得到不同的结果。
污水处理系统中病毒的多样性:NC方法vs. VPC方法
通过病毒群落的多样性分析,本研究揭示了VPC和NC宏基因组学方法之间的显著差异。Shannon指数和Pielou均匀度指数均显示NC病毒群落的多样性程度更高(p < 0.001)(图4A)。在β多样性方面,VPC和NC方法所表征的病毒群落之间也存在显著的差异性(p < 0.001)(图S6A)。这种差异归因于两种方法的不同研究焦点:VPC主要针对游离病毒颗粒组分,而NC针对总微生物细胞组分。进一步使用PCoA分析发现污水处理厂A和B的样本呈现显著的聚类模式(p < 0.01),表明污水类型显著影响了处理系统中病毒群落的形成(图S6A)。此外,通过NC方法观察到进水、污泥和出水样本中病毒群落组成在科水平上存在显著差异(p < 0.05)(图S6B)。污水处理厂中活性污泥具有较高的微生物密度,生物量在2到50 g/L之间,显著影响出水中病毒组成。
本研究进一步探究了污水处理厂中高丰度的病毒,揭示了不同污水处理厂中病毒的丰度和多样性的显著差异。VPC宏基因组数据中最丰富的病毒门是Cressdnaviricota,其平均相对丰度为56.9 ± 33.7%,而在NC宏基因组中Uroviricota更为普遍,平均丰度为40.8 ± 9.1%(图4B)。Cressdnaviricota包括病毒复制相关蛋白的环状单链DNA(CRESS-DNA)病毒,到目前为止包括2个纲(Arfiviricetes和Repensiviricetes)和11个科。本研究在污水处理厂中识别出1989个来自该门的病毒基因组片段,涵盖了9个科(图S2C)。
Cressdnaviricota中的Genomoviridae在三个污水处理厂的VPC宏基因组中占主导地位,其相对丰度为50.6 ± 36.9%(图4C)。在处理养鸭污水的污水处理厂A中,Genomoviridae病毒特别丰富,从进水到二级好氧池的平均相对丰度为96.5 ± 2.8%。已有报告显示Genomoviridae的成员具有广泛的宿主,包括真菌、昆虫、鸟类、哺乳动物、植物、污水和沉积物。在处理养猪场和市政污水的污水处理厂的VPC样本中,Circoviridae具有较高的丰度,平均相对比例为5.5%,尤其是在市政污水样本(样本C1)中达到了20.4%。Circoviridae是已知最小的真核细胞感染病毒,常与动物的各种临床疾病和在人群中的高流行率相关联。一些来自鸟类和猪的Circoviridae成员具有致病性,可引起发育障碍和免疫系统损伤,与感染性鸡贫血和断奶后多系统衰竭综合征等疾病相关联。此外,本研究还发现与人类相关的Redondoviridae病毒在这3个污水处理厂中大量存在,其在VPC宏基因组中的相对丰度大于0.1%。Redondoviridae病毒主要定殖于人类口腔呼吸道,并被认为与牙周炎有关。
VPC宏基因组学进一步揭示了Asfarviridae和Adenoviridae等致病性病毒科的存在。Asfarviridae包含非洲猪瘟病毒,其存在于所有来自养猪场污水处理系统的样本,平均相对丰度为8.3%。非洲猪瘟病毒可以引发猪中高度传染性的病毒性疾病,致死率接近100%,对养猪业造成经济影响。Adenoviridae能够感染包括人类在内的各种脊椎动物,其在养鸭场污水处理系统中尤其丰富,特别是在出水样本中。Adenoviridae在污水和与人类相关的病毒组中普遍存在,其中一些成员可导致脊椎动物眼睛、喉咙和肺部等多个器官的损害。
相比之下,NC样本病毒主要由Uroviricota门的双链DNA有尾噬菌体组成,尤其是其中的Caudoviricetes广泛存在各种环境中,并且具有较高多样性和丰度。Uroviricota成员包括Peduoviridae、Herelleviridae、Kyanoviridae、Mesyanzhinovviridae、Casjensviridae、Straboviridae、Suoliviridae,在三个污水处理厂的NC样本中普遍存在(图4C)。Peduoviridae的平均相对丰度为8.7 ± 3.5%,是所有污水处理厂样本中的优势物种。这些有尾噬菌体可能在调节生物地球化学循环和细菌代谢方面发挥关键作用,它们通过溶菌生命周期和激活功能性AMGs将显著影响污水处理系统。
(图4A)病毒的Alpha多样性。(图4B)门水平的病毒组成。(图4C)科水平的病毒组成。A1~A9代表处理养鸭场污水的污水处理厂A的样本。B1~B10代表处理养猪场污水的污水处理厂B的样本。C1~C3代表从处理市政污水的污水处理厂C的样本。
本研究复原了2349个宏基因组装配基因组(MAGs),包括2277个细菌和72个古菌。本研究根据MAGs和病毒基因组片段之间CRISPR间隔序列匹配和共享的基因组片段建立病毒-原核生物关联,共鉴定了5341个潜在的病毒-宿主关联。Firmicutes(461个MAGs)、Proteobacteria(395个MAGs)和Bacteroidota(331个MAGs)是三个多样性最丰富的菌门,并且它们与污水处理厂中最多的病毒感染事件相关联(图5A)。病毒平均感染1.1个宿主MAGs,这表明大多数噬菌体倾向于感染特定种类的细菌或古菌,这主要归因于噬菌体识别宿主细胞表面受体的特异性。相反,每个MAG可以被大约3.9个病毒感染,表明原核生物通常会被多种噬菌体感染。这种多重感染可以推动微生物的进化和适应性。Uroviricota噬菌体可以感染多种宿主,包括Firmicutes、Bacteroidota和Proteobacteria(图5B)。Uroviricota的常见病毒科,如Straboviridae、Peduoviridae和Schitoviridae,经常与污水处理厂中的细菌宿主感染相关联(图5C)。
本研究还探索了病毒与MAGs多样性之间的相关性,并发现在NC宏基因组中它们之间存在显著的线性相关性(p < 0.01),但VPC宏基因组中则不存在这种相关性(图5D、E)。这表明在总微生物细胞组分中,病毒群落与原核生物间的关联性比在游离病毒颗粒组分中更为紧密。浓缩过程可能是病毒群落与细菌群落之间相关性的一个重要干扰因素。近年来,噬菌体与原核生物之间的互作日益受到环境工程领域的关注,特别是在污水生物处理过程中,噬菌体显著影响污水生物处理系统的性能。
(图5A)MAGs在菌门水平的病毒感染事件。橙色柱状图表示病毒-宿主关联事件的数量,蓝色柱状图表示每个门的MAG数量。紫色线条表示每个菌门的平均病毒感染数量。绿色线条表示感染每个菌门的病毒的平均宿主数量。(图5B)门水平的病毒-原核生物关联。(图5C)科水平的病毒-原核生物关联(前30个)。和弦宽度代表病毒-宿主关联的数量。(图5D)vOTU和MAG的Shannon指数的线性相关性及Spearman相关性。(图5E)vOTU和MAG的丰富度的线性相关性及Spearman相关性。灰色阴影表示线性相关的置信区间。
对污水处理厂A和C的污水和污泥样本进行的宏转录组学测序,结果证实了病毒的转录活动,表明它们对生态系统的潜在影响(图S7)。噬菌体病毒携带多种AMGs,这些基因广泛参与微生物驱动的生物地球化学循环,甚至抗生素抗性等生物过程。噬菌体携带一系列参与生物地球化学循环和生物过程的AMGs。AMGs可以在感染期间调节宿主代谢,帮助宿主适应生态系统波动。本研究在污水处理厂的NC和VPC宏基因组中分别预测到827和99个AMGs(图S8A)。AMG涉及的代谢途径在NC宏基因组比VPC宏基因组更多样(图S8B),表明NC方法在挖掘污水处理厂病毒组中的AMGs更有效。这些AMGs广泛参与碳水化合物、氨基酸、辅因子、维生素等的代谢(图S8B)。Uroviricota噬菌体是主要的AMG携带者,64.0%的AMGs由该类噬菌体携带,多样的AMG有助于提高病毒适应性或补偿宿主代谢。cysH、phoD、dadA、queC、queD、queE、rfbB、cbhA、UGDH、cobS、metK、moeB、glmS、UXS1、DNMT1等AMGs在污水处理系统中表现出转录活性(图6A),意味着它们正在对宿主的代谢和微生物驱动的生物地球化学循环产生影响。与碳水化合物代谢相关的AMGs,例如UXS1(UDP-葡萄糖醛酸脱羧酶)、glmS(谷氨酰胺---果糖-6-磷酸转氨酶)、cbhA(纤维素1,4-β-葡萄糖苷酶)和UGDH(UDP葡萄糖6-脱氢酶),以及参与硫和磷循环的AMGs,例如cysH(磷酸腺苷酰硫酸还原酶)、moeB(钼蝶呤合酶腺苷转移酶)和phoD(碱性磷酸酶),在污水处理系统中表现出转录活性。cysH基因编码的磷酸腺苷酰硫酸还原酶负责将3′-磷酸腺苷-5′-磷酸硫酸转化为游离亚硫酸,这是硫酸盐还原同化过程中的重要步骤。参与硫传递系统的moeB基因在代表性的Steigviridae病毒重叠群(ID:A2_ne176)中活跃表达(图6B)。cobA(钴胺素腺苷转移酶)、cobT(钴螯合酶CobT)、cobS(钴螯合酶)、queC(7-氰基-7-脱氮鸟嘌呤合成酶)、queD(6-吡喃酰四氢蝶呤/6-羧基四氢蝶呤合成酶)、queE(7-羧基-7-脱氮鸟嘌呤合成酶)、queF(7-氰基-7-脱氮鸟嘌呤还原酶)等AMGs参与辅因子和维生素的生物合成,涉及的辅因子和维生素在多种生理过程中扮演独特的生化角色。例如,cobA、cobT和cobS是维生素B12(钴胺素)生物合成的关键基因,其中cobS在活性污泥(样品C2)中活跃表达。queC、queD、queE和queF是维生素B9(叶酸)生物合成的关键基因,其中queC、queD、queE共存于Queuovirinae的代表性噬菌体重叠群(ID:A5_ne1399)(图6B)。由于许多细菌或古菌不具备完整的维生素生物合成途径的所有基因,这些病毒AMGs的表达可能补偿了宿主的缺陷。这些病毒AMGs的活跃表达表明病毒在塑造微生物代谢和影响污水处理过程中扮演着积极的角色。
(图6A)病毒中代表性AMGs的表达。数值表示为每千个碱基的转录每百万映射的Transcript(TPM)的平均值(n = 3)。AMGs的TPM表达量形成聚类树。(图6B)代表性AMGs在病毒基因组中的排列。
目前普遍认为污水处理系统是ARGs的储藏库。ARGs普遍存在于各种细菌的基因组或质粒中,并且能通过水平基因转移而传播,对公共健康构成了重大挑战。在本研究中,从这三个污水处理厂的宏基因组的MAGs中发现了753个ARGs。通过NC宏基因组学方法仅发现了29个由噬菌体携带的ARGs(图7A)。相反,VPC宏基因组学方法未发现任何与噬菌体相关的ARG。水平基因转移是ARGs跨越不同宿主分类水平转移的主要机制,移动遗传元件促进了这一过程。噬菌体也是移动遗传元件的一种形式,噬菌体转导促进不同细菌类群间交换遗传物质,其中就包括ARGs的水平转移。至今,关于病毒是否对ARGs的传播有显著贡献仍存在争议。虽然一些研究指出病毒在多种环境中是关键的ARG储藏库,但也有研究认为噬菌体很少编码ARGs。本研究的结果倾向于支持后一种观点,仅极少部分(少于0.08%的vOTUs)病毒携带ARGs。多项研究表明环境样本中如土壤、瘤胃和粪便的病毒群落中低于0.1%的病毒编码ARGs。然而,病毒介导的ARG传播潜力仍需警惕。未来的研究应进一步探究噬菌体在细菌类群间水平ARG转移中的作用。
在本研究中,29个由噬菌体携带的ARGs包括大环内酯类-林可酰胺类-链阳菌素类(12个ARGs)、四环素类(7个ARGs)、氨基糖苷类(6个ARGs)、氯霉素类(2个ARGs)、β-内酰胺类(1个ARG)和多重耐药类(1个ARG)(图7B)。这些噬菌体携带的ARGs中,ANT(6)、cfr(C)、erm(47)、erm(B)、mel、tet(M)、tet(O)、tet(Q)、tet(T)在污水样本中丰度较高。病毒重叠群与MAGs之间ARG的共享网络显示林可霉素核苷转移酶编码基因lnu(D)被多个细菌和病毒共享(图7C)。环内酯类-林可酰胺类-链阳菌素类、四环素类和氨基糖苷类耐药基因是污水处理厂病毒中携带的主要ARGs类型,这一结果与土壤、沉积物和瘤胃等不同环境病毒组中的结果相吻合。上述ARGs类型在畜禽和市政污水中普遍存在,噬菌体转导等多种移动遗传元件可以介导它们的传播。Uroviricota噬菌体是ARGs的主要携带者(图7C)。值得注意的是,这些噬菌体携带的ARGs中有25个在细菌MAGs中被检测到,其中7个是携带ARGs的噬菌体的宿主。ARGs的共享主要发生在细菌门Firmicutes和病毒门Uroviricota中。由于Uroviricota噬菌体在污水处理厂中具有高丰度和多样性(图4B,S2C),并在各种环境中普遍存在,它们携带ARG的潜力可能促进了污水处理系统中ARGs的传播,从而增加了抗生素耐药性相关的风险。综上所述,Uroviricota噬菌体是污水处理厂中AMGs和ARGs的主要携带者。Uroviricota在总微生物细胞组分中的普遍存在,这也是NC方法在揭示AMGs和ARGs方面显著优于VPC方法的原因。
图7. 病毒基因组携带的抗生素抗性基因(ARGs)
(图7A)NC病毒、VPC病毒和MAGs携带的ARGs数量。(图7B)病毒携带的ARGs的相对丰度。相对丰度以每百万reads中来自于某基因每千碱基长度的reads数(RPKM)表示。右侧直方图中的绿星号表示携带相应病毒来源的ARG的宿主MAG。(图7C)病毒和原核生物中ARGs的共享网络。
本研究联合应用VPC与NC宏基因组学方法阐明了污水处理厂中病毒组的特性。研究结果展示了每种方法在解译污水处理厂中的病毒群落及其功能内容方面的各自优势。NC宏基因组学方法揭示了更多的病毒重叠群(38,438个),包括较多数量的前噬菌体(1600个),但高质量病毒重叠群的比例较小(3.2%)。相比之下,VPC方法在恢复高质量病毒重叠群(43.6%)方面表现更好。通过VPC方法识别的病毒群落,主要针对游离病毒颗粒组分,与通过NC方法获得的总微生物细胞组分的病毒群落显著不同。在VPC病毒组中,Cressdnaviricota等真核生物病毒占据主导地位,而在NC病毒组中Uroviricota噬菌体是优势群体。值得注意的是,VPC宏基因组揭示了污水处理系统内Asfarviridae和Adenoviridae等致病性病毒的流行。污水厂病毒组存在大量未分类的病毒重叠群,表明其中存在着大量尚待探索的病毒“暗物质”。NC方法在探索污水处理厂病毒组的功能基因方面表现出显著优势,与VPC方法相比,其提供了更全面的辅助代谢基因和抗生素抗性基因信息。总体而言,联合应用VPC和NC宏基因组学方法为更完整理解污水处理系统中的病毒圈提供了一种稳健的策略。通过采用该方法,本研究为污水处理厂中病毒的关键且常被忽视的角色提供了新的见解,强调了它们在开发污水生物处理技术中的重要性。
为了比较处理不同类型废水的污水处理厂中的病毒群落,本研究从3个大规模污水处理厂的每个处理单元收集了23个污水或污泥样本,每个样本约5 L。这3个污水处理厂位于中国广东省,分别处理养鸭场(WWTP A)、养猪场(WWTP B)以及市政来源(WWTP C)的污水。这些样本的具体信息列在表S1中。对于传统的非浓缩(NC)宏基因组方法,每个样本(除了最终出水样本)取约20 mL经过10,000g离心5分钟收集总微生物细胞组分。对于最终出水样本,通过抽滤将大约200毫升的出水样本中的微生物细胞收集在0.22 µm Durapore滤膜(Millipore)上。病毒颗粒浓缩(VPC)方法采用化学沉淀收集游离病毒颗粒。简言之,通过0.22 µm滤膜过滤并收集滤液,将滤液与AlCl3(Al3+最终浓度为20 mg/L)混合以沉淀病毒样颗粒。通过抽滤将含有病毒样颗粒的沉淀物收集在0.22 µm滤膜上,然后加入抗坏血酸缓冲液(pH = 6.0)重悬沉淀。加入最终浓度分别为10 U/ml和1 U/ml 的DNaseI和RNaseA以消化外源核酸,该反应通过添加100 mM乙二胺四乙酸(EDTA)和乙二醇四乙酸(EGTA)终止。最后,通过2000 g离心5分钟收集上清液,并在-20°C下储存,以备后续的病毒DNA提取。
使用FastDNATM Spin Kit for Soil(MP Biomedicals)提取NC样本的总微生物细胞组分DNA。使用MiniBEST Viral DNA Extraction Kit(TaKaRa)提取VPC样本的病毒DNA。通过illustraTM Ready-To-GoTM GenomiPhiTM V3 DNA Amplification Kit (GE Healthcare)对病毒DNA全基因组扩增以增加VPC样本中的DNA量。使用NEB Next® Ultra™ DNA Library Prep Kit for Illumina®(New England Biolabs)构建宏基因组测序文库。最终,通过Illumina NovaSeq 6000平台测序产生双端150 bp测序文件(由美格生物科技有限公司完成)。总微生物细胞组分DNA的测序深度约为40 Gb,病毒DNA的测序深度约为10 Gb。
使用Soil RNA Mini Kit(OMEGA Bio-tek)提取污水处理厂A和C的污水或污泥样本的RNA。使用NEBNext®UltraTM Directional RNA Library Prep Kit for Illumina(NEB)构建链特异性宏转录组文库。宏转录组测序采用150 bp双端策略,测序深度大约20 Gb。由诺禾致源在Illumina NovaSeq 6000平台上进行测序。宏基因组和宏转录组数据集的详细信息列在表S1中。
通过我们之前研究中建立的流程从非浓缩(NC)宏基因组中恢复MAGs。如图1所示,原始Illumina数据通过fastp(v0.23.2)过滤。使用metaSPAdes(v3.15.5)将过滤后的序列文件组装成重叠群。通过使用BASALT(v1.0.0)分箱从重叠群中复原MAGs。通过CheckM(v1.2.2)评估MAGs的完整性和污染度。使用dRep(v3.4.2)对MAGs进行去重复处理,参数为:‘-sa 0.95 -comp 40 -con 20 -nc 0.30’。通过GTDB-Tk(v2.1.1)进行MAGs的物种分类。每个样本中MAG的相对丰度以RPKM值表示,相对丰度通过CoverM(v0.6.1)(https://github.com/wwood/CoverM)计算,参数为:‘genome --min-read-aligned-percent 75 --min-read-percent-identity 95 --min-covered-fraction 75 -m rpkm’。
通过图1所示的流程从宏基因组数据中识别病毒重叠群。只对长度 ≥ 5 kb的线性重叠群或长度 ≥ 1.5kb的环形重叠群进行病毒识别。候选病毒重叠群通过四个工具识别,包括DeepVirfinder(v1.0)、Virsorter2(v2.2.4)、VIBRANT(v1.2.1)和viralVerify(v1.1)。VirSorter2筛选的最大得分 ≥ 0.8,DeepVirfinder筛选的得分 ≥ 0.8且p < 0.05的重叠群为候选病毒重叠群。然后进一步分析这些工具得到的候选病毒重叠群合集。通过CheckV(v.1.0.1)评估候选病毒重叠群的质量和完整性。CheckV和CAT(v5.2.3)识别候选病毒重叠群中的病毒蛋白。只保留含有超过一个病毒蛋白的候选病毒重叠群进入下游分析。过滤后的病毒重叠群通过MMseqs2(v14-7e284)去重复和聚类成病毒操作分类单元(vOTUs),软件运行参数为‘--min-seq-id 0.95 -c 0.8 --cov-mode 1 -e 1E-05 --cluster-mode 2 --cluster-reassign’。每个样本中vOTUs的相对丰度以RPKM值表示,通过CoverM(v0.6.1)计算RPKM值,参数为:‘contig --min-read-aligned-percent 75 --min-read-percent-identity 95 --min-covered-fraction 75 --contig-end-exclusion 0 -m rpkm’。使用R(v4.3.0)计算微生物群落的Shannon和Pielou均匀度指数。基于Bray-Curtis距离的主坐标分析(PCoA)评估群落差异。
病毒重叠群的物种分类遵循国际病毒分类委员会(ICTV)分类规则。通过三种方法进行病毒物种分类注释。首先,应用PhaGCN2(v2.1)进行重叠群物种分类注释,未分类的重叠群通过CAT(v5.2.3)注释,仍未分类的重叠群通过BLASTn比对IMG/VR数据库(v4)进行注释。噬菌体的生活方式通过PhaTYP(v0.3.0)预测。根据其病毒物种初步分类病毒宿主类型。进一步基于CRISPR间隔序列匹配和基因组共享预测病毒与原核生物之间的感染关联。使用CRISPRCasTyper(v1.8.0)从每个MAG中提取CRISPR间隔序列。通过BLASTn比对病毒重叠与CRISPR间隔序列,参数为:‘-task blastn-short -perc_identity 100 -penalty -1 -gapopen 10 -gapextend 2 -word_size 7’。通过BLASTn直接将病毒重叠群与MAG比对以确定它们的宿主,比对参数为:‘-perc_identity 70 -qcov_hsp_perc 75 -evalue 1e-3’。
通过Prodigal(v2.6.3)预测重叠群的开放阅读框(ORFs)。通过CheckV(v.1.0.1)识别高质量病毒重叠群,使用VIBRANT(v1.2.1)分析高质量病毒重叠群中AMGs。通过AMRfinderPlus(v3.11.2)和BLASTp比对SARG数据库(v3.1)进行ARGs的识别,相似性阈值为80%,比对长度阈值为70%。通过CoverM(v0.6.1)计算基因的丰度,计算参数如下:‘contig --min-read-aligned-percent 75 --min-read-percent-identity 95 --min-covered-fraction 75 --contig-end-exclusion 0 -m rpkm’。
通过fastp(v0.23.2)过滤原始的宏转录组序列。通过Bowtie2(v2.5.1)将 过滤后的宏转录组序列映射到病毒重叠群或选定的基因上。通过SAMtools(v1.16.1)统计每个病毒重叠群上的映射序列数。选定基因的表达水平通过RSEM(v1.3.3)计算,并标准化为TPM值。
使用R(v4.3.0)进行统计分析和可视化。通过单因素方差分析(ANOVA)或t检验评估组间的差异显著性。通过Tukey多重比较进行ANOVA的事后检验。
代码和数据可用性声明
所有测序数据已存储在NCBI中,BioProject登录号为PRJNA1065278(https://www.ncbi.nlm.nih.gov/bioproject/PRJNA1065278/)。本文使用的数据集和脚本保存在GitHubhttps://github.com/Z-bioinfo/2024iMeta。所有的补充材料(文本、图、表、中文翻译版本或视频)也可从线上获取。。
引文格式:
Jiayu Zhang, Aixi Tang, Tao Jin, Deshou Sun, Fangliang Guo, Huaxin Lei, Lin Lin, Wensheng Shu, Pingfeng Yu, Xiaoyan Li, Bing Li. 2024. A panoramic view of the virosphere in three wastewater treatment plants treating different types of wastewater by integrating viral-like particle-concentrated and traditional non-concentrated metagenomic approaches. iMeta 3, e188. https://doi.org/10.1002/imt2.188
● 东莞理工学院特聘副研究员,2020年博士毕业于清华大学环境学院。
● 研究专长为环境微生物学和微生物组学,研究方向主要包括新污染物生物转化、抗生素耐药性与环境微生物组学。已发表论文30余篇,其中以第一作者在iMeta、Microbiome、Water Research、Engineering等环境微生物和环境科学领域期刊发表SCI论文10余篇,主持纵向科研课题3项(国家自然科学基金-青年项目、中国博士后基金、广东省基础与应用基础研究基金-青年项目)。
● 清华大学深圳国际研究生院副教授,博士生导师。
● 国家级人才计划青年项目入选者(万人青拔、神农青年英才)、获批广东省杰青项目,曾获教育部自然科学奖一等奖、“国家环境保护专业技术青年拔尖人才”称号,现任JCR1区期刊Applied Microbiology and Biotechnology副主编,巴塞尔公约亚太区域中心化学品和废物环境管理智库专家,并入选2023年全球前2%顶尖科学家“终身科学影响力排行榜”和2023年爱思唯尔“中国高被引学者”。主要研究方向:1、环境耐药性产生与传播,生态风险评估及其削减管控;2、环境病毒组学;3、联用多维组学技术解译新污染物生物转化机理。个人主页:https://www.sigs.tsinghua.edu.cn/lb2/main.htm。
“iMeta” 是由威立、肠菌分会和本领域数百千华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表所有领域高影响力的研究、方法和综述,重点关注微生物组、生物信息、大数据和多组学等。目标是发表前10%(IF > 20)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、前3年免出版费、50万用户的社交媒体宣传等。2022年2月正式创刊发行!发行后相继被Google Scholar、SCIE、ESI、PubMed、DOAJ、Scopus等数据库收录!2024年6月获得首个影响因子23.7,位列全球SCI期刊前千分之五(107/21848),微生物学科2/161,仅低于Nature Reviews,同学科研究类期刊全球第一,中国大陆11/514!
“iMetaOmics” 是“iMeta” 子刊,主编由中国科学院北京生命科学研究院赵方庆研究员和香港中文大学于君教授担任,是定位IF>10的高水平综合期刊,欢迎投稿!
iMeta主页:
http://www.imeta.science
姊妹刊iMetaOmics主页:
http://www.imeta.science/imetaomics/
出版社iMeta主页:
https://onlinelibrary.wiley.com/journal/2770596x
出版社iMetaOmics主页:
https://onlinelibrary.wiley.com/journal/29969514
iMeta投稿:
https://wiley.atyponrex.com/journal/IMT2
iMetaOmics投稿:
https://wiley.atyponrex.com/journal/IMO2
邮箱:
[email protected]