专栏名称: 生信宝典
生物信息分析入门、晋级和经验分享。Linux、R、Python学习教程;高通量测序数据分析学习教程;生信软件安装教程。所有内容均为原创分享,致力于从基础学习到提高整个过程。
目录
相关文章推荐
BioArt  ·  ​Cancer ... ·  3 天前  
BioArt  ·  Cancer Discovery | ... ·  3 天前  
生物学霸  ·  4.2 亿,这一高校,被出售 ·  4 天前  
51好读  ›  专栏  ›  生信宝典

NAR | 香港城市大学李帅成课题组连续推出三大生物信息学数据库,全面解析微生物组学研究关键要素

生信宝典  · 公众号  · 生物  · 2024-12-09 21:00

正文

引言







近期,香港城市大学李帅成课题组连续在Nucleic Acids Research发布了三个重要的生物信息学数据库:PhageScopePlasmidScopeGutMetaNet,分别针对肠道微生物组中的基因水平转移和功能冗余、噬菌体基因组以及质粒序列进行系统性注释和分析,为微生物组学研究提供了强大的工具支持。



PhageScope:全面注释与自动分析的噬菌体数据库






香港城市大学李帅成课题组的王若涵博士和博士生杨烁为共同第一作者,香港城市大学李帅成教授为该论文的通讯作者。感谢香港科技创新基金对本项研究的资助。

随着多药耐药性问题的日益严重,噬菌体作为治疗细菌感染的替代方案得到了越来越多的关注。要深入研究噬菌体的基因组,并将其应用于医学领域,准确的注释和全面的数据分析至关重要。然而,现有的噬菌体数据库通常缺乏详细的基因组注释,无法满足科学研究和应用需求。为此,香港城市大学李帅成课题组开发了PhageScopehttps://phagescope.deepomics.org),一个集成了全面注释的在线噬菌体数据库,旨在为噬菌体研究提供丰富的数据和自动化分析工具。(图1)

图1. PhageScope数据库概览


PhageScope 的主要特点包括:

1. 海量的噬菌体序列收录:PhageScope 从多种公开数据库和文献中收录了873,718条噬菌体序列,涵盖了多种来源,建立了一个庞大的噬菌体资源库。

2. 自动化注释与分析:应用15种前沿的工具,PhageScope 对噬菌体基因组进行系统化注释,包括基因组完整性评估、宿主范围预测、生活方式分类、基因功能注释等。该平台还支持自动化的基因组比较分析,提供序列聚类、序列比对和进化树构建等功能。

3. 详细的功能基因注释:PhageScope 涵盖了对开放阅读框(ORFs)、转录终止子、tRNA、抗CRISPR蛋白、CRISPR阵列、毒力因子和抗菌素抗性基因等多个功能基因的注释,帮助研究者更好地理解噬菌体的遗传特性。

4. 用户友好的平台设计:PhageScope 提供了高质量的可视化工具,支持用户上传自定义的噬菌体序列进行分析。研究者可以快速获得分析结果和可视化图表,并轻松将其整合到学术报告中。

图2. PhageScope在研究噬菌体基因组上蛋白质的可视化分析工具

PhageScope 提供的丰富注释和强大的自动化分析工具,能够帮助研究人员深入探讨噬菌体在微生物生态系统中的作用,探索噬菌体与宿主的相互作用机制以及其在基因组水平上的独特特征。这一平台不仅为噬菌体基因组学提供了重要的研究支持,也为噬菌体疗法的开发提供了基础数据和分析能力。(图2)


PlasmidScope: 全面注释、在线分析和交互可视化的质粒数据库






深圳先进院助理研究员李寅虎、研究助理陈姁桦和西北工业大学助理教授冯喜康为该论文共同第一作者,深圳先进院陈宇研究员和香港城市大学李帅成教授为该论文的共同通讯作者。感谢国家自然科学基金、广东省自然科学基金等研究计划对本项研究的资助。

随着对微生物群落研究的深入,质粒作为重要的可移动遗传元件,在抗性传播、毒力表达和代谢调节等方面发挥着关键作用。尤其在"脑-肠轴"通讯中,质粒介导的基因转移可能影响多种神经系统疾病的发生发展。为满足对质粒全面分析的需求,深圳先进院和香港城市大学的研究团队开发了PlasmidScope,一个整合了丰富注释和在线分析工具的质粒数据库。(图3)

图3. PlasmidScope数据库概览


PlasmidScope的主要特点包括:

1.海量数据整合:收录了来自10个公共资源库的852,600个质粒序列,涵盖了25,231,059个预测基因,建立了全面的质粒资源库。

2.系统化注释:提供了详细的背景信息和功能注释,包括:

◆ 基因组特征:完整性评估、拓扑结构、流动性

◆ 功能元件:tRNA、tmRNA、信号肽、跨膜蛋白、CRISPR/Cas系统
◆ 功能基因:抗生素抗性、毒力因子、代谢基因簇
◆ 蛋白结构:使用ESMFold进行三维结构预测

3.在线分析工具:集成了多种分析功能,支持数据交叉比较和查询,并提供交互式可视化界面。

4.疾病关联研究:支持探索质粒在疾病发生中的作用,如阿尔茨海默症相关的肠道菌群质粒分析。


应用实例:

研究团队利用PlasmidScope分析了阿尔茨海默症患者肠道中脆弱拟杆菌的质粒特征:

1

发现464种质粒,其中43种具有完整环状基因组和移动性


2

识别出1,726个功能基因,包括抗性和毒力基因


3

发现质粒CP103137.1携带色氨酸合成相关基因,为研究疾病机制提供新线索(图4)

PlasmidScope为质粒研究提供了强大的数据支持和分析工具,有助于深入理解质粒在微生物群落中的作用及其与人类疾病的关系。这一平台的建立为探索"脑-肠轴"调控机制提供了重要的研究基础。

图4. PlasmidScope在研究阿尔茨海默症(AD)相关肠道菌群中质粒的应用


GutMetaNet: 人类肠道微生物水平基因转移和功能冗余性整合数据库






香港城市大学李帅成课题组的蒋熠琦博士,研究助理王砚斐,博士生车力佳杨烁,病原微生物生物安全国家重点实验室的张湘莉兰副研究员为共同第一作者,香港城市大学李帅成教授为该论文的通讯作者。感谢深圳市科技计划对本项研究的资助。

随着宏基因组研究的深入,水平基因转移(HGT)和功能冗余(FR)在塑造肠道微生物群功能和适应性方面的关键作用日益凸显。然而,现有的数据库缺乏对这些复杂互作关系的系统整合和分析。为此,香港城市大学的研究团队开发了GutMetaNet(https://gutmetanet.deepomics.org),一个首创的整合人类肠道微生物组HGT和FR分析的数据库。(图1)

图5. GutMetaNet数据库概览


GutMetaNet的主要特点包括:

1.大规模数据整合:收录了来自96个研究项目的21,567个人类肠道宏基因组样本,涵盖66种健康状况,建立了一个全面的微生物组资源库。

2.系统化的HGT分析:通过LocalHGT方法识别了14,636个HGT事件,并将其归类为8,049个集群。这些事件被注释为转座子、前噬菌体、整合可移动元件等多种移动遗传元件。

3.功能冗余特征描述:采用创新的分析方法,对每个样本进行FR分析,揭示微生物群落的功能稳定性和适应能力。

4.完整的元数据信息:提供详细的样本信息,包括国家、健康表型、性别、年龄等,便于进行多维度分析。

5.自动化分析工具:配备专门的可视化功能,方便研究人员探索HGT网络和FR模式,快速获取分析结果。

图6. HGT可视化样例
GutMetaNet通过整合HGT和FR分析,为研究人员提供了探索微生物互作关系的综合平台。这一资源不仅有助于理解肠道微生物组的适应机制,还为相关疾病的诊断和治疗提供了重要的数据支持。此外,该平台的自动化分析工具能够帮助研究者更高效地进行数据挖掘。


结 语






这三个创新数据库的发布,标志着微生物组学研究工具进入了新的发展阶段。PhageScope、PlasmidScope和GutMetaNet分别从噬菌体、质粒和微生物群落互作关系等不同维度,为研究人员提供了全面的数据资源和分析工具。这些数据库不仅支持基础科学研究,也为临床应用提供重要参考,将在抗生素耐药性治疗、微生物群落调控以及相关疾病诊疗等领域发挥重要作用。截止目前,总访问量已超10万+,感谢全球科研工作者对这些平台的关注和使用,期待这些工具能够助力更多突破性的科研发现。


高颜值免费 SCI 在线绘图(点击图片直达)


最全植物基因组数据库IMP (点击图片直达)

往期精品(点击图片直达文字对应教程)

机器学习




·END·