人类肠道菌群已被越来越多地用作非侵入性疾病筛查和诊断的生物标志物,以及疾病治疗和干预的靶点。本文将解读最近发表在Gut Microbes上的三篇文献,探索机器学习在肠道菌群研究中的应用。第一篇文献[1]通过机器学习分类器对20种疾病的多个队列进行交叉验证,结果显示肠道菌群在诊断多种疾病方面具有潜在的应用前景。第二篇文献[2]发现,对于克罗恩病的诊断,肠道微生物的基因比物种和单核苷酸变异(SNVs)有更好的预测效果,结合人工智能技术可以在多个队列的数据中实现高效诊断。第三篇研究[3]发现,肝癌临床诊断前存在着明显的微生物组成特征,这些特征可以用来实现早期诊断。这些研究表明,机器学习在微生物与疾病之间的关系研究中具有广泛应用前景。
一、肠道菌群作为20种疾病的独立诊断工具:机器学习分类器和交叉队列验证[1]为了疾病诊断的目的,机器学习(ML)分类器也经常单独或结合临床相关特征来训练,以区分患者和对照组。这些ML模型通常在同一队列的留存样本上进行验证,以评估预测性能,如受试者工作特征曲线下面积(AUCs)(即队列内验证(intra-cohort validation))。然而,在所有可用的数据集中,关于肠道微生物组变化的跨队列可重复性的系统评价尚未进行;此外,重现性的影响因素(即决定因素)还有待探究。因此,迫切需要测试和验证肠道微生物组作为诊断工具的跨队列可重复性,以及疾病生物标志物的跨队列一致性。在此,我们系统地评估了基于肠道微生物组的机器学习分类器区分20种疾病的跨队列性能。如图1a所示,从公共数据库中收集了134种疾病、361个人类肠道微生物组样本(对照组仅包括健康表型)。最终筛选得到符合条件的项目有69个,包含20种疾病。然后对同一种疾病、同一种数据类型的项目用不同的方法建模和跨队列(外部)验证,这些建模和验证方法受到该疾病队列规模(n)的影响。首先,对n≥2的所有疾病,通过队列内建模(即构建单队列分类器)进行分析。其次,只对n≥3的疾病进行单数据集留一(LODO)分析(组合队列建模方法之一)。第三,仅纳入n≥5的疾病,通过队列-累积模型(CCM)和样本-累积模型(SCM)进行分析(联合队列建模方法)。如图1b所示,这些疾病跨越5大疾病类别,每个疾病有2个或2个以上队列。图1c展示了各队列样本数密度图。病例和对照的中位数样本量分别为48和47。(1)使用单队列分类器,在队列内验证中获得了较高的预测精度(~0.77 AUC),但在跨队列验证中,除了肠道疾病(~0.73 AUC)外,其余预测精度较低。(2)为了提高非肠道疾病的验证效果,构建了基于多个队列的组合队列分类器,并估计了所需的样本量,以达到> 0.7的验证精度。(3)此外,观察到在肠道疾病中使用宏基因组数据的模型性能高于16S扩增子数据。(4)进一步使用相似性指数来量化跨队列标志物一致性,并观察到类似的趋势。总之,该研究结果表明肠道微生物组可以作为肠道疾病的独立诊断工具,并揭示了改善跨队列性能的策略。在这项研究中,对20种疾病进行了全面的荟萃分析,使用了83个病例对照队列,总共9708个样本;这些疾病跨越5大疾病类别,每个疾病有2个或2个以上队列。该研究使用最先进的工具进行了队列内和联合队列建模和预测验证,评估了影响预测准确性的因素,并推荐了提高交叉队列验证性能的策略,以支持肠道微生物来源的分类器可以作为疾病预测工具。图1 文献一实验设计方案、数据集信息和队列内验证结果二、在人工智能赋能的多队列粪便宏基因组上,微生物的基因优于物种和SNVs作为克罗恩病的诊断标志物[2]克罗恩病(Crohn's disease,CD)是炎症性肠病(inflammatory bowel disease,IBD)的两种主要形式之一。目前,CD的诊断主要是基于内镜、影像学和病理学检查结果的联合评估。然而,内镜的诊断能力往往受到患者依从性、肠道准备质量和其他不可控因素的限制。血清学和粪便生物标志物,如C反应蛋白和粪便钙卫蛋白,已被用作评估IBD炎症活动的指标。然而,这些生物标志物的准确性和特异性并不令人满意。最近,微生物标记物已成为IBD的潜在诊断标志物。值得注意的是,物种丰度可能不是微生物功能的准确表征,因为许多肠道微生物物种的命名目前正在不断调整。在这方面,微生物基因及其多态性的诊断价值已成为研究热点(图2b)。目前,缺乏对CD在物种、基因和SNV水平上的多维特征的综合研究,在临床上似乎是有必要的。在本研究中,收集了来自8个队列的1418份宏基因组测序(Whole metagenome sequencing,WMS)样本(图2a),共包括870例CD患者和548例健康对照。进行了三个层次的分析:物种、基因和微生物SNV层次(图2b),构建了CD的诊断模型并进行了系统评价。研究的整体工作流程:首先,识别微生物的改变,鉴定出肠道微生物组的差异性多维特征。随后,构建诊断模型,并根据模型在内部和外部验证中的表现,选择最佳模型。最后,对模型的疾病特异性进行评估,并进行模型解释,最终确定肠菌标志物,然后通过qRT-PCR分析验证生物标志物。共鉴定出227个物种、1047个微生物基因和21877个微生物SNVs在CD和对照之间存在显著差异。物种、基因和SNV模型的平均AUC分别为0.97、0.95和0.77(图3)。值得注意的是,基因模型表现出优越的诊断能力,其内部和外部的平均AUC分别为0.89和0.91。总之,这些结果揭示了CD患者体内微生物群落的多维变化,并为CD诊断提供了通用和可靠的生物标志物。三、肝癌临床诊断前的微生物组成特征可以用来实现早期诊断[3]肝癌(HCC)是最致命的恶性肿瘤之一,其发病率和死亡率在全球范围内呈上升趋势,每年导致超过70万人死亡。由于缺乏精确预测的生物标志物,相当比例的患者被发现时已处于晚期,错过了手术根除的最佳时机。目前HCC通过血清AFP水平和影像学检查确诊。然而,作为HCC的唯一标准预测因子,AFP水平在其他情况下也可升高,如活动性肝炎、性腺胚胎瘤、继发性肝癌、妊娠等,在一定程度上限制了其特异性。因此,迫切需要开发一种全新的、具有较高准确度的标志物,以提高预期寿命。就HCC而言,它有一个复杂的病因,经常伴随着微生物组的明显变化。口腔、肠道和肿瘤微生物群被认为是胃肠道恶性肿瘤发生和发展的重要调节因子。然而,很少有研究关注不同身体区域内常驻微生物的存在和关联。在此,我们旨在揭示“oral-gut-tumor microbiome”微生物组的特征及其在肝癌(HCC)中的诊断性能。(1)回顾性发现队列包含364例HBV-HCC患者和160例对照:口腔和粪便样本;(2)前瞻性验证队列包含91例HCC和124例对照;以及48例HBV和39例乙型肝炎病毒肝硬化患者。(1)通过随机森林分析,在前瞻性队列中验证了回顾性队列的发现,鉴定出能够区分HCC和对照的10个口腔菌属和9个肠道菌属,曲线下面积(AUC)值分别为0.7971和0.8084。(2)当合并有影响的分类单元时,分类器的AUC增加到0.9405。(3)当与血清甲胎蛋白(AFP)水平结合时,模型性能AUC继续提高到0.9811。(1)具体来说,以链球菌为代表的微生物生物标志物在疾病转变过程中呈现不断增加的趋势。(2)此外,通过荧光原位杂交(fluorescence in situ hybridization,FISH)和5R 16S rRNA基因测序,在肝脏肿瘤和非肿瘤组织中证实了几种优势菌群的存在。总体而言,基于口腔-肠道-肿瘤菌群的研究,为HCC的早期检测提供了一种可靠的方法。在此,该研究前瞻性地评估了91例新诊断的HCC患者和124例对照。收集口腔和粪便样本,以及合适的肝脏肿瘤和正常组织,用于微生物组成16S rRNA基因扩增子测序、IHC和FISH检测。基于19个肠菌属的集合,鉴定了一个明显的微生物特征,具有较高的预测精度。更重要的是,在肿瘤组织中研究了HCC富集的物种,与口腔和肠道菌群有一定的关联,揭示了其在HCC发病机制中的潜在作用。图5 从回顾性数据中建立分类模型,并在前瞻性队列中验证用于区分HCC和对照组近年来,肠菌预测疾病的应用逐渐受到关注,并在疾病的早期诊断和治疗方面具有广泛的应用前景。针对这一领域的最新研究,小编整理了近期发表的相关文献,从广度、深度等多个角度,为读者介绍了肠菌作为疾病的潜在生物标志物的最新应用,希望能帮助到大家~[1] Li M, Liu J, Zhu J, Wang H, Sun C, Gao NL, Zhao XM, Chen WH. Performance of Gut Microbiome as an Independent Diagnostic Tool for 20 Diseases: Cross-Cohort Validation of Machine-Learning Classifiers. Gut Microbes. 2023 Jan-Dec;15(1):2205386. doi: 10.1080/19490976.2023.2205386. PMID: 37140125; PMCID: PMC10161951.[2] Gao S, Gao X, Zhu R, Wu D, Feng Z, Jiao N, Sun R, Gao W, He Q, Liu Z, Zhu L. Microbial genes outperform species and SNVs as diagnostic markers for Crohn's disease on multicohort fecal metagenomes empowered by artificial intelligence. Gut Microbes. 2023 Jan-Dec;15(1):2221428. doi: 10.1080/19490976.2023.2221428. PMID: 37278203; PMCID: PMC10246480.[3] Yang J, He Q, Lu F, Chen K, Ni Z, Wang H, Zhou C, Zhang Y, Chen B, Bo Z, Li J, Yu H, Wang Y, Chen G. A distinct microbiota signature precedes the clinical diagnosis of hepatocellular carcinoma. Gut Microbes. 2023 Jan-Dec;15(1):2201159. doi: 10.1080/19490976.2023.2201159. PMID: 37089022; PMCID: PMC10128432. 图文排版|CY
文章转载请联系 | 15510012760(微信)
广告商务合作 | 18501253903(微信)