专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
BioArt  ·  Cell Metab | ... ·  3 天前  
生物学霸  ·  读研月薪 4 ... ·  5 天前  
生物学霸  ·  影像组学研究思路和中标统计 ·  6 天前  
BioArt  ·  Nature | ... ·  6 天前  
51好读  ›  专栏  ›  生信人

全球第一,无限可能,MASLD数据共享平台

生信人  · 公众号  · 生物  · 2024-09-02 07:08

正文


哈喽小伙伴们,又到了写国自然的季节,真是漫长的季节呀。如果你想做或即将做慢性病,那今天这篇关于代谢功能障碍相关的脂肪肝病(MASLD)的文章你不容错过!该文章2023年9月发表在《Nature Medicine》(IF/JCR分区:82.9/Q1),其不仅提供了如何做MASLD的思路,还提供了全球第一个MASLD数据共享平台——SteatoSITE。思路和数据都有了,你还在等什么呢?

MASLD是什么病?

代谢功能障碍相关的脂肪肝病(MASLD),先前称为非酒精性脂肪肝病(NAFLD),是一个逐渐增加且被低估的全球公共卫生问题,影响超过四分之一的成年人(超过20亿人),并带来重大的健康和社会经济问题,它的特征是存在心脏代谢风险因素,如肥胖、2型糖尿病、高血压和血脂异常,并与心血管疾病、慢性肾脏疾病以及许多癌症的发病率和死亡率增加有关。值得注意的是,在过去的十年中,患有MASLD相关肝硬化需要肝移植的患者数量增加了十倍,贝叶斯建模预测到2040年全球患病率将惊人地达到55.7%。据2019年的数据显示,我国MASLD患者已超过3.1亿人。


为什么做MASLD?

MASLD的发病机制是复杂且多因素的。过多的脂质积聚是主要的原因,随后由病理驱动因子包括脂毒性和免疫介导的炎症产生可变的影响,而疾病的进展又受到遗传变异和肠道菌群失调等调节因素的增强或抑制。并非所有患有脂肪肝的人都会进展为不良事件或死亡,目前存在缺乏重要的预后生物标志物和尚无用于治疗MASLD的已批准药物,以改善临床上针对MASLD的护理途径和个性化治疗及用药指导。


SteatoSITE数据库(https://steatosite.com)

为了解决MASLD研究中存在的问题,并提供一个适用于在MASLD中开发精准医学策略的资源,作者建立了SteatoSITE。这是全球第一个MASLD研究的数据共享平台。SteatoSITE整合了来自苏格兰的940个病例的多模式多维度回顾性数据,包括对存档肝组织的定量组织病理评估、肝组织总RNA测序(RNA-seq)以及从电子健康记录和其他行政来源中提取的例行临床数据。SteatoSITE具有丰富的结果数据,包括了5.67百万天的临床随访,使得可以进行转化分析以阐明MASLD的发病机制,并加速潜在的预后生物标志物和治疗靶点的发现。


数据库提供病理学信息

每个病例的H&E染色和PSR染色切片的扫描由三名专业从事肝脏病理学的顾问病理学家之一进行评估。从H&E染色的切片中,给出了非酒精性脂肪肝病(NAFLD)活动分数(NAS),脂肪变性、活动性和纤维化(SAF)评分系统的组成部分以及对NASH的独立于分数的临床组织学诊断。从PSR染色的切片中,给出了非酒精性脂肪性肝病(NASH-CRN)和修改后的Ishak纤维化分期评分。图1c显示了NAS关键特征如脂肪变性等与NASH-CRN纤维化分数之间的关系。图1d显示了NASH-CRN纤维化程度与病人生存时间之间的关系。图1e显示了NASH-CRN纤维化程度与病人肝硬化失代偿的关联。这些结果都可在SteatoSITE中根据自己的研究需求复现。


图1:数据库搭建流程和样本病理信息的应用


数据库提供转录组信息

SteatoSITE队列中包括668例肝RNA-seq数据,包括538例活检、39例切取和130例切除。从生物库中检索了正常肝组织对照(n = 39),用于进行RNA-seq分析进行比较。


在对RNA测序数据进行变异检测时,作者还检测了影响MASLD进展最相关的SNPs,分别是基因PNPLA3、HSD17B13、TM6SF2和MBOAT7中的rs738409、rs72613567、rs58542926和rs641738。当样本根据纤维化分期分类时,作者发现在将F0/F1、F2、F3和F4的肝与正常肝对照样本进行比较时,分别有218、478、1,114和2,800个不同表达的蛋白编码基因,在所有阶段与对照组相比则有99个基因差异表达(图2b)。


KEGG富集分析表明,从F2阶段开始,与细胞外基质相关的通路呈富集状态,符合预期。值得注意的是,其他上调的通路与心肌病相关(q < 0.05;图2c)。相反,下调的基因呈现出与信号传导相关的通路富集,主要出现在早期疾病(F0/F1)阶段,而从F2到F4,脂肪酸代谢和过氧化物酶体通路呈富集状态(q < 0.05;图2d)。


除了纤维化程度,SteatoSITE提供根据NAS评分以及性别等分组的转录组信息分析,读者可自行根据需求在作者开发的开放式基因浏览器上(https://shiny.igc.ed.ac.uk/SteatoSITE_gene_explorer/)进行可视化分析。

图2:转录组信息分析


数据库提供单细胞信息

为了确定MASLD疾病谱系中是否存在特定的致病细胞亚群,作者使用来自健康和肝硬化患者的完全注释的scRNA-seq参考数据集,通过对SteatoSITE数据库的RNA-seq数据进行解卷积,估计每个SteatoSITE样本中特定肝细胞类型的比例,并将其与组织病理学特征和患者结果相关联。


作者的研究表明,肝纤维化的关键调节因子——肝瘢痕相关巨噬细胞(SAMacs)与整个MASLD谱系中的肝纤维化阶段和脂肪肝活动呈正相关(图3a)。相反,组织驻留巨噬细胞的比例在进展的纤维化阶段显著下降(图3a)。在一个独立的MASLD组织学数据集(n = 43)中使用专门的肝脏多重免疫荧光分析验证了这些转录组学的发现,确认了肝脏HLA-DR+、CD9+、CD14+和SAMacs细胞数量与肝纤维化阶段呈显著正相关(图3b)。解卷积分析还揭示了纤维化与瘢痕相关的间质细胞、肝动脉内皮细胞和淋巴内皮细胞比例之间存在统计学上显著的正相关关系(图3a),浆细胞的扩增也与进展的肝纤维化相关联(图3a)。


通过对SteatoSITE数据库RNA-seq数据进行单细胞解卷积分析,肝脏中瘢痕相关的巨噬细胞、瘢痕相关的间质细胞、肝动脉内皮细胞、淋巴内皮细胞和浆细胞的比例增加与更高的死亡率(图3c)和肝失代偿事件(图3d)正相关。而血管平滑肌细胞和肝窦内皮细胞,则呈负相关(图3c,d)。肝脏细胞组成的变化可能为MASLD患者提供关键的预测信息。


图3:单细胞信息分析


风险模型预测肝脏失代偿

SteatoSITE数据库还可提供预后模型开发。为了演示,作者使用了SteatoSITE RNA-seq数据和相关的临床结果,开发了一个新型的基于转录组的肝脏失代偿风险预测模型。


作为初始特征集,作者使用了在晚期(F3/F4)与早期(F0/F1)疾病阶段之间差异表达的1,127个蛋白编码基因(P<0.05,对数折叠变化(FC)≥1)。单变量Cox回归确定了与失代偿事件显著相关的955个不同评估基因(DEGs)(P<0.01)。作者进行了十次十折Lasso正则化Cox回归,并推导出所选基因的系数。最终预测肝脏失代偿的模型由15个基因的表达组成:MT1F、KCNH7、COL25A1、RASD2、CTGF、STC1、GDNF、PRRX1、FGF7、LCNL1、DPEP1、CHRDL2、LHX6、POU4F1和 CDH16。读者可在可视化浏览器上看到这几个基因在不同纤维化阶段的表达。


根据模型将患者分为高风险组和低风险组(图4a)。有趣的是,风险分数较高的样本不仅具有较高的纤维化阶段,而且还具有较高的肝细胞球形变分数(图4b)。使用ROC曲线评估模型在活检后特定时间的预测能力,1年、3年和5年的失代偿风险AUC值为86.24%,80.97%和83.26%(图4c)。所有活检样本都可以使用模型分为高风险组和低风险组,同样的,其肝失代偿轨迹差异显著(图4d,e)。


图4:预后模型开发


疾病进展的调节因子分析

SteatoSITE数据库还可提供疾病相关调控网络分析。调控子根据活性分为两大类群:在晚期纤维化中活性高且在早期阶段活性低的类群,以及呈相反模式的类群。作者研究表明,三个调控子AEBP1、THRB和BNC2调控的基因网络可能对MASLD疾病进展并发生失代偿事件起关键作用。


推断的AEBP1、THRB和BNC2调控子之间的关系如图5c所示,标注了每个靶基因的调控方向。AEBP1和BNC2的大多数靶基因呈正调控,而THRB对与AEBP1和BNC2共享的靶基因主要施加负调控。


考虑到THRB可能对促病核心靶基因具有抑制作用,并且因为THRB激动剂目前正在进行MASLD的临床试验,作者更详细地研究了THRB调控子的活性并作为示范。作者在进行活检之前没有发生肝脏失代偿的病例中,估计了调控子活性的差异,并检验了THRB调控子活性对失代偿事件的预测价值。THRB调控子差异活性排序图证实了在仅限于活检的子集中THRB调控子活性与疾病阶段之间的负相关关系,生存分析图表明较低的THRB调控子活性与肝脏失代偿有关(图5)。除了THRB外,读者也可根据自己感兴趣的调控因子在SteatoSITE数据库中进行相关分析。


图5:疾病进展相关调控因子分析


小编总结

SteatoSITE为MASLD研究提供了基础,其中包括MASLD病理信息、转录组信息、以及单细胞信息等多模态数据库。该资源可用于引导药物和生物标志物的开发,SteatoSITE还包含高分辨率的全玻片图像目录,可作为新型数字病理学算法的宝贵测试平台。感兴趣的小伙伴们快快使用起来吧!


参考文献:

Timothy J Kendall, Maria Jimenez-Ramos, et. An integrated gene-to-outcome multimodal database for metabolic dysfunctionassociated steatotic liver disease. Nat Med. 2023 Nov;29(11):2939-2953. doi:10.1038/s41591-023-02602-2. Epub 2023 Oct 30.


更多精彩生信知识和技术分享

欢迎添加微信


图文排版|CY
文章转载请联系 | 15510012760(微信)


往期热点 (点击标题跳转)

01

肿瘤免疫逃逸新机制

02

孟德尔随机化

03

生信+实验结合

04

单细胞空间转录组

05

肿瘤相关巨噬细胞(TAM)

06

细胞死亡

07

耐药


文章转载请联系 | 15510012760(微信)