专栏名称: 生信人
共同学习生物信息学知识,共同探究生物奥秘。
目录
相关文章推荐
生信宝典  ·  Nature Methods | ... ·  2 天前  
BioArt  ·  Nat ... ·  3 天前  
生物制品圈  ·  翻译协作 | mRNA疫苗的研发趋势 ·  4 天前  
51好读  ›  专栏  ›  生信人

升级版孟德尔随机:单细胞+共定位

生信人  · 公众号  · 生物  · 2023-06-05 07:00

正文

June

概普生物 2023

NEW TOPIC

星标“生信人”精彩不错过



今天分享的文章“肥胖相关的2型糖尿病患者血液基因表达的改变可能与脂质代谢有关(孟德尔随机化分析)于2023年2月发表在Diabetologia,IF 10.46/Q1。



热门数据挖掘新思路

单细胞数据+eQTL创建疾病分型

扫码咨询


作者旨在鉴定不同类型2型糖尿病患者全血中差异表达的长链非编码RNA (lncRNAs)和mRNA:严重胰岛素缺乏型糖尿病(SIDD)、严重胰岛素抵抗型糖尿病(SIRD)、轻度肥胖相关糖尿病(MOD)、轻度糖尿病(MD)和轻度糖尿病伴高HDL -胆固醇(MDH)。增加作者对2型糖尿病不同的患者集群的分子机制的理解。最终发现多个lncRNA和mRNA在不同类型2型糖尿病患者集群中表达差异,特别是在MOD集群中。MOD簇中的mRNA可能对人体测量特征、脂质代谢特征和血细胞组分有因果影响。


总之,作者的研究结果表明,MOD集群中的个体表现出基因的异常RNA表达,这些基因在多种糖尿病相关性状中具有潜在的因果作用。



01

背景

Part One



糖尿病患者作为一个群体是异质的,迫切需要进一步分层。长链非编码 RNA (lncRNA) 是长度超过 200 个核苷酸的调节性 RNA。基因组的大部分由非编码 RNA 组成,包括 lncRNA,它们不会被翻译成功能性蛋白质。lncRNA 是基因表达的调节因子,例如通过 mRNA 衰变直接影响蛋白质的产生。有多个例子表明 lncRNA 参与调节与糖尿病并发症发展相关的通路。虽然患者集群在临床结果和糖尿病进展方面存在差异,但它们在分子水平上的差异在很大程度上尚不清楚。先前的研究已经发现胰岛素抵抗集群具有更高的支链氨基酸、二酰甘油和三酰甘油水平,并且血浆中富含细胞内磷酸肌醇 3-激酶 (PI3K)/Akt 通路中的蛋白质。此外,与肥胖相关的集群显示出更高的细胞因子水平。


作者假设这些代谢差异也反映在分配给五个集群之一的 2 型糖尿病患者的全血基因表达中。为了解决这个问题,作者调查了分配给先前确定的五个集群之一的 2 型糖尿病患者全血中 lncRNA 和 mRNA 水平的差异。作者还使用双样本孟德尔随机化 (MR) 研究了对这些 mRNA 的遗传影响以及这些 lncRNA 和 mRNA 在糖尿病相关性状(例如脂质代谢和人体测量指标)中发挥暗示性因果作用的程度。



02

方法

Part Two


1

数据

Hoorn糖尿病护理系统(DCS)队列是一个开放的前瞻性队列,包括人体测量和实验室测量。2013年和2014年从1033名之前参与过生物库的人身上收集了RNA血液,没有任何特定的选择标准。从这一组中,根据以下标准选择400人进行RNA测序:发病年龄在40至75岁之间;欧洲血统;糖尿病病程<10年;估计eGFR>30毫升/分钟。


基因表达数量性状位点(eQTL):lncRNA和mRNA顺式基因表达数量性状位点(eQTL)从公开数据集中获得;IEU OpenGWAS查找与eQTL相关的性状特征,这些特征被分为八类:人体测量、脂质代谢、心脏代谢、代谢物/蛋白质、白细胞组分、红细胞、骨骼和其他。

2

2型糖尿病的分类

DCS队列中2型糖尿病患者的集群分类基于五个临床变量:首次就诊年龄(年);BMI (kg / m2);糖化血红蛋白(mmol/mol);c肽(nmol/l)和高密度脂蛋白胆固醇(mmol/l)。集群按性别分层,并根据k-means进行定义。以下五个集群被定义为:胰岛素缺乏集群(SIDD),胰岛素抵抗集群(SIRD),肥胖相关集群(MOD)和轻度集群低高密度脂蛋白胆固醇水平(MD)和高高密度脂蛋白胆固醇水平(MDH)。

3

血细胞组分

使用UniCel DxH 800 Coulter细胞分析系统和FC 500 Series系统在所有具有RNA-seq数据的个体中测量中性粒细胞、淋巴细胞、单核细胞、嗜酸性粒细胞和嗜碱性粒细胞的水平。

4

双样本的MR分析

为了估计lncRNA、mRNA与性状之间的因果关系,使用TwoSampleMR R包(v0.5.6)进行了双样本MR分析。


去除连锁不平衡(LD)中的SNPs r2<0.001,以获得独立的SNPs,阈值使用(p<×10−8);使用F统计量= (β/SE)2评估每个SNP的工具强度。对于单一工具变量,使用Wald比值检验;在多工具变量的情况下,使用反方差加权(IVW)方法;散点图将SNP对暴露的影响与SNP对结果的影响的可视化;森林图可视化多种工具变量的估计值;漏斗图直观地评估异质性;使用coloc R软件包(v5.1.0.1)进行共定位分析以评估多效性(作为MR的敏感性分析的一部分。),计算PP3和PP4的后验概率(阈值:PP4/(PP3+PP4)>0.8)。

5

外部验证 (IMI DIRECT study)

创新药物倡议糖尿病患者分层研究(IMI DIRECT)用于验证差异表达的RNA。



03

结果

Part Three


1

糖尿病患者集群的临床特征

所有参与Hoorn DCS生物库的2型糖尿病患者(n=2953),利用年龄、BMI、HbA1c、HDL -胆固醇和c肽等特征将2型糖尿病患者分为5类:SIDD、SIRD、MOD、MD和MDH。(图1a-f)。由高HbA1c定义的SIDD集群占个体的11% (n=26)。20%的研究人群聚集为SIRD, 21%为MOD, 27%为MD, 21%为MDH。


图1

2

不同的患者集群间的血细胞组分没有差异

进一步分析了不同的患者集群中,外周血细胞组分是否有差异。在未经调整的模型中,中性粒细胞水平在MD簇中较低。SIRD组淋巴细胞水平较高。因为因为年龄可以影响血液中白细胞的含量、白细胞组分与BMI相关,作者调整了年龄、BMI,在调整后的模型中,血细胞组分在患者集群之间没有差异。

3

lncRNA和mRNA在患者集群间的表达不同

在表达的574个lncRNA中,作者分别鉴定出与各患者集群相关的lncRNA、mRNA;在集群间差异表达的lncRNA、mRNA;并Spearman 相关性分析这些lncRNA、mRNA与五个临床变量的关联(图2a-2f)。


最后,研究了MOD集群中差异表达的lncRNA与mRNA之间的两两相关性;鉴定了65个在其他研究中未观察到的额外基因


图2

4

外部验证集验证

外部验证集IMI DIRECT研究的特征与训练集相匹配(图3a-f);


基于在训练集的患者集群间差异表的lncRNA、mRNA,分析其在IMI DIRECT不同患者集群间的表达差异、 差异表达lncRNA、mRNA的效应大小(图3g-h);接下来,作者继续对训练和验证队列中的Bonferroni显著lncRNA和mRNA进行分析。


图3

5

MOD集群中差异表达的mRNA可能具有因果作用

为了研究这些lncRNA和mRNA对临床性状(表型)潜在的作用,作者从先前发表的数据集中选择了顺式的基因表达数量性状位点(cis- eQTL)。将cis- eQTL与IEU OpenGWAS数据库中已发表的GWASs进行比较。总的来说,1个cis-eQTL与1个lncRNA的表达相关,207个顺式eQTL与103个mRNA的表达相关(r2<0.001)。作为工具的SNP的平均F统计量的范围为43.2-2113.4,表明工具较强。


接下来,对MOD集群中的lncRNA和mRNA以及在IEU OpenGWAS数据库中发现的相关性状进行了双样本孟德尔随机化(MR)分析


作者想要估计这些mRNA可能与IEU OpenGWAS数据库中发现的特征之间的因果关系。进行双样本MR检验。总共有52种mRNA被证明对217种与人体测量、脂质、血细胞组分等性状具有潜在的因果效应。


23种mRNA与人体测量特征有因果关系。作者发现KCNH2对人体测量特征的因果关系最强:没有发现异质性(Q=0.74, p=0.39)、多效性(5×10−5)和反向因果关系(p=0.96)的证据;共定位分析不支持这种因果效应(PP.H4=0)。六种mRNA显示出对BMI的因果关系。


10种mRNA与所有脂质代谢性状都有因果关系,一些mRNA与几乎所有脂质代谢性状都有因果关系,而另一些mRNA仅与一种脂质性状有因果关系,例如LDL-胆固醇。共定位分析支持了这种因果关系(PP.H4=0.99) (ESM表12)。同样,作者没有发现异质性(Q=0.86, p=0.35)、多效性(2×10−4)和反向因果关系(p=0.81)的证据(ESM表12)。


19种mRNA对白细胞组分有因果影响,CEBPE对几乎所有白细胞(嗜碱性粒细胞、嗜酸性粒细胞、粒细胞、单核细胞和中性粒细胞)都有因果影响。共定位分析支持了这些因果效应(PP.H4>0.8) 。


图5



04

讨论和结论

Part Four



作者鉴定了11个lncRNA和175个mRNA在MOD簇中差异表达。lncRNA与MOD簇中差异表达的mRNA之间存在很强的相关性。差异表达基因在IMI DIRECT研究中得到了很大程度的验证。多个mRNA与人体测量学、脂质代谢和血细胞组分相关的多个性状有因果效应关系。总之,作者的研究结果表明,MOD集群中的个体表现出基因的异常RNA表达,这些基因在多种糖尿病相关性状中具有提示的因果作用。


热门数据挖掘新思路

单细胞数据+eQTL创建疾病分型

扫码咨询



往期热点 (点击标题跳转)

01

线粒体质量控制

02

孟德尔随机化

03

成纤维细胞(CAFs)

04

单细胞空间转录组

05

肿瘤相关巨噬细胞(TAM)

06

细胞死亡

07

耐药



课题设计 | 组学测序 |生信分析

培训工具 | 热点互动 | 资源互换


图文排版|CY

文章转载请联系 | 15510012760(微信)

广告商务合作 | 18501253903(微信)