7月30日奥运会乒乓球混双大家都看了吗?中国队组合王楚钦/孙颖莎以4∶2战胜朝鲜队组合李正植/金琴英,夺得巴黎奥运会乒乓球混双项目金牌,简直太令人激动了!金牌组合在奥运会中打得如此出彩,就连翻阅文献的小编都抑制不住兴奋的情绪,这不就想给大家分享篇如王楚钦和孙颖莎这般绝佳搭档组合的生信文献!要论当下热门的生信方法是啥,那孟德尔随机化(MR)和机器学习应该位列前茅,如果这俩组合在一起也不可不称之为绝佳搭档!接下来,大帆分享一篇相关文献,
该研究利用
MR、3种机器学习算法
及经典生信方法来确定共病的
潜在生物标志物
,最后对关键基因进行了简单qPCR实验验证,凭借创新方法即刻拿下中科院二区SCI!思路简单易复现,也太让人心动了!
PS:如果你也想利用“
孟德尔随机化
”和“
机器学习
”两大创新方法,0实验或简单实验拿下高分SCI ,那就来找大帆设计思路、定制分析吧~
题目:
使用孟德尔随机化和转录组学分析研究 BMI>30急性胰腺炎患者的潜在生物标志物
杂志:
Lipids in Health and Disease
急性胰腺炎(AP)是由多种因素引起的显著的炎症反应。有研究显示,与BMI正常的人相比,BMI为23或更高的人患严重AP的风险显著增加。目前,关于BMI和AP之间因果关系的研究有限,并且很少有研究确定高 BMI状态和AP的共同诊断生物标志物。
数据来源
数据集/队列
|
数据库
|
数据类型
|
详细信息
|
GSE151839
|
GEO
|
RNA-seq数据
|
包含10 名肥胖(BMI 35-50)和10 名非肥胖(BMI 18.5-26.9)个体的皮肤和脂肪组织样本
|
GSE44000
|
GEO
|
RNA-seq数据
|
包含7名肥胖(BMI>30)和7名非肥胖(BMI<25)个体皮下脂肪组织
|
GSE194331
|
GEO
|
RNA-seq数据
|
包含32 名健康个体和 87 名诊断为 AP 的个体的全血样本
|
GSE109227
|
GEO
|
微阵列
|
包括6例实验性急性胰腺炎小鼠和4例对照小鼠
|
GSE166047
|
GEO
|
RNA-seq数据
|
包含5名健康正常体重女性、5名肥胖女性、5例肥胖男性的皮下脂肪组织样本
|
另外,脂质代谢相关基因(LMRGs)来自NCBI数据库,BMI数据来自IEU数据库,AP 数据是从 IEU 数据库。
研究思路
首先,通过MR分析确定BMI与AP风险的因果关系。其次,通过差异表达基因(DEG)分析、加权基因共表达网络分析(WGCNA)识别与AP和BMI升高相关的关键模块化基因,并进行功能富集分析揭示疾病的发病机制。接着,通过机器学习算法识别关键基因,并进行共定位分析。最后,使用外部数据集对基因表达趋势进行了初步验证,并通过小鼠模型证实这些基因的诊断潜力。
通过
MR分析
显示,遗传变异的ukb-a-248、ukb-b-2303、ukb-b-19953与ukb-b-19388呈显著因果关系,表明
BMI与AP风险呈正相关
(图1);通过敏感性分析证实了结果的可靠性。
图1 BMI对AP的因果效应
通过
DEG分析
、
WGCNA
等确定了
698个
肥胖相关 DEG(ORDEGs)、
4828 个AP相关DEG(APRDEGs),通过
Venn分析
筛选出
21个常见DEGs(CDEGs),这些CDEGs是基于脂质代谢的BMI>30患者AP的潜在标记基因
;通过
基因本体论(GO)分析
表明,交叉基因可能与神经炎症反应的调节、T-helper 2细胞分化的调节和炎症反应的调节有关;通过
京都基因和基因组百科全书(KEGG)分析
表明,这些基因可能主要与胞质DNA感应通路和细胞因子-细胞因子受体相互作用有关(图2)。
图2 交叉基因的富集分析
通过
LASSO回归、RF算法、SVM-RFE算法
从21 个CDEGs中鉴定出 5 个基因(ACSS2、MBOAT2、LRIG1、IL18、HADH)作为 AP 的潜在生物标志物,4个基因(MMP9、ABCA3、HADH、ESR1)被鉴定为BMI>30的潜在生物标志物;初步确定