小编坚信孟德尔随机化这个分析方法既然出来了就一定会越来越火,使用次数也会越来越高。
七年前,小编刚开始接触医学科研的时候。那时候就是signature 就能发,也就是所谓的纯生信,那一拨科学问题研究过后,确实再分析一遍也没有什么意义。那个时候就有很多人跳出来说生物信息,纯生信不行了,直到七年后的今天,纯生信还在发表。
全新升级版多模态疾病诊断模型
数据有限,先到先得
两个趋势,第一个就是signature+实验验证,只要是这个signature没有研究过,有创新型就可以发表。第二个就是signature内嵌成为文章的一个部分,不仔细看都发现不了。最新的张泽民老师的结直肠癌免疫治疗的动态变化,其中聚类部分就是用的NMF聚类,利用的也就是lasso-cox的建模手段,不耽误发顶刊。
同时在单细胞层面上如果研究缺氧对肿瘤细胞的影响,就是利用缺氧相关的基因集构建signature 看随着肿瘤恶性程度变化的过程,这个就是signature+拟时序分析。
大家仔细的看下大佬研究的单细胞,都是各种signature内嵌在各种细胞中,只不过大佬的研究科学问题更为前沿,数据更为先进。本质还是在单细胞层面或者空转层面或者蛋白层面研究各种signature的变化,纳入因素更多,模型更准确而已。
纯生信signature 分析只会越来越火,但是只用它来发文章,没有新的数据、没有新的技术路线、没有新的临床问题,确实会越来越难。因为评估能不能发表,是看创新性,不是看技术。
分析完纯生信signature 之后,我们看孟德尔随机化。总有一些人带节奏,喜欢一竿子打死一船人,导致很多人都抵制孟德尔随机化。
其实本身问题跟纯生信一样的问题,只用这个方法来随便的组合两个因素看因果,确实太过于草率。
不必连因为饭不好吃,盘子也扔了。那就有点得不偿失了。
看我们解读的北大的(Molecular Psychiatry)文章,利用的就是孟德尔随机,通过因果关系实现SNP共享,来完成组织特异性QTL到疾病特异性QTL的过渡。
如果没有MR,通过测序来完成这个事情,相当高的费用了。
通过MR,建立组织特异性和SNP之间的关联,后续检测也相当方便,这么一个神器,为啥要抛弃。
还有很多肿瘤利用甲基化数据构建模型效果会更好,但是它存在组织特异性并不好取样本,如果能建立各个肿瘤的QTL数据,利用血液的SNP表征,那真是太开心了。老美做的一个研究就是利用GTEx组织的甲基化-QTL 联合疾病的GWAS来建立疾病的甲基化-QTL数据。简单有效,为什么不用。
所以我们还是应该深入的思考下是不是因为我们研究的问题不是很性感,而不是说方法有问题。悲观者永远正确,乐观者收获成果。
最后希望大家多在临床问题上思考,也欢迎找我们合作一起进行课题设计,数据分析。
全新升级版多模态疾病诊断模型
数据有限,先到先得