专栏名称: 小张聊科研
聊聊跟科研有关的感想心得,如基金,文章和实验。
目录
相关文章推荐
实验万事屋  ·  我的课题是巨噬细胞极化,但JAK-STAT、 ... ·  2 天前  
募格学术  ·  多所985高校,拟新增博士点 ·  6 天前  
51好读  ›  专栏  ›  小张聊科研

看别人发的文章,和自己做研究有什么区别?

小张聊科研  · 公众号  · 科研  · 2024-09-24 20:00

正文

对于从事一线科研的人来说,看文献算是日常了,不知道大家有没有这个感觉:看文献的时候感觉很容易,即使是大子刊似乎也就那么回事,当某个领域看多了以后,总结这个方向研究的“套路”其实也不是什么难事

如果受过一些科研训练,即使新接触一个领域,悟性好一些的,大约10来篇文章就能总结出来研究的套路了,第一步做什么,第二步做什么……。问题是有很多人会认为:科研也就这样,好的期刊上的研究无非是创新性好一些,工作量大一些,技术新一些,临床意义好一些,故事讲的好一些……。好嘛,美食家又不是厨师,需要知道怎么做饭吗?可问题是:多数情况下,我们的身份是期刊的审稿人,还是做研究的一线人员?

如果大家自己做过研究,有几个人是特别顺利的?据我了解,大多数人是处处遇到困难,之前学的套路根本用不上:做研究和做饭是不同的,做饭是告诉你先放什么炒几分钟,然后再做什么……,几个步骤完成后起菜
但是自己做研究的时候,排除仪器、试剂等拿不到等问题外,有多大比例的结果是按照我们预期出的(除了操纵数据外)?
所以真正做科研面临的是未知和风险,但是我们学了很多阳性、正面的“套路“,但是科学里面(个人愚见)观察探索、思考判断、挑战已有定论等却越来越少,更很少有讲科研思维、讲数据拿到后如何判断(结果如果与预期不同,到底是方法的问题还是结果就是阴性)、讲基于现有的数据(比如组学数据)如何安排后续的实验,这才是大家遇到问题最多的地方,小到看家基因的Western Blot跑不出来,大到如何基于现有的结果讲好一个Story……

笔者听说过一个比较极端的“故事”:有的课题组团队在项目开始前的文章发现都想好了,甚至连文章的Figure 1到Figure7的A、B、C等都安排好了(包括期刊),接下来就是按照文章的模板(就像房子设计图)出实验结果就行,有人说那做不出来怎么办?据说有的导师会觉得学生笨,当然这里不排除实验方法的问题,但实验结果本来就是阴性呢?

其实这种模块化的思维并非无可取之处,但仅限于入门吧。如果大家入门后再看一些不同的研究,然后再思考一下,就会发现有非常多的漏洞和问题。我们常说“让科研回归科研”,实际上就是在说科研思维。个人愚见:总结科研套路只需要10篇文章,大约1个月就可以了,但是科研思维需要学很多年。我们举个例子:

以大家最熟悉的一个现象来举例:肝癌组织vs癌旁组织做了组学,发现有300个差异基因,下面要挑选基因,很多人是不是知道怎么挑选?

好,套路的回答就是这几个:

1. 根据差异的倍数(比如Fold Change和P值)挑选差异最明显的;

2. 基因做预后分析,与表达差异的趋势要一样;

3. 基因最好是新的,比如基因没有在肝癌中报道过。

还有的会再加上几条:

4. 根据蛋白互作网络PPI,挑选核心基因(hub gene);

5. 根据基因的功能富集,比如某个基因明确调控PI3K-AKT、mTOR、MAPK等细胞增殖有关的基因;或者WNT、EMT等生物学过程、信号通路的基因;

6. 根据基因的分子和生化特性筛选,比如有人愿意做代谢酶、转录因子、表观修饰酶等等,就会选择这些工具酶;

好,还有其它标准可以再添加。

但是问题来了:

1. 这6条里面都是必须的吗?很显然不是,比如3和4、5大概率是矛盾的,我们可以思考一下:PPI蛋白互作、KEGG这种数据库的依据是基于文献,如果某个基因已经被认为经典的调控MAPK通路,在肝癌这种肿瘤里面没有被报道(新基因)的可能性有多大?

2. 如果一个基因在肿瘤组织高表达,也作为患者预后的不良标志物,并且与转移正相关,就一定促进肿瘤细胞增殖转移吗?我曾经看到过一些很有意思的文章和基金项目,明明研究的基因A是免疫细胞特异性表达的,文章中居然发现A基因在肿瘤细胞系显著高表达,而且当A基因沉默后肿瘤细胞的增殖、侵袭迁移能力都有很大程度被抑制。如果思考一个这个问题:在肿瘤组织高表达,就一定是在肿瘤细胞高表达吗?就不能是Treg、TAM、CAF等等这种同样促进肿瘤进展的细胞中表达吗?

3. A基因高表达,患者预后差,通过激活促癌通路发挥癌基因的功能,这是套路框架。那如果A基因高表达,A基因能不能发挥抑癌基因的功能?如果大家思维受到限制,会觉得很奇怪:A基因既然高表达,怎么就能发挥抑癌基因的作用呢?但,逻辑不应该是这样吗:实验发现A基因在肿瘤组织高表达+ A基因又能抑制肿瘤,这不才是有意思的现象吗?!就像我们之前解读过的一篇发表在Oncogene上研究miRNA的文章(看到这篇Oncogene上的miRNA研究,我感觉自己错过了N多中科院一区的文章……),研究机制的原因就是解释这个问题:A基因既然高表达又能抑癌,肿瘤是怎么发生的?接下来的问题是:一个A基因高表达有多大程度上直接驱动肿瘤发生?如果这个基因这么重要,为什么这个基因不是明星基因?

4. 最后一个问题:如果拿到的是乳腺癌和肝癌临床样本的转录组学数据,假如我搞混了,只凭差异基因,能不能把乳腺癌和肝癌区分开?为了达到这个目的,我们就要思考这个问题:肝癌和乳腺癌在发病机制上有什么区别?有哪些是肝癌特异的,有哪些是乳腺癌特异的?实际上KEGG pathway中都有很明确的“Cancer Overview”和Cancer Specific types这种区分:

如果了解两个肿瘤的特性,从结果来看是很容易区分的。进一步说:为什么大家在研究基因的时候,体现一下肿瘤的特异性(Specificity)呢?是觉得不够高级吗?

最后,我们总结一下:看文章总结套路很容易,特别是现在AI读文献都能总结个一二三;但如果我们思维上问一个:为什么一定要这样呢?就不能有其它情况吗?特别是当实验结果跟预期不一致时,怎么就不能是阴性结果?一个癌基因只促进肿瘤细胞恶性侵袭迁移,不调控细胞死亡难道不行吗? 

套路好学,但是中毒太深的话只能止步不前,如果多问一句,阴性结果可能才是最大的创新点,祝大家心明眼亮!


END

如果大家有基金申请或者课题思路上的疑问,可以联系我们进行咨询:

扫码备注:科研合作