Gregg Semenza, Peter Ratcliffe和我本人因为发现了细胞如何感知氧而共同获得了2016年的拉斯克奖。我们的得奖论文是在十几年前发表的。若是放在今天,它们大部分都会被视为过时的初步结果,几乎无法发表。例如,一篇表明氧信号转导需要一种肿瘤抑制蛋白的论文现在会因为缺少清楚的机制和动物实验而遭到批评。另一篇表明蛋白质的主要靶标经过氧依赖性修饰的论文当时差点被拒,因为我们没有鉴定出有关的酶。幸运的是,一位有经验的编辑出手干预,指出发表这篇论文能让其它团队参与到这种酶的搜寻中来;这样的“刀下留人”如今越来越少了。
为什么现在的论文论点越来越广?一个因素是资助机构对影响力和转化的强调。另一个因素是技术进步简化了数据生成,所得的数据都可包含在在线附录中。二者都鼓励了评审人和编辑要求论文增加额外的实验,这些实验或是衍生的,或是与主体结论无关,或者旨在提高论文的影响力。接受一篇论文需要莫大的勇气,而拒绝一篇论文并建议增加实验则不用。将是否接受论文与对论文影响力的预期关联起来会导致激励倒错。我担心,在经费紧张的情况下——比如当前,评审人尤其会倾向于要求增加实验。
过去,如果图1介绍了一个有趣的观测结果,接下来就会是重点验证其可靠性的一系列实验。我做博士后时,检测到两种相互结合的蛋白,外加确定这种结合存在于活细胞中的跟进实验就能组成一篇完整的论文。如今,支持这样的论断的数据可能就是图1(甚至有可能是附录图1——连图1都不是)描述的一到两个实验。论文的余下部分则会介绍不同学科的研究成果来拔高论文的论点,再用一张凸显结论临床意义的图表收尾。
不幸的是,这种广度通常是以牺牲深度为代价的。根据实验数据做出推断需要多重证据支持,因为任何单一方法都有其缺点和局限性。我担心,研究文献的形式从提出一项重要主张、并运用多种方式论证退化成了提出多项主张、但分别只有一条证据。今天,论文的最终结论往往有些牵强附会。
范围过广的结论超出了同行评审系统的极限。虽然我是一个经验丰富的评审人,但论文中越来越多的数据也不免让我感到力不从心,我也经常会碰到我专长领域之外的内容。如果这种趋势延续下去,评审论文就需要停教休假才能完成了。编辑也许能顺利招齐背景互补的评审人来评审这类论文,但这样做的代价是让多位专家检查同样的实验。此外,我还担心论文附录可能会被用来隐藏低质量数据,因为评审人对附录的审查相对没那么严格。
其它预料之外的后果还包括新知识传播滞后和科学家培训时间拉长:发表需要多年时间才能完成的“大作”成为了升职的制约条件。未予回答的问题和未予解释的结果通常会被视为缺陷,可能影响论文发表。这可能会催生种种不良行为,比如挑选数据,消除看起来不完整、不一致或未得到解释的内容。我们应该认识到,论文如实呈现其局限性和令人困惑的结果是对科研有益的。
知识的缺乏是临床转化面临的真正瓶颈。我们不该继续告诉基础科学家(尤其是训练中的科学家)他们的研究价值在于成果的可转化性。我们必须回归对论文原创性、实验设计和数据质量的谨慎考察,在预测论文影响力时采用更谦逊的态度,因为人们只有在事后才能真正了解一项研究的影响力(限制酶、酵母细胞周期突变和CRISPR–Cas9等具有革命性意义的发现都曾一度被认为只是自然界的小小反常)。我们也应该多强调研究的质量,关注研究是否推动了后续发现,而少关心论文发表在了什么地方。
评审论文时的重点应该是它的结论是否可能正确,而不是如果结论正确,它是否会具有重要意义。真正的进步是一砖一瓦砌起来的,而不是草堆拼凑的。ⓝ
Nature|doi:10.1038/545387a