你知道一个数据库的文献量有多大么?
仅仅是万方中关于期刊的文献就有 36 000 000+ 篇,而 Pubmed 中则有 27 000 000+ 篇。每一个数据库的文献量都可以用「浩如烟海」形容。
当然,你根据自己需要的主题进行检索所得的结果并没有这么多。即使如此,检索的文献量少则数十上百篇,多则上千篇,难不成你还要将所有的文献都浏览一遍,才知道哪些文章对你的研究是有帮助?即使是简单的浏览标题,也能让你两眼昏花,更何况进一步阅读摘要,甚至是全文。
那么,接下来的关键就来了:
如何在「多如繁星」的文献中,找到属于你的「北斗星」?如何评价哪些文献对于你整个科研思路是有意义的,哪些文献属于重量级,而更多的文献是没有太多「利用价值」的?
所谓:「众里寻他千百度,蓦然回首,那人却在灯火阑珊处」。这便是科研中的利器之一:「文献筛选」。
接下来,我会分篇章进行图文详细概述,如何在常见文献库中进行高质量文献的筛选,其中包括国内常见的数据库:知网、万方,以及国外的数据库 Pubmed、GoPubmed、web of science、F1000、ResearchGate……,也会详细描述通过哪些软件,对文献进行高质量的筛选,包括 NoteExpress、医学文献王、EndNote、Histcite……
文献筛选方法种类:进行文献筛选有很多的方法,我会在下面篇章中,详细介绍,其中包括:
以「高血压」作为主题检索,可以见到如下检索页面:
可以看到,共检索出 271 205 篇文献,面对如此繁多的文献量,如何选取高质量的文献?
接下来,我们通过以下两种方式,对文献进行初步筛选,从而选出优质高水平的文献。
被引:顾名思义,就是一篇文献的被引数量。如果某篇文献被引量高,那么,可以说明这篇文献被广为所知,大家都认同的高质量文献,也就是说,在相同主题检索下,被引次数越多,文献的质量也相对更高。
在上图的检索界面,我们可以发现就有「被引」的选项。
我们点击「1. 被引」,就能对检索的文献进行被引次序的排列,而「2. 被引」则显示了每篇文献的被引数量,如下图:
很快的,我们就能检索出本主题中最高质量的文献:「中国高血压防治指南 2010」,其被引次数为:65 638,依次类推。
第一种「被引筛选」,其实还有很多的「漏洞」。首先,年代越久远的文献,因为多年的「被引」沉淀,会获得很多的被引量,而越是近期的文献,因为刚发表,即使文献质量很高,也很难被人广泛引用。
其次,即使是你的检索式已经很精确,也会检索出很多无关的文献,如很多跨行专业的引用。例如检索关于「高血压」主题的文献,可以发现,一篇文献可能会被心内科专业的同行引用,也可能被统计专业,甚至是经济学、农学专业的人士引用。
所以,单纯的「被引」排序,也不够精确),因此,接下来,我们就引入了下面这个概念:「互引」。
互引:从文字上说,就是相互引用。每篇文献都会有很多参考文献,那么,多篇文献互相引用的参考文献,可以说是本行业各位专家共同认可的文献(相当于同行推荐),从而避免了无关文献的纳入。
虽然我们常在知网上检索文献,然而,却很少发现有这么一个选项:「已选文献分析」,接下来,我们就这方面进行探讨。
选则你觉得高质量的文献(可以是被引排序中的文献),然后点击已选文献分析,网页就会跳转到「计量可视化分析」页面,我们依次往下,可以看到:
上图中的「指标分析」,是对纳入的 20 篇文献进行分析,发现,这 20 篇文献共有 71 篇参考文献(排除了共同引用的参考文献),共被引数为 17 911 篇指标,而「总体趋势分析」,可以看到整个「指标分析」根据年代、发文量的图表。
其中,「蓝点」为所选文献,「绿点」为参考文献,「橙点」为引证文献(引证文献是指引用本文的文献)。选中一个点,就能看到当年被引的文献发文量。
注意:引证文献,是该论文发表之后被引用的次数,可以显示出该论文发表后每年的被引次数多少。
如果你在进行计量可视化分析时选取了 1 篇文献,那么可以看到这篇文献发表后被引每年量;
而如果你选取了上百篇文献,这个时候,你就能看到你的研究整体趋势了,从上图中,我们可以发现,就「高血压」这个主题我们选取的 20 篇文献被引量(17911),每年都在往上走(橙色曲线)——最后两个点是 2016 年的,因为我们之前说过,越是进的文献,其被引次数越少(不是因为不重要,而是因为没有岁月的沉淀)。
总体来说,我们研究的主题,整个发展趋势还是不错的。如果你研究的主题进行总体趋势分析后,发现曲线下滑了好多年,这个时候,你就要考虑考虑时候还有继续研究的意义了。比如「SARS」的研究曲线:
在 2003 年的时候到达了一个高峰,而后就急剧的下滑(这是有疾病爆发性,也是一过性,研究热随着疾病爆发的减少而下降)。这个时候,你再去研究相关研究,可能意义就不是很大了。
因此,可以说,「计量可视化分析」可以看一个领域的未来发展前景。
我们在「计量可视化分析」页面继续往下看,可以发现如下界面:
注:图中的圈越大,说明被引的越多,圈与圈相互连接,则说明这两篇文献是相互引用的文献。
从图中,无门可以看到在圈中越是密集,圈越大的文献,则是互引最多的文献,也就是被同行认可最多的文献。选中一个圈,可以显示这篇论文的基本信息,双击可以跳转到该论文的详细信息界面。
综上,可以先在网页上对论文进行初步的质量筛选,选出你认可的高质量文献,从而进一步进行深入阅读。
接下去,还会讲解如何通过软件进行文献的进行一步步筛选,详见下回分解。
学霸推荐
Endnote 是一款很强大的文献管理工具,具体介绍在《文献查找、阅读、管理》全套课程中。用 20 节课程掌握别人 10 年看文献的经验。帮你快速找到核心文献,高效阅读文献,提炼重点,并有序管理。
丁香公开课最畅销课程推荐,购买人数目前已超过九百人。点击阅读原文或识别下方二维码查看。
长按识别下方二维码即可查看
作者:张旭栋
图片来源:张旭栋
题图来源:视觉中国