专栏名称: ScienceLondon未止科技
ScienceLondon专注生产原创深度内容,包含生物行业报告和科学周刊。同时 我们也是国内首家专注生物行业和拥有深厚生物专业背景的数字营销团队。
目录
相关文章推荐
小学数学  ·  思维训练:1-6年级思维训练每日一题-660期 ·  2 天前  
超级数学建模  ·  酒精里面倒入碳粉,吸铁石竟然隔空吸碳粉! ·  5 天前  
小学数学  ·  小学数学12种“估算方法”,值得收藏! ·  5 天前  
超级数学建模  ·  智商176,霍金自叹不如,爆火100年仍是顶 ... ·  1 周前  
51好读  ›  专栏  ›  ScienceLondon未止科技

【未止科技】揭秘盗版论文网站Sci-hub的工作原理:你为何能够免费下载文献?

ScienceLondon未止科技  · 公众号  ·  · 2017-06-29 04:22

正文

6月21日,美国法院裁决盗版论文网站Sci-Hub向世界最大的论文出版商爱思唯尔赔偿1500万美元,原因是Sci-Hub通过非法行为让100篇论文可以免费获取(即盗版)。这不是Sci-Hub第一次被起诉-多年来,由于面临着封杀,Sci-Hub不得不频繁更换域名。Sci-Hub是一个学术论文在线搜索引擎,拥有超过6200万篇学术文章和论文,并且可以绕过付费直接下载全文。


相信科研工作者们都很熟悉Sci-Hub:它是一个学术论文在线搜索引擎,拥有超过6200万篇学术文章和论文,并且可以绕过付费直接下载全文。在国内,它已经成为了许多人手中的“科研神器”。但是,未止科技小编对一个问题很好奇:出版商发布的文献(比如《Nature》杂志)一般都需要购买授权之后才能下载,有严格的保护措施。Sci-Hub为何能突破这道防线,让大家免费下载到论文资料呢?最近,未止科技小编特意翻阅了资料,发现一位科研牛人在博客上详细介绍了Sci-Hub的工作原理,现在就与大家分享一下。

1.通过LibGen获得拷贝(P2P方式)

如果你去现在的Sci-Hub(这也是一个Google搜索),并输入一个DOI号或者某个学术文章的网址,Sci-Hub将发送一个验证码给你进行验证。 然后,它会在LibGen的文库中搜索来查看是否可以找到改文章的现有副本。 如果有,它将该副本传递给你。

LibGen,就是Sci-Hub中免费文献的主要来源。它的全称是Library Genesis,据说是世界上最大的盗版资料库,拥有超过300万种电子书,5200万种科研论文,以及其他一些杂志刊物 - 以PDF格式存储,一律免费下载。LibGen里全部的资料,都是用户手工上传的 - LibGen提供Torrent的方式下载(即我们常说的“种子”)。事实上,这是一种避开法律制裁的常用手段,LibGen仅仅是提供一个“P2P平台”而不是直接进行盗版,从而规避了许多法律制裁(这就如同迅雷和快播早年的模式)。然而,近年来LibGen遭到了各大出版商的穷追猛打,其网站在多个国家遭到禁封,也被迫经常更换域名和IP。

2. 通过“捐赠”的授权账户

如果Sci-Hub无法在LibGen中找到副本呢?这难不倒Sci-Hub:它将使用多个机构的访问系统在发布者平台之间进行搜索,绕过所有访问权限,并检索该项目的副本。

之后它做两件事情。 一个,它将一个副本传回给请求的用户, 其次,它在LibGen中存储一个副本,以便在下次用户搜索该文档时可以直接发送副本给用户。在此过程中,Sci-Hub将提醒你捐款以保持网站的运行,在捐赠方式中,比特币是捐赠的首推方式。

Sci-Hub对各平台之间的访问凭据是已被授权的用户名和密码,并且可以访问各类学术机构,它主要采用校外访问的代理或密令等形式访问系统,这些口令或者代理显然是由一些学者“捐赠”的。 尚不清楚捐赠代理和密令信息的学者是否意识到自己做了什么。

3. 通过黑客手段得到授权账户

据马凯特大学图书馆信息技术主管爱德华·桑切斯(Edward Sanchez)说,学术资料已经被一些钓鱼组织给盯上了,尤其是通过窃取大学对学术资料的访问权限。访问权限被Sci-Hub随意使用,从而获取学术文章。另一方面,也很难可以阻止一些学者泄露资源获取的用户名和密码。

值得注意的是,安全凭证(也就是用户名和密码)的泄露确实是一个非常糟糕的事情。先不论Sci-Hub在这件事情上是对是错,就单是学者在互联网上发放访问凭证这样的事就是非常愚蠢的。 他们应该考虑清楚用户名和密码被泄露的后果,以及警惕可能对这些数据感兴趣的人。 事实上,这种学术访问系统的滥用导致我认为我们应该寻求一个协同一致的双因素认证系统,不能仅仅靠付费通道来把控资源的流出。这是为整个行业的利益着想。

你可能会注意到这个网站时常停运。 就像以前的盗版游戏一样,域名服务器一旦更新,盗版用户就不再连接到网站。 但这并不意味着这些网站被“关闭”,他们仍然在那里,在努力的破解服务器的域名。 事实上,Sci-Hub可以通过Tor在“暗网”上访问。 LibGen提供其采集资料的数据库,以便使用传统的P2P协议进行下载。

Sci-Hub的这种行为看似是有“梁山好汉”的味道:从“黑心”的出版商手中巧取豪夺,免费为科研人员带来福利,促进学术自由。那么,这种破坏秩序的做法真的不会带来危害吗?未止科技小编发现,一些专家曾经发出过警告:

  1. 首先,出版社和科学协会收取论文版权费,并不是为了借机大赚一笔。这些营收有很大一部分将被用作发展中国家的科研援助,组织学术交流活动,成立科研基金- 实际上是在促进科研的进步。出版社的营收被Sci-Hub干扰,自然会减少学术赞助,更不利于整个科研环境的发展。

  2. 其次,Sci-Hub上提供的论文,并不是像出版商那样及时更新的。一些论文的实验方法,实验材料都会有不同程度的修改。如果你下载了一篇“过时”的文献,肯定会对你的研究产生误导。从科研人员本身的利益出发,这也是非常不利的。

Sci-Hub是对是错?这个问题仍然存在很大的争议。不过在未止科技小编看来,出版商们是时候把文献期刊降降价了 - 这或许是对科研人员最实在的帮助。

参考资料:
https://scholarlykitchen.sspnet.org/2016/02/25/sci-hub-how-does-it-work/
http://theinstitute.ieee.org/blogs/blog/scihubs-free-articles-are-anything-but-free

未止科技3.0重磅上线,你可以直接在公众号中回复你感兴趣的关键词,即可收到相关文章推送!


未止科技保留著作权,未经许可,禁止转载。否则我们将通过微信公众号平台和律师团队进行维权。如希望转载,请参照公众号菜单中的“转载守则”,在公众号后台或邮件联系我们获得授权。