专栏名称: 算法与数学之美
从生活中挖掘数学之美,在实践中体验算法之奇,魅力旅程,从此开始!
目录
相关文章推荐
算法爱好者  ·  刷新三观,深圳某公司重新定义八小时工作制 ·  11 小时前  
算法与数据结构  ·  优雅的代码规范,提升代码质量 ·  2 天前  
算法与数据结构  ·  今天面试了一个字节女生,当场想给她offer ·  5 天前  
九章算法  ·  今天把NG女朋友送进Amazon 了 ·  6 天前  
51好读  ›  专栏  ›  算法与数学之美

Nature: arXiv 百万美元大改造启动,会有哪些新功能?

算法与数学之美  · 公众号  · 算法  · 2016-12-21 22:58

正文

原文:http://www.nature.com/news/arxiv-preprint-server-plans-multimillion-dollar-overhaul-1.20181

摘要:

开放论文存储库 arXiv 正在启动其三年大改造计划的第一阶段。11月29日 arXiv 宣布获得纽约市 Alfred P. Sloan 基金会 445000 美元捐款后,网站所有者开始了这项名为“next-generation arXiv”,简称“arXiv-NG”的计 ...

开放论文存储库 arXiv 正在启动其三年大改造计划的第一阶段。11月29日 arXiv 宣布获得纽约市 Alfred P. Sloan 基金会 445000 美元捐款后,网站所有者开始了这项名为“next-generation arXiv”,简称“arXiv-NG”的计划——提供能适应现代特征的更灵活的服务。今年6月,该网站公布了针对大量用户的调查结果,这些结果是其改造计划的参考原则。大部分用户不希望网站大改,但提出了一些调整建议,如升级网站的搜索功能。

arXiv 是在物理学家、计算机科学家以及数学家们中最受欢迎的公开分享研究论文预印本的存储库,最近,arXiv 正在筹集数百万美元的资金以改造其网站。

但本周发布的一项对大量用户的调查结果表明,对这个已经成为现代科学基础构造中的一个重要组成部分的网站进行大改造这件事,研究人员们持谨慎态度。

去年,arXiv 网站的下载量约为 1.39 亿次,现在已经拥有超过 110 万份免费论文。该网站的项目总监 Oya Rieger 说,维持网站的代码相当脆弱,网站得到来自图书馆和慈善基金的捐赠,以及大约 150 名 志愿者管理员的好心支持。在 8 月份迎来 25 周年之际,arXiv 的由科学家和图书馆员组成的顾问团队开始考虑将平台改造得更现代化的计划,这一计划包括筹集 250 万至 300 万美元的资金。这部分资金在该网站每年 100 万美元的人力和服务器预算之外。

为了吸引捐赠者的支持,Rieger 说,arXiv 的运营者康奈尔大学图书馆希望能提出一个“引人注目的愿景”。

科学家们似乎挺喜欢 arXiv:对 36000 位受访者的调查中,95%的受访者表示对该网站非常满意或满意。大多数人希望网站保持一贯的方式,虽然也可以有一些现代化的功能。他们最希望改进的是网站对参考文献的链接,以及更多格式的引用导出功能。一些受访者希望该网站能拓展到新的领域,例如化学。但 arXiv 的科学顾问委员会主席 David Morrison 表示,拓展需要征聘愿意审核提交论文的科学家。下图是 arXiv 用户希望网站增加的功能的调查结果。


社交功能?

在被问及希望 arXiv 做那些转型或改变时,受访者的答案不尽一致。尤其是,一些问题集中在 arXiv 是否应该发展成一个社交性的论坛,允许科学家们在论文下评论或对其评级。围绕这种论文储存库的社交型网站已经存在一些,例如 SciRate 和 Arxiv Sanity Preserver,一些人认为网站本身应该包含这样的功能。哈佛大学量子化学家 AlánAspuru-Guzik 说:“ArXiv 应该更有活力,要允许读者从谷壳中过滤出小麦。”但约三分之一的受访者表示社交性不重要,或者 arXiv 不应该增加这些功能。只有 34% 的受访者赞成这种改变。

Rieger 说,这些结果反映了两派研究人员间的矛盾,一派希望网站增加开放式审查,另一派则希望它坚持原本的快速交换学术论文的使命。用户年代的差异也是因素之一,年龄在30岁以下的受访者赞成增加评论功能。但 Rieger 补充道,即使是哪些渴望更多社交功能的人,也希望避免自由放任的评论。

康奈尔大学的物理学家 Paul Ginsparg 说:“调查的结果表明,人们或多或少地希望网站坚持基本的传播任务,不希望因过度延伸或商业化而转型。”Ginsparg 在 1991 年推出了公告板形式的 arXiv。


审查和平衡

但 Ginsparg 也指出,arXiv 的用户有时候在东西送到他们手上之前,都不知道自己到底想要什么。研究者说他们喜欢网站现在内置的质量控制体系,包括文本检查,重复率(潜在的剽窃)检查,将论文分类到正确的主题领域,以及驳回没有科学价值的研究论文等。

Ginsparg 说,这些功能大部分是用户从来没有实际请求过的。过去五年里,他为网站引入了自动化的机器学习代码,能够自动过滤每月提交到网站上的 9000 多份论文,并为人类评审员展示出论文潜在的问题。

arXiv 项目总监Oya Riege

arXiv 顾问委员会 9 月举行了会议,制定规划路线图,并讨论了如何筹集升级网站所需的资金。该网站目前由成员机构(主要是图书馆和研究基金机构)和纽约西门子基金会维持。Rieger 说,他们与美国国家基金会等潜在的捐赠者也进行了讨论,可能也会向出版商或科学圈子提出请求。她补充说,arXiv 需要小心保持其客观态度,“我们希望确保 arXiv 继续提供中立、值得信任的服务。”