来源:Nature
doi: https://doi.org/10.1038/d41586-023-01273-w
Elicit:论文搜索 AI 工具
Clementine Fourrier 是一位在巴黎的研究人员,正在测试一款名为 Elicit 的人工智能搜索引擎。Elicit 利用大型语言模型(LLM)来生成答案,帮助用户找到可用于其论文的文献资料。Elicit 在 Semantic Scholar 数据库中进行文献检索,通过将论文的标题和摘要与用户的搜索问题进行匹配,来确定排名靠前的文献。
Fourrier 表示,根据她的使用经验,Elicit 并不总能挑选出最相关的文献。Elicit 有时会推荐一些用户可能会错过的文献,这在一定程度上是有益的。然而,它提供的文献总结 「 帮助不大 」,并且会推荐很多与主题无直接关联的内容。如果仅依赖 Elicit,可能会导致许多错误。
Elicit 所属公司的首席运营官 Jungwon Byun 说,Elicit 目前拥有数十万用户,他们的专业领域各不相同,因此 Elicit 在某些领域的查询上可能表现得不够理想。Elicit 的工作方式与其他搜索引擎不同,它不太关注关键词匹配、引用次数和文献出现的频率,但用户仍然可以对这些方面设置过滤条件。
有些研究者对 Elicit 的体验非常好。新加坡某大学的图书管理员 Aaron Tay 表示:「 到目前为止,Elicit.org 是我最喜欢的搜索方式。它几乎取代了谷歌学术,成为我进行学术搜索的首选。」 就相关性而言,Tay 对 Elicit 的体验与 Fourrier 完全相反,他认为 Elicit 提供的内容相关度与谷歌学术大致相当,有时甚至比谷歌学术检索得更好。
Tay 认为,研究者感受到的差异可能源于他们所研究的专业领域不同。Fourrier 的研究领域是机器学习,这个领域的发展速度非常快。「 机器学习领域一年的进展在其他领域可能相当于一个世纪 」,因此五年前的研究可能就已经完全不相关了,但 Elicit 并没有很好地解决这个问题。
scite:智能引文工具
scite 利用大型语言模型(LLM)来整理引文信息,包括一篇文献在何时、何地以及如何被其他论文引用。scite 的首席执行官 Josh Nicholson 表示,尽管 ChatGPT 因捏造不存在的参考文献而受到批评,但 scite 已经成功避免了这一问题。scite 会先从 ChatGPT 获取信息,然后在其自身的数据库中进行搜索,并将这些信息与真实的参考资料进行语义匹配。
scite 已经与包括 Wiley 在内的 30 多家学术出版商建立了合作关系,并签署了一些索引协议,因此 scite 能够访问数百万篇学术文章的全文内容。
Consensus:提炼论文内容的工具
scite 正在与另一个名为 Consensus 的 AI 工具合作。Consensus 于 2022 年发布,其功能是从研究中提取和总结结果。该工具旨在帮助那些不擅长进行内容搜索的人,但事实上,许多研究者和科学家也在使用它。
与 Elicit 类似,Consensus 也利用了 Semantic Scholar 的数据。Consensus 拥有一个数据库,其中包含了从论文中提取的超过一亿条声明。当用户进行搜索时,实际上是在搜索这些声明。工作人员会手动标记那些有争议的或已被推翻的声明,例如 「 疫苗导致自闭症 」 的说法。
加拿大儿科医生 Meghan Azad 在 Consensus 上查询疫苗是否会引发自闭症时,得到的结果显示 70% 的研究认为疫苗不会导致自闭症。然而,Azad 对这一结果持保留态度,因为其中一条引文是 「 父母是否相信疫苗导致自闭症?」 这并不是一个基于研究的证据。
Azad 认为,未来 AI 搜索引擎将在学术研究中发挥重要作用,例如,它们可以节省系统综述所需的数月时间。但就目前而言,她表示:「 我不确定能在多大程度上信任它们,所以我目前只是在娱乐性地试用它们。」
总结
这三款工具都基于高质量的真实学术文献来生成答案,并且都会提供参考文献,以便科研人员追溯原始数据。Elicit 的优势在于它能够将推荐的文献整理成表格形式,并支持按列标注文献的主要发现、研究局限等内容,使得信息呈现得清晰整洁,非常适合进行文献分类和系统性分析。scite 的引用分析则更加专业,其回答内容更长、更有逻辑性,适合在写作时深入挖掘文献背景,并且支持后续追问,实用性较强。Consensus 的回答则更偏结构化,逻辑清晰且易于理解,尤其适合快速获取某个问题的 「 共识性 」 答案。这三款工具各有特色,科研人员可以根据自己的需求灵活选择使用。当然,它们也存在一些共同的局限性:在处理时效性强的领域、争议性问题或复杂研究时,这些工具可能不够精准,需要用户结合自己的专业判断以及传统文献搜索工具(如 Google Scholar 或 PubMed)共同使用。
我们长期为科研用户提供前沿资讯、实验方法、选品推荐等服务,并且组建了 70 多个不同领域的专业交流群,覆盖
PCR、细胞实验、蛋白研究、
神经科学、肿瘤免疫、基因编辑、外泌体、类器官
等领域,定期分享实验干货、文献解读等活动。
添加实验菌企微,回复【】中的序号,即可领取对应的资料包哦~
【2402】国内重点实验室分子生物学实验方法汇总(60 页)
【2403】2024 最新最全影响因子(20000+ 期刊目录)