首篇AI自写论文通过ICLR 2025同行评审！6.25高分碾压人类，AI独挑科研大梁

Dots机构投资者社区 · 公众号 · · 2025-03-13 08:15

正文

本文转自微信公众号“新智元”，作者：新智元。

编辑：桃子

首篇完全由AI生成的论文，竟通过了ICLR 2025同行评审！

Sakana AI正式亮相AI Scientist-v2版本，直接踢破了AI顶会的大门。

从提出科学假设、设计实验、到编写代码、运行实验、分析数据、绘制图表，再到撰写完整论文，所有环节均由AI完成。

研究人员向2025 ICLR Workshop，一共提交了3篇AI生成的论文，全部进入双盲评审。

显然，审稿人完全不知道，他们评审的是AI生成的作品，并且按照评审人类科学家论文的标准，进行严格评判。

3篇论文中，只有一篇 Compositional Regularization: Unexpected Obstacles in Enhancing Neural Network Generalization ，平均获6.25的高分（6,7,6,6），远高于许多人类作者的论文。

论文地址：https://github.com/SakanaAI/AI-Scientist-ICLR2025-Workshop-Experiment/blob/master/compositional-regularization/annotated_paper.pdf

另外两篇全部败北。

Sakana AI特别强调，这是首次通过「与人类科学家相同标准」的同行评审论文。

AI科研历史性时刻来了！

AI闯入科研殿堂，全程无人干预

要知道，ICLR与NeurIPS、ICML并称机器学习和人工智能研究领域三大顶级会议。

如前所述，Sakana AI在由2025 ICLR主办的Workshop——ICBINB上，展开了这项实验。

这个研讨会涉及的议题非常广泛，挑战者（包括AI科学家）需要处理多样化研究课题，去解决深度学习的实际局限性。

https://sites.google.com/view/icbinb-2025

那么，AI论文是如何参与评审过程的呢？

通过与ICLR Workshop商定，研究团队提交了3篇AI生成的论文，参与同行评审。

审稿人并未明确被告知，他们所评审的论文是由AI生成的。在ICLR Workshop「评审指南」中，明确规定了这一点。

关键在于，Sakana AI提交的AI生成论文，完全由「AI端到端」生成，未经任何人类修改。

AI Scientist-v2不仅提出了科学假设，设计了测试假设的实验，还编写并优化了实验代码，运行实验，分析数据，将数据可视化为图表。

并且，它还撰写了整篇科学稿件的每一个字，从标题到最后的参考文献，包括图表放置和所有格式。

全程没有人类参与，为了监督研究，Sakana AI研究员仅是为AI提供了研究的广泛主题，并提交了3篇他们自认为比较好的论文。

在提交的3篇论文中，其中两篇未达到接受标准。

另外一篇论文的平均得分为6.25，在所有提交中排名约45%。这一分数高于研讨会中许多被接受的人类撰写论文，高于平均接受门槛。具体评分为：