专栏名称: Dots机构投资者社区
机构投资者组成的社区,深度点评财经事件
51好读  ›  专栏  ›  Dots机构投资者社区

首篇AI自写论文通过ICLR 2025同行评审!6.25高分碾压人类,AI独挑科研大梁

Dots机构投资者社区  · 公众号  ·  · 2025-03-13 08:15

正文

本文转自微信公众号“新智元”,作者:新智元。

图片




编辑:桃子
【导读】 Sakana AI官宣,第二代「AI科学家」独立完成论文,通过了ICLR 2025 Workshop的同行评审。这是首次完全由AI端到端生成的科学论文,获得了学术高度认可。

首篇完全由AI生成的论文,竟通过了ICLR 2025同行评审!
Sakana AI正式亮相AI Scientist-v2版本,直接踢破了AI顶会的大门。
从提出科学假设、设计实验、到编写代码、运行实验、分析数据、绘制图表,再到撰写完整论文,所有环节均由AI完成。
图片
研究人员向2025 ICLR Workshop,一共提交了3篇AI生成的论文,全部进入双盲评审。
显然,审稿人完全不知道,他们评审的是AI生成的作品,并且按照评审人类科学家论文的标准,进行严格评判。
3篇论文中,只有一篇 Compositional Regularization: Unexpected Obstacles in Enhancing Neural Network Generalization ,平均获6.25的高分(6,7,6,6),远高于许多人类作者的论文。

图片

论文地址:https://github.com/SakanaAI/AI-Scientist-ICLR2025-Workshop-Experiment/blob/master/compositional-regularization/annotated_paper.pdf
另外两篇全部败北。
图片
Sakana AI特别强调,这是首次通过「与人类科学家相同标准」的同行评审论文。
AI科研历史性时刻来了!

AI闯入科研殿堂,全程无人干预


要知道,ICLR与NeurIPS、ICML并称机器学习和人工智能研究领域三大顶级会议。
如前所述,Sakana AI在由2025 ICLR主办的Workshop——ICBINB上,展开了这项实验。
这个研讨会涉及的议题非常广泛,挑战者(包括AI科学家)需要处理多样化研究课题,去解决深度学习的实际局限性。

图片

https://sites.google.com/view/icbinb-2025
那么,AI论文是如何参与评审过程的呢?

评审过程


通过与ICLR Workshop商定,研究团队提交了3篇AI生成的论文,参与同行评审。
审稿人并未明确被告知,他们所评审的论文是由AI生成的。在ICLR Workshop「评审指南」中,明确规定了这一点。
图片
关键在于,Sakana AI提交的AI生成论文,完全由「AI端到端」生成,未经任何人类修改。
AI Scientist-v2不仅提出了科学假设,设计了测试假设的实验,还编写并优化了实验代码,运行实验,分析数据,将数据可视化为图表。
并且,它还撰写了整篇科学稿件的每一个字,从标题到最后的参考文献,包括图表放置和所有格式。
全程没有人类参与,为了监督研究,Sakana AI研究员仅是为AI提供了研究的广泛主题,并提交了3篇他们自认为比较好的论文。
在提交的3篇论文中,其中两篇未达到接受标准。
另外一篇论文的平均得分为6.25,在所有提交中排名约45%。这一分数高于研讨会中许多被接受的人类撰写论文,高于平均接受门槛。具体评分为:
  • 评分:6:略高于接受门槛

  • 评分:7:好论文,接受

  • 评分:6:略高于接受门槛

  • 评分:6:略高于接受门槛

图片






请到「今天看啥」查看全文