专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
目录
相关文章推荐
深圳商务  ·  春节假期,深圳外贸“欣欣向荣” ·  昨天  
深圳商务  ·  春节假期,深圳外贸“欣欣向荣” ·  昨天  
Alisha全球出海日记  ·  2025阿根廷跨境贸易实战指南 ·  3 天前  
云南省人民政府  ·  我省开展2024年推进外贸稳进提质政策项目申 ... ·  4 天前  
进出口财税通  ·  deepseek:2025年出口退税稽查新动向 ·  4 天前  
51好读  ›  专栏  ›  新智元

NeurIPS24评审结果遭全网吐槽,惊动LeCun!评审员打低分,严重贬低论文贡献

新智元  · 公众号  ·  · 2024-08-10 12:51

正文



新智元报道

编辑:桃子
【新智元导读】 NeurIPS 2024评审结果一出,成了全网吐槽重灾区。

每年AI领域的国际顶会,少不了「大事」发生。
前段时间,NeurIPS 2024论文评审结果终于出炉了,网友们开始「拉群」吵成了一片。
这时,有网友爆出黑料:
「一些评审人严重贬低论文贡献,用不合理的标准评判,甚至忽视论文相对于其他工作的实际改进」。
他认为,这可能是竞品的作者,发现后做出不诚实的评审。
就连LeCun大佬也来围观,立即转发了该帖。
作为领域主席,我告诉作者:如果你遇到了这种情况,请联系领域主席(AC)。

作为一个作者,我想问:如何恰当地指出这种行为,并在合法批评和过度把关之间找到平衡点?
另有网友放出NeurIPS评审员经典评论:这个解决方案不是新的,并且已经被大量研究过了。
今年,是NeurIPS第38届年会,将于12月9日-15日在温哥华召开。
根据Paper Copilot收集的数据统计,截至目前,得分平均分布均在3-6分之间居多。
论文被打低分,究竟是谁的问题?

NeurIPS论文低分一片?


一位来自UT Austin的副教授,也是NeurIPS这届顶会的领域主席(AC)之一,阐述了自己所看到的现象。
他表示,在自己负责的一批论文中,已提交了48篇中的16篇评审。
到目前为止,我还没有看到一个正面评价,要么是评审员变得非常严格,要么是论文质量下降了?
今年,NeurIPS收到了很多「回收利用」的论文。
另一位AI研究员同样表示,要么就是论文质量下降,要么我就是大家口中讨厌的2号评审员。
在他审阅的论文中,基本上都给了2-4分。
另有评审员表示,「在我负责的这批62篇论文中,平均评分是4.3分,标准差为1。所以如果你最初得到低分,也不要灰心」!
可见,这次NeurIPS顶会论文作者都挺不好受,想要获取高分并不容易。

大模型参与评审


而且AI火了之后,大模型也被用来论文评审。
这次,NeurIPS 2024也不例外。
Reddit网友评论道,自己用一个月的时间审核6篇论文,当看到自己得到的是LLM的评价,真的很受伤。
还有人指出,在自己审阅的论文中,至少发现了3篇由大模型生成的评审意见,很可能还有更多,其中3篇明显是直接复制粘贴了ChatGPT输出,完全没有阅读论文。
这些评审都给了6分,Confidence为4,与其他所有人的评价完全不一致。
更有网友评价道,「论文评论的质量很低」。
一个评审者混淆了我们方法的基线,另一个评审者混淆了基线的派生(正如我们的工作所批评的那样)和我们方法的派生。我怀疑一些评论是由LLM产生的。

这届评审怎么肥事?


有人指出这本是NeurIPS官方组委会的问题。
对于NeurIPS的评审,6分的描述完全、彻底、奇怪地错误。






请到「今天看啥」查看全文