专栏名称: 3D视觉工坊
1、OpenCV的技术传播; 2、3D点云与重建技术; 3、Vslam技术; 4、深度学习; 5、技术干货分享。
目录
相关文章推荐
发现新西兰  ·  奥克兰房价开年大跌!挂牌量猛增 ·  3 天前  
发现新西兰  ·  新西兰“裸体”音乐节要来了!竟设有OOXX专 ... ·  3 天前  
泉安安海在线  ·  泉州刚刚发布:延长至2月28日! ·  昨天  
51好读  ›  专栏  ›  3D视觉工坊

从CVPR25审稿,看当前AI顶会中稿趋势!

3D视觉工坊  · 公众号  ·  · 2025-02-07 07:00

正文

点击下方 卡片 ,关注 「3D视觉工坊」 公众号
选择 星标 ,干货第一时间送达

添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。

扫描下方二维码,加入 「3D视觉从入门到精通」知识星球 ( 点开有惊喜 ) ,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料: 近20门秘制视频课程 最新顶会论文 、计算机视觉书籍 优质3D视觉算法源码 等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!

作者 | James的AI科研路 编辑 | 自动驾驶之心

原文链接:https://zhuanlan.zhihu.com/p/19776850516

如题,这次CVPR审稿分了四篇论文,全部都是我熟悉的领域,其中有三篇都是引用了我之前的论文并在实验上进行了直接对比,额外的一篇也是我目前正在做的方向,所以这些领域我都很熟,评价起来很容易,方法常见套路、idea能从哪些方面展开、该用哪些benchmark门清,最后结果就是3、3、3、2(2其实一开始打的1,后来想着还是给点机会改2了)。这次CVPR审稿体会还是蛮深的,分享几点感悟,和大家一起交流交流
刚好这周小班课开始讲论文写作✍️,第一件事儿就是让大家搞懂顶会审稿人的真实打分逻辑,这样才能知己知彼,一次就中,免得浪费时间⏳。我也回顾下2024一整年,从 ACM MM 2024 ➡️ NeurIPS 2024 ➡️ ICLR 2025 ➡️ AAAI2025 ➡️ 现在的CVPR2025,再算上IJCV TIP TPAMI的审稿,总共接近20篇论文,我自己也慢慢形成了一套审稿流程和一丢丢的taste,到底什么样的文章能一次就中顶会,在这儿先简单说下。

大致审稿流程 :

先看题目,摘要和引言
引言部分的teaser图会重点看,看是否把文章的main idea或者卖点说清楚了,引言部分的故事逻辑和动机是重点,动机强不强,直接决定我买不买账
相关工作
如果熟悉,会直接跳过;不熟悉,会当背景快速过一遍,补充下,看看这篇论文跟其他文章有哪些不同
方法框架图和整体流程
然后跳到实验部分,看方法效果是否突出,对比是否公平,消融实验是否全面,可视化分析有没有做到位
最后回到方法细节
具体的loss设计、小模块设计,有没有明显不合理的地方 ,这一整套下来,基本就有个整体的分数判断了,就可以开始写审稿意见了
写意见的过程
也会再回顾论文的某些部分,来double check细节和自己的理解对不对
所以总体而言,这一套流程下来,一篇文章至少会读2遍,普遍读3遍,意见也就写的差不多了,就可以跟AC交差了 ‍

这次四篇论文的整体情况 :

这次审稿论文ID从4XX,到14XXX,跨度很大,所有的文章都用了LLM/VLM/VFM等基础模型作为主要或次要卖点,每篇论文都有亮点,也都有不足,这些不足也都很有代表性,下面简单展开下,方便写作新手或者第一次投稿顶会的薯薯借鉴和提前规避⚠️。
Overclaim
Overclaim是我一开始投稿CVPR时审稿人给我的反馈,当时还一直在揣摩,为啥审稿人会这么说?是我的实验漏掉了部分,还是我的效果不够有说服力?这点其实是个很主观的评价,作为作者,唯一能做的就是根据你的方法和实验,来总结你的贡献,确保你所claim的每个点都能在方法或者实验里得到印证,有相应的evidence可以support,这点非常重要。
所以写贡献要小心谨慎,你多说一个点,多加一个词,可能都会引起审稿人的夺命连环问,到时候你会为此付出代价,或者要多补一堆实验,其中一篇审稿,我列了四块儿实验,我希望在rebuttal的时候看到,就看作者能不能完成了,我会根据新的实验结果来决定要不要提分。
实验不充分
实验不充分是我审稿的三篇论文没能拿到weak accept的主要原因,这几篇多多少少都有实验上的问题。
有的是关键模块的消融只是很粗糙的做了下,有的是论文涨了很多点,也对比了足够多的方法和测了足够多的benchmark,但因为方法过于简单,简单到几乎说不出新意,很明显的A+B的味道,作者又没有进一步的分析和消融,我不知道他的效果提升到底是来源于引入foundation model本身,还是作者自己的额外设计,甚至是来自于多个数据集的co-training,这些都没有消融来验证,所以我看在效果和开源了匿名代码的份上,给了3分,也给了机会看rebuttal。






请到「今天看啥」查看全文