点击下方
卡片
,关注
「3D视觉工坊」
公众号
选择
星标
,干货第一时间送达
添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。
扫描下方二维码,加入
「3D视觉从入门到精通」知识星球
(
点开有惊喜
)
,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:
近20门秘制视频课程
、
最新顶会论文
、计算机视觉书籍
、
优质3D视觉算法源码
等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!
作者 | James的AI科研路 编辑 | 自动驾驶之心
原文链接:https://zhuanlan.zhihu.com/p/19776850516
如题,这次CVPR审稿分了四篇论文,全部都是我熟悉的领域,其中有三篇都是引用了我之前的论文并在实验上进行了直接对比,额外的一篇也是我目前正在做的方向,所以这些领域我都很熟,评价起来很容易,方法常见套路、idea能从哪些方面展开、该用哪些benchmark门清,最后结果就是3、3、3、2(2其实一开始打的1,后来想着还是给点机会改2了)。这次CVPR审稿体会还是蛮深的,分享几点感悟,和大家一起交流交流
刚好这周小班课开始讲论文写作✍️,第一件事儿就是让大家搞懂顶会审稿人的真实打分逻辑,这样才能知己知彼,一次就中,免得浪费时间⏳。我也回顾下2024一整年,从 ACM MM 2024 ➡️ NeurIPS 2024 ➡️ ICLR 2025 ➡️ AAAI2025 ➡️ 现在的CVPR2025,再算上IJCV TIP TPAMI的审稿,总共接近20篇论文,我自己也慢慢形成了一套审稿流程和一丢丢的taste,到底什么样的文章能一次就中顶会,在这儿先简单说下。
大致审稿流程 :
引言部分的teaser图会重点看,看是否把文章的main idea或者卖点说清楚了,引言部分的故事逻辑和动机是重点,动机强不强,直接决定我买不买账
如果熟悉,会直接跳过;不熟悉,会当背景快速过一遍,补充下,看看这篇论文跟其他文章有哪些不同
然后跳到实验部分,看方法效果是否突出,对比是否公平,消融实验是否全面,可视化分析有没有做到位
具体的loss设计、小模块设计,有没有明显不合理的地方 ,这一整套下来,基本就有个整体的分数判断了,就可以开始写审稿意见了
也会再回顾论文的某些部分,来double check细节和自己的理解对不对
所以总体而言,这一套流程下来,一篇文章至少会读2遍,普遍读3遍,意见也就写的差不多了,就可以跟AC交差了
这次四篇论文的整体情况 :
这次审稿论文ID从4XX,到14XXX,跨度很大,所有的文章都用了LLM/VLM/VFM等基础模型作为主要或次要卖点,每篇论文都有亮点,也都有不足,这些不足也都很有代表性,下面简单展开下,方便写作新手或者第一次投稿顶会的薯薯借鉴和提前规避⚠️。
Overclaim是我一开始投稿CVPR时审稿人给我的反馈,当时还一直在揣摩,为啥审稿人会这么说?是我的实验漏掉了部分,还是我的效果不够有说服力?这点其实是个很主观的评价,作为作者,唯一能做的就是根据你的方法和实验,来总结你的贡献,确保你所claim的每个点都能在方法或者实验里得到印证,有相应的evidence可以support,这点非常重要。
所以写贡献要小心谨慎,你多说一个点,多加一个词,可能都会引起审稿人的夺命连环问,到时候你会为此付出代价,或者要多补一堆实验,其中一篇审稿,我列了四块儿实验,我希望在rebuttal的时候看到,就看作者能不能完成了,我会根据新的实验结果来决定要不要提分。
实验不充分是我审稿的三篇论文没能拿到weak accept的主要原因,这几篇多多少少都有实验上的问题。
有的是关键模块的消融只是很粗糙的做了下,有的是论文涨了很多点,也对比了足够多的方法和测了足够多的benchmark,但因为方法过于简单,简单到几乎说不出新意,很明显的A+B的味道,作者又没有进一步的分析和消融,我不知道他的效果提升到底是来源于引入foundation model本身,还是作者自己的额外设计,甚至是来自于多个数据集的co-training,这些都没有消融来验证,所以我看在效果和开源了匿名代码的份上,给了3分,也给了机会看rebuttal。