专栏名称: 我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net 微博:计算机视觉与机器学习,QQ群:928997753,52CV君个人账号:Your-Word。
目录
相关文章推荐
运营研究社  ·  来了!《运营总监实战手册3.0》包邮免费领 ·  昨天  
龙视新闻在线  ·  正月为什么不能理发?答案或许在这里…… ·  2 天前  
龙视新闻在线  ·  正月为什么不能理发?答案或许在这里…… ·  2 天前  
江苏新闻广播  ·  “茉莉花开”暖新春,百年非遗焕新彩 ·  3 天前  
51好读  ›  专栏  ›  我爱计算机视觉

ECCV 2024奖项公布,哥大摘得最佳论文奖桂冠

我爱计算机视觉  · 公众号  ·  · 2024-10-08 12:50

正文




关注公众号,发现CV技术之美




近日,第 18 届欧洲计算机视觉大会在意大利米兰圆满落下帷幕。本次大会共收录了 2395 篇论文,但录用率仅为 18%,这一数字创下了近年来的新低,彰显了大会对学术质量的严格把控。

值得一提的是,大会揭晓了一系列备受瞩目的奖项。其中包括最佳论文奖、最佳论文荣誉提名奖,以及旨在表彰计算机视觉领域经典研究成果的 Koenderink 奖和 Everingham 奖。

接下来,让我们一同探索这些获奖论文的奥秘,深入了解它们所研究的创新领域与前沿技术。

Best Paper Award(最佳论文奖)

Minimalist Vision with Freeform Pixels 论文出自哥伦比亚大学,作者是 Jeremy Klotz 和 Shree K. Nayar,荣获第 18 届欧洲计算机视觉大会(ECCV 2024)最佳论文奖。

引入自由形状像素概念,展示如何有效地利用少量测量解决轻量级视觉任务。

本文介绍了一种极简主义视觉系统,可以使用最少数量的像素来完成视觉任务。不同于传统相机使用的大网格方形像素,极简主义相机采用可以任意形状的自由形状像素,来增加其信息内容。

该系统的硬件可以被建模为神经网络的第一层,后续层用于推理。通过训练来确定自由形式像素的形状,这些像素由光电探测器和光学掩模实现。

另外,设计了几个应用案例,如监测室内空间(8个像素)、测量房间照明(8个像素)和估计交通流量(8个像素),其性能却与使用多个数量级更多像素的传统相机相当。

极简主义视觉的两个主要优势:

  1. 保护场景中个体的隐私,因为所捕获的信息不足以提取视觉细节。
  2. 由于测量次数很少,系统可以完全自供电,无需外部电源或电池。
  • 论文链接:https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/08113.pdf
  • 项目链接:https://cave.cs.columbia.edu/projects/categories/project?cid=Computational+Imaging&pid=Minimalist+Vision+with+Freeform+Pixels

Best Paper Honorable Mention(最佳论文荣誉提名奖)

最佳论文荣誉提名奖共有 2 篇论文获奖。

第一篇 论文是 Rasterized Edge Gradients: Handling Discontinuities Differentiably ,出自 Meta,作者是 Stanislav Pidhorskyi, Tomas Simon, Gabriel Schwartz, He Wen, Yaser Sheikh, Jason Saragih。

本文介绍一种新方法,用于在基于光栅化(rasterization)的可微渲染器中计算可见性不连续处的梯度。关键创新在于“微边”(micro-edges)概念,将光栅化图像可以被视为可微、连续过程的结果,而不是不可微、离散像素的光栅化。

这种方法简化了在不连续处梯度计算的传统复杂问题,并能够处理几何交叉,具有相较于先前技术的优势。在动态人头场景重建的背景下展示了该方法的有效性,证明了它能同时处理摄像机图像和分割掩膜。

作者指出“微边”(micro-edges)技术在可微渲染领域代表了重要的进展,可能为依赖于准确梯度计算的计算机视觉和图形学应用开启新的可能性。随着继续探索将该方法与新兴渲染技术(如神经场)结合的潜力,可以期待未来出现更强大和多功能的可微渲染解决方案。

  • 论文链接:https://arxiv.org/abs/2405.02508

第二篇 论文是 Concept Arithmetics for Circumventing Concept Inhibition in Diffusion Models ,出自波士顿大学,作者是 Vitali Petsiuk, Kate Saenko。

首个在概念抑制及其规避的背景下考虑扩散模型组合属性的研究。

出于道德和法律方面的考虑,科学界正在积极开发各种方法,以限制滥用 “文本到图像 ”传播模型,在生成的图像中复制受版权保护的、暴力的、露骨的或个人信息。

本次研究也在测试这些新开发的安全措施,通过扮演对手的角色,寻找其中的漏洞和后门。利用扩散模型的组合特性,可以在单个图像生成中利用多个提示。通过这一特性,可以将本不应该受到抑制影响的其他概念结合起来,重建负责生成目标概念的向量,即使已经无法直接计算该向量。

文中提供了理论和实证证据,解释了为何所提议的攻击是可能的,并讨论了这些发现对安全模型部署的影响。作者认为,考虑对手可能采用的所有图像生成方法对于扩散模型至关重要。此外,本次研究引发了关于概念运算和组合推理对扩散模型安全机制影响的讨论。

  • 论文链接:https://arxiv.org/abs/2404.13706
  • 项目链接:https://cs-people.bu.edu/vpetsiuk/arc/

2024 Koenderink Prize(经典论文奖)

Koenderink 奖旨在表彰计算机视觉领域的基础性贡献研究,获奖论文均为发表时间超过十年并经受住时间检验的研究。

本届获奖论文共有 2 篇。

第一篇 论文是 Microsoft COCO: Common Objects in Context ,发表于 2014 年,截至目前引用次数为 50359。

  • 中文介绍:https://blog.csdn.net/qq_38410428/article/details/115414749






请到「今天看啥」查看全文