本期为
TechBeat人工智能社区
第
626
期
线上Talk。
北京时间
9
月25日
(周三)20:00,
北京航空航天大学博士生
阮受炜
的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题
是:
“
探索视觉感知的3D视角鲁棒性
”
,
届时他探索和思考如何有效评估、增强视觉感知模型应对视角变换的鲁棒性,介绍团队在这一领域开展的系列工作,包括ViewFool、VIAT和Omniview-Tuning。
长按识别二维码,一键预约TALK!
获得鲁棒和不变(Invariant)的表征是计算机视觉领域的长期挑战。以往的深度学习鲁棒性研究侧重于针对L-p范数下的对抗扰动(Adversarial perturbation)。然而在复杂动态的物理场景下,存在诸多值得关注的自然扰动,而视角变换就是其中一种重要的扰动因素。
在本次分享中,我们将一起探索和思考如何有效评估、增强视觉感知模型应对视角变换的鲁棒性,介绍我们在这一领域开展的系列工作,包括ViewFool、VIAT和Omniview-Tuning。
2. 有限视图下的视角鲁棒性评估算法
ViewFool: Evaluating the Robustness of Visual Recognition to Adversarial Viewpoints, NeurIPS2022
3. 视角不变性对抗分布训练
VIAT: Towards viewpoint-invariant visual recognition via adversarial training, ICCV2023
4. 迈向视觉-语言预训练模型的视角鲁棒性增强
Omniview-Tuning: Boosting Viewpoint Invariance of Vision-Language Pre-training Models, ECCV2024 Oral
5. 工作局限性与未来展望
Talk·预习资料
▼
论文链接:
https://arxiv.org/abs/1811.11553
论文链接:
https://arxiv.org/abs/2210.03895
代码链接:
https://github.com/Heathcliff-saku/ViewFool_
https://arxiv.org/abs/2307.10235
代码链接:
https://github.com/Heathcliff-saku/VIAT
https://arxiv.org/abs/2404.12139
代码链接:
https://omniview-tuning.github.io/
Talk·提问交流
▼
在Talk界面下的
【交流区】
参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
阮受炜是北京航空航天大学二年级直博生,导师为韦星星副教授。同时在清华大学作为访问博士生,在苏航研究员、董胤蓬博士指导下开展相关研究。他先前本科毕业于西安电子科技大学。他的研究兴趣集中在3D视觉感知及其鲁棒性。在CVPR/ICCV/ECCV等国际顶级会议发表论文6篇,其中1篇工作入选ECCV2024Oral。
个人主页:
https://www.techbeat.net/grzytrkj?id=41658