每天一分钟,带你读遍机器人顶级会议文章
标题:SimVODIS++: Neural Semantic Visual Odometry in Dynamic Environments
作者:
Ue-Hwan Kim, Se-Ho Kim and Jong-Hwan Kim
来源:2022 IEEE International Conference on Robotics and Automation (ICRA)
编译:pandaman
审核:Zoe
这是泡泡一分钟推送的第 1054 篇文章,欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权
对3D几何结构和相机运动的精确估计能够实现机器人和自动驾驶汽车中的广泛任务。然而,语义缺乏和动态对象导致的性能下降,阻碍了它在现实场景中的应用。为了克服这些局限性,我们在同时VO、对象检测和实例分割(SimVODIS)网络的基础上设计了一种新的神经语义视觉里程计(VO)架构。接下来,我们提出了一种具有多任务学习公式的专注位姿估计架构,用于处理动态对象和增强VO性能。我们工作中进行的大量实验证明,所提出的SimVODIS++提高了动态环境中的VO性能。此外,SimVODIS++关注显著区域,同时排除无特征区域。
图1 SimVODIS++的体系结构。注意位姿分支估计去除动态对象的输入图像帧之间的相对姿态——进行动态特征选择。深度分支利用多个尺度上的特征来预测中心图像的深度图。
图2 专注位姿估计分支的架构。分支首先适应FPN中的特征,自注意模块执行动态特征选择以移除移动对象。
表1 KITTI特征分割和里程计数据集之间的重叠以及评估的可用性
图3 激活图的比较。所提出的SimVODIS++模型在位姿估计过程中选择性地激活显著区域;SimVODIS++的激活图排除了动态对象和无特征区域(例如天空)。相比之下,基本模型几乎没有做出这样的区分,并且动态对象会降低性能。
图4
比较研究结果(定性)。所提出的SimVODIS++在两个数据集中都表现出优于基线模型的性能。特别地,采用对象运动的显式建模的基线模型在动态环境中不能令人满意地执行。
表3 比较研究结果(定量)。所提出的SIMVODIS++显示出最佳性能
Abstract
Accurate estimation of 3D geometry and camera motion enables a wide range of tasks in robotics and autonomous vehicles. However, the lack of semantics and the performance degradation due to dynamic objects hinder its application to real-world scenarios. To overcome these limitations, we design a novel neural semantic visual odometry (VO) architecture on top of the simultaneous VO, object detection and instance segmentation (SimVODIS) network. Next, we propose an attentive pose estimation architecture with a multi-task learning formulation for handling dynamic objects and VO performance enhancement. The extensive experiments conducted in our work attest that the proposed SimVODIS++ improves the VO performance in dynamic environments. Further, SimVODIS++ focuses on salient regions while excluding feature-less regions.
如果你对本文感兴趣,请点击点击
阅读原文
下载完整文章,如想查看更多文章请关注
【泡泡机器人SLAM】公众号(paopaorobot_slam)
。