0. 这篇文章干了啥?
回环闭合在同时定位与地图构建(SLAM)系统中起着至关重要的作用,用于校正里程计漂移并构建一致的地图,特别是在没有GPS信息的单传感器SLAM系统中。基于激光雷达(LiDAR)的回环闭合通常需要从激光雷达扫描中提取特征以生成具有区分性的描述符。这项任务尤其具有挑战性,因为自主机器人在户外操作中的点云具有广泛且稀疏的特性。
虽然许多现有方法侧重于回环闭合检测(LCD),但很少有方法能够估计六自由度(6-DoF)下的闭合环姿态。一些方法结合了1-DoF或3-DoF的姿态估计,但这可能不足以满足6-DoF SLAM系统的需求。然而,现有的全6-DoF姿态估计方法要么非常耗时,要么相对精度较低。
为了解决这些问题,我们提出了SGLC,一个高效的语义图引导的全回环闭合框架,它提供了鲁棒的LCD和准确的6-DoF回环姿态估计。与现有基于语义图的方法不同,这些方法无差别地使用前景实例和背景点,或者忽视了几何信息丰富的背景点云,我们的方法有效地利用了前景和背景元素的独特属性。SGLC基于前景实例构建语义图,因为前景实例可以自然地表示为单独的节点。而在检索回环候选点和估计6-DoF姿态时,SGLC利用语义图的拓扑属性和背景点的几何特征来增强回环闭合的准确性和鲁棒性。
具体来说,SGLC首先生成激光雷达扫描描述符,通过利用前景语义图的语义和类型学特性以及背景的几何特征,快速检索多个候选扫描。为了防止错误的回环影响SLAM系统,我们应用了几何验证,通过识别查询扫描和候选扫描之间的图节点对应关系来消除错误的回环候选。在节点匹配过程中,我们确保准确的对应关系,并通过基于相邻几何结构的异常值对应关系修剪方法来促进该过程。最后,对于经过验证的回环候选扫描,我们提出了一种粗到细再到精炼的配准策略,以估计其与查询扫描之间的六自由度(6-DoF)姿态。这首先通过对齐稀疏匹配的节点中心来估计粗略姿态。然后,应用密集实例点的精细配准。来自背景点的额外平面信息进一步使用点到平面约束来精炼最终姿态估计。该策略同时对齐了前景实例和背景点,每个阶段都从一个有利的初始值开始,确保了准确性和效率。
下面一起来阅读一下这项工作~
1. 论文信息
标题:SGLC: Semantic Graph-Guided Coarse-Fine-Refine Full Loop Closing for LiDAR SLAM
作者:Neng Wang, Xieyuanli Chen, Chenghao Shi, Zhiqiang Zheng, Hongshan Yu, Huimin Lu
机构:国防科技大学、湖南大学
原文链接:https://arxiv.org/abs/2407.08106v1
代码链接:https://github.com/nubot-nudt/SGLC
2. 摘要
回环闭合是SLAM中的一个关键组成部分,它通过两个主要步骤帮助消除累积误差:回环检测和回环姿态校正。第一步确定是否应执行回环闭合,而第二步则估计6自由度(6-DoF)姿态以校正里程计漂移。当前的方法大多侧重于开发用于回环闭合检测的鲁棒描述符,却往往忽略了回环姿态估计。少数包含姿态估计的方法要么精度较低,要么计算成本高昂。为解决这一问题,我们引入了SGLC,这是一种实时语义图引导的全回环闭合方法,具备鲁棒的回环闭合检测和6-DoF姿态估计能力。SGLC考虑了前景点和背景点的独特特性。对于前景实例,它构建了一个语义图,该图不仅抽象了点云表示以快速生成和匹配描述符,还指导了后续的回环验证和初始姿态估计。同时,背景点被用于为逐扫描描述符构建提供更多几何特征,并为进一步的姿态细化提供稳定的平面信息。回环姿态估计采用了一种粗到细的注册方案,该方案考虑了实例点和背景点的对齐,从而提供了高效且准确的姿态估计。我们通过在KITTI和KITTI-360数据集上进行的大量实验评估了SGLC的回环闭合性能,证明了其优于现有的最先进方法。此外,我们将SGLC集成到SLAM系统中,消除了累积误差并提高了整体SLAM性能。SGLC的实现将在https://github.com/nubot-nudt/SGLC上发布。
3. 效果展示
图1展示了我们的方法如何准确检测回环闭合并识别实例节点对应关系,即使在方向和位置差异显著的地方,也能最终估计回环姿态并闭合回环。
4. 主要贡献
综上所述,我们的贡献主要有四个方面:(i)我们提出了一种新颖的语义图引导的全回环闭合框架SGLC,该框架提供了鲁棒的回环检测和准确的六自由度姿态估计。(ii)我们设计了一种有效且高效的异常值修剪方法,以消除错误的节点对应关系。(iii)我们提出了一种粗到细再到精炼的配准方案,提高了姿态估计的准确性和效率。(iv)我们将SGLC无缝集成到当前的SLAM框架中,减少了里程计估计的误差。在KITTI和KITTI-360数据集上的广泛评估结果支持了这些主张。
5. 基本原理是啥?
SGLC的框架。它首先为前景实例构建语义图,然后生成激光雷达扫描描述符,该描述符同时考虑了语义图的拓扑属性和背景的外观特征。利用激光雷达扫描描述符从数据库中检索回环候选扫描。接下来,对每个回环候选进行几何验证以过滤掉错误的回环闭合,关键步骤是利用实例节点描述符进行鲁棒的稀疏节点匹配。最后,采用粗到细再到精化的注册方案来估计精确的六自由度姿态。
6. 实验结果
我们的方法在多个序列上优于当前最优水平(SOTA),并在KITTI数据集上获得了最佳的平均F1max分数和EP。具体而言,对于仅包含反向回环闭合的序列08,我们的方法仍然表现出色,而大多数基于手工设计的方法则遭受了显著的性能下降。这证明了我们的方法具有良好的旋转不变性。对于KITTI-360数据集,我们的方法仍能获得具有竞争力的结果,展示了其泛化能力。
此外,为了进一步研究远距离下的回环闭合检测性能,当两个激光雷达扫描的重叠率超过0.3时,认为它们构成了回环闭合,这表示它们之间的最大可能距离约为15米。我们采用与他们相同的实验设置,在KITTI 00序列上使用AUC、F1max、Recall@1和Recall@1%作为评估指标来评估我们的方法。结果如表II所示。由于BoW3D更倾向于几何验证,我们无法从其开源实现中生成其AUC和recall@1%的结果。从结果中可以看出,我们的方法在整体指标上显著优于SOTA基线,表明其对于检测远距离回环闭合的鲁棒性。尽管GOSMatch也具有良好的召回能力,但其F1max分数略低于其他方法,表明其准确判断真正回环闭合的能力不足。
如表III左侧所示,与LCDNet相比,我们的方法取得了具有竞争力的结果,并且在KITTI数据集中4米范围内的闭合环上,远超LCDNet(快速)和BoW3D。无论是在序列00中的同向回环校正还是序列08中的反向回环校正中,我们的方法和LCDNet均获得了较高的注册召回率(RR),而BoW3D和LCDNet(快速)在反向回环校正中显著下降。在旋转和平移误差(RTE)方面,我们的方法优于LCDNet,显示出其在平移估计中的卓越性能。为了进一步突出这些方法之间的差距,我们在重叠率超过0.3的回环对上进行了测试。比较结果如表III右侧所示。可以看出,我们的方法仍然保持着强大的注册性能,并在所有指标上均超过其他方法,强调了其鲁棒性。相比之下,LCDNet在低重叠度下进行注册时性能有所下降。我们还在图3中展示了定性结果。可以看出,即使在低重叠度的回环闭合中,我们的方法也实现了更好的对齐,这归功于语义引导的粗到细的点云对齐过程。表IV展示了在KITTI-360数据集中4米范围内的闭合环上的结果。我们还报告了所有方法在我们机器上的平均运行时间。从注册结果来看,我们的方法与其他基线相比仍然具有竞争力,证明了我们的方法的通用性。此外,我们的方法实现了最快的运行速度,并且在包含语义分割时间的情况下也显著优于其他方法,SegNet4D的大约耗时为67.1毫秒。相比之下,LCDNet运行时间极长,不适合实时SLAM系统。
7. 总结 & 未来工作
本文提出了一种基于语义图引导的激光雷达回环闭合方法。该方法首先构建前景实例的语义图,该语义图作为描述符生成的基础,并指导后续几何验证和姿态估计的步骤。设计的激光雷达扫描描述符结合了语义图的拓扑特性和背景点云的外观特征,从而提高了回环闭合检测的鲁棒性。对于回环姿态估计,我们提出了一种粗到细再到精的配准方案,该方案考虑了实例点和背景点的对齐,提供了高效且准确的姿态估计。所提出的方法支持实时在线操作,并便于集成到SLAM系统中,特别是语义SLAM系统中。在不同数据集上的实验结果表明了该方法的优越性。
对更多实验结果和文章细节感兴趣的读者,可以阅读一下论文原文~
本文仅做学术分享,如有侵权,请联系删文。
3D视觉交流群,成立啦!
目前我们已经建立了3D视觉方向多个社群,包括
2D计算机视觉
、
最前沿
、
工业3D视觉
、
SLAM
、
自动驾驶
、
三维重建
、
无人机
等方向,细分群包括:
工业3D视觉
:相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。
SLAM
:视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。
自动驾驶:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。
三维重建
:3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等
无人机
:四旋翼建模、无人机飞控等
2D计算机视觉
:图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等
最前沿
:具身智能、大模型、Mamba、扩散模型等
除了这些,还有
求职
、
硬件选型
、
视觉产品落地、产品、行业新闻
等交流群
添加小助理: dddvision,备注:
研究方向+学校/公司+昵称
(如
3D点云+清华+小草莓
), 拉你入群。
▲长按扫码添加助理:cv3d008
「
3D视觉从入门到精通
」
知识星球
「
3D视觉从入门到精通
」知识星球,已沉淀6年,星球内资料包括:
秘制视频课程近20门