专栏名称: 3DCV
关注工业3D视觉、SLAM、自动驾驶技术,更专注3D视觉产业的信息传播和产品价值的创造,深度聚焦于3D视觉传感器、SLAM产品,使行业产品快速连接消费者。
目录
相关文章推荐
51好读  ›  专栏  ›  3DCV

这是什么魔法?波恩大学开源LiDAR SLAM回环检测的万能公式!

3DCV  · 公众号  ·  · 2025-01-17 11:00

正文

点击下方 卡片 ,关注 「3DCV」 公众号
选择 星标 ,干货第一时间送达

来源:3DCV

添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。

扫描下方二维码,加入 「3D视觉从入门到精通」知识星球 ( 点开有惊喜 ) ,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料: 近20门独家秘制视频课程 最新顶会论文 、计算机视觉书籍 优质3D视觉算法源码 等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!

0. 论文信息

标题:Efficiently Closing Loops in LiDAR-Based SLAM Using Point Cloud Density Maps

作者:Saurabh Gupta, Tiziano Guadagnino, Benedikt Mersch, Niklas Trekel, Meher V. R. Malladi, Cyrill Stachniss

机构:University of Bonn

原文链接:https://arxiv.org/abs/2501.07399

1. 导读

一致的地图是大多数自主移动机器人的关键。他们经常使用SLAM方法来构建这样的地图。通过位置识别实现的闭环有助于通过减轻全局漂移来保持精确的姿态估计。提出了一种鲁棒的闭环检测管道,用于配备激光雷达的机器人的户外SLAM。该方法处理具有不同扫描模式、视场和分辨率的各种激光雷达传感器。它通过激光雷达扫描生成本地地图,并使用地面对齐模块对齐它们,以处理激光雷达的平面和非平面运动,确保跨平台的适用性。该方法使用这些局部地图的保持密度的鸟瞰图投影,并从中提取ORB特征描述符用于地点识别。它将特征描述符存储在二叉查找树中,以便高效检索,并且自相似性修剪解决了重复环境中的感知混淆。在公共和自我记录的数据集上的大量实验证明了准确的闭环检测、长期定位和跨平台多地图对齐,与激光雷达扫描模式、视野和运动轮廓无关。

2. 效果展示

两个不同激光雷达传感器平台记录的序列之间检测到的环闭合示例,重访间隔为2周。蓝色是背包序列,在校园环境中记录,安装在背包上的 HesaiPandar-128 激光雷达。红色是汽车序列,在城市中记录,使用 Ouster OS1-128 激光雷达。两个轨迹都通过姿态图进行单独优化,通过我们的管道获得会话中的环闭合约束。我们使用我们的环闭合管道检测这两个几乎没有重叠的序列之间的闭合,并使用多会话环闭合约束对两个轨迹进行对齐。 重叠区域用小矩形突出显示这些区域的相应闭环在放大的矩形中显示。

3. 引言

移动机器人必须安全且高效地在其周围环境中进行导航。它们需要知道自身在环境中的位置,以便成功导航至目标地点或探索新区域。精确定位有助于机器人生成环境的准确地图,这些地图可用于导航。传统上,机器人常利用通过外部传感器(如摄像头和激光雷达(LiDAR))、本体感受传感器(如轮式里程计和惯性测量单元(IMU))或它们的组合所获取的序列数据来进行自我定位。根据应用和可用性,户外系统通常会额外利用全球导航卫星系统(GNSS)进行全球定位。

由于激光雷达传感器能提供精确且密集的三维距离数据,因此在机器人技术中经常被使用。许多先前的研究通过使用激光雷达传感器推进了序列姿态估计领域的发展。这种仅基于序列的姿态估计,也称为传感器里程计,会由于机器人运动和传感器数据的固有噪声、环境中的动态变化以及非平凡的数据关联问题,而随时间出现姿态估计漂移。

机器人可以通过识别先前已观察到的地点来补偿这种漂移并改进姿态估计。这项任务通常被称为回环检测。它允许利用在重新访问地点时激光雷达观测到的几何信息来校正姿态漂移,例如,通过姿态图优化。在同时定位与地图构建(SLAM)系统中,稳健的回环检测至关重要。机器人必须能够识别出它们已返回到先前访问过的地点以完成回环。地点识别是当前视图与先前观察到的地点的地图或数据库之间的数据关联任务。生成地点数据库是一项艰巨的任务,它需要对环境进行尽可能独特的描述,并且这种描述对于视点的变化应是不变的。感知混淆是另一项挑战,因为具有相似结构的不同地点可能会混淆地点识别算法。此外,这样的数据库还应过滤掉传感器数据中出现的动态对象,以实现跨长时间间隔的稳健地点识别。 推荐课程: 室内、室外激光SLAM关键算法、代码和实战剖析(cartographer+LOAM+ LIO-SAM)

在我们的工作中,我们从传感器提供的点云中生成数据库。存储在数据库中的由点云计算得出的地点描述符应对激光雷达的扫描模式、空间密度和视场(FoV)是不变的。此外,为了在SLAM系统中执行回环检测中的地点识别,描述符应捕获场景的几何信息,以便能够在局部地图之间进行相对姿态估计,并实际计算出用于姿态图优化的回环约束。

基于特征描述符的技术在基于激光雷达的回环检测和地点识别中是常见做法。在点云上计算得出的全局特征描述符易于存储在数据库中,并且允许快速检索重新访问的候选对象。然而,此类方法通常无法为检测到的回环提供初始几何对齐,并且需要对齐点云进行额外的配准步骤。相比之下,在点云内的局部三维块上计算得出的局部特征描述符有助于重新访问位置的几何对齐。但是,它们需要一种细致入微的方法来高效地将特征描述符存储在数据库中。

由于处理三维点云以获取局部或全局特征描述符的算法复杂性,几种方法执行了点云的鸟瞰图(BEV)投影或圆柱投影。这导致点云数据的二维表示,允许更快的特征检测和匹配,从而实现SLAM中的在线回环检测。

本手稿可视为Gupta等人工作的扩展,其通过检测鸟瞰图投影中的局部特征描述符,使用局部地图提出了回环检测方法。然而,他们严格假设传感器平台的平面运动,限制了其在仪器化车辆平台上的应用,并且仅提供了回环的二维刚体对齐。此外,Gupta等人的工作在处理具有感知混淆的场景(如桥梁或隧道)时也遇到困难,导致错误的回环,即本文所提出方法在这些情况下表现更佳的场景。

本文的主要贡献在于提出了一种稳健的回环检测管道,该管道适用于具有不同运动特征且对其扫描模式、视场和视点不变的多种激光雷达传感器。我们通过聚合连续扫描并创建局部地图的密度保持鸟瞰图投影作为描述三维局部地图中结构信息的局部特征的中间二维表示来生成局部地图。由于在重新访问时可以在室外环境中一致地识别地面平面,因此我们将其作为参考平面,以便在重新访问时获得一致的鸟瞰图投影。我们提出了一个地面对齐模块,用于在每个局部地图中识别这样的地面平面,并转换局部地图,使得该地面平面与参考系的局部xy平面重合。这简化了鸟瞰图投影,并将回环对齐限制在公共地面平面上的两个维度,同时也使我们的方法适用于各种激光雷达传感器的运动特征。我们将鸟瞰图投影中的二进制ORB[46]特征描述符存储到汉明距离嵌入二进制搜索树[50]中。我们通过在将特征描述符插入数据库之前对其进行自相似性修剪,来设计我们的方法以抵抗场景相似性(也称为感知混淆)的影响。使用汉明距离度量,我们通过将查询局部地图的特征描述符与数据库进行匹配来获得回环候选对象。我们后续的基于RANSAC的几何验证步骤为我们提供了回环以及局部地图鸟瞰图投影之间的二维对齐。当与每个局部地图的地面对齐估计相结合时,我们获得了涉及回环的局部地图之间全局对齐的完整三维估计。我们在多个数据集上进行了广泛的实验评估,这些数据集记录了安装在不同移动平台上的各种激光雷达所获取的序列,测试了我们的管道在复杂场景中的准确性和鲁棒性。

我们的方法实现将在稿件被接受后发布。

4. 主要贡献

我们提出了五项关键主张,这些主张得到了本文和实验评估的支持:

1)我们的方法可以检测由具有不同扫描模式、视场和分辨率的激光雷达传感器生成的局部地图之间的回环。

2)我们的方法可以进行跨会话回环检测和长期重新访问对齐。

3)我们的方法也适用于激光雷达传感器框架中具有非平面运动的手持平台,并为检测到的回环提供了完整的三维刚体变换对齐。

4)我们的方法对于具有重复结构的环境中的感知混淆具有鲁棒性。

5)我们的方法可以检测由不同激光雷达传感器平台记录且具有最小重叠的序列之间的回环,从而实现跨平台多地图对齐。

5. 方法

我们提出了一种使用局部地图的鸟瞰图表示来检测回环的方法,该方法适用于车载和手持激光雷达传感器平台。它还提供了参与回环的局部地图之间相对姿态的完整三维初始猜测。我们在图2中展示了我们的完整管道的概述。

我们解释了基于行程位移准则从激光雷达点云生成局部地图的程序。然后,我们提出了一种在局部地图中检测和对齐地面平面到局部参考系的xy平面的方法。这种对齐使得即使在激光雷达传感器具有非平面运动的场景中也能计算鸟瞰图表示。我们介绍了在这些鸟瞰图图像上为点特征计算二进制描述符的方法。为了使用这些二进制特征描述符实现地点识别,我们将其存储在汉明距离嵌入二进制搜索树中,以便与查询地图进行后续匹配。我们通过将这些特征描述符与数据库进行匹配,从查询局部地图的新特征描述符中获得一组候选回环。我们在RANSAC方案的基础上,对匹配的特征描述符之间进行二维回环验证和几何对齐。该二维对齐和每个局部地图的地面对齐提供了将每对回环闭合的局部地图对齐的相对三维变换。

6. 实验结果

7. 总结 & 未来工作

本文提出了一种新颖而稳健的方法来检测激光雷达SLAM中的环路闭合,并在检测到的闭合点之间提供3D对齐。我们的方法依赖于使用局部里程计估计生成的局部地图的密度保持BEV投影。我们将局部地面视为在多次访问中共享的参考平面,并调整局部地图,使地面平面与局部地图参考框架的xy平面重合。这使得在不同移动平台上进行一致的BEV投影成为可能,这些平台的激光雷达具有不同的运动特性。我们在BEV投影上检测ORB特征描述符,并对这些特征描述符进行自相似修剪,以避免在重复环境中由于场景相似性而产生的虚假闭合。我们实现并广泛评估了我们的方法。

在几个公共和自我记录的数据集上,使用来自不同移动平台的各种激光雷达传感器进行记录。我们还比较了我们的方法与其他最先进的基线。这些实验证明了我们的方法在各种城市环境中检测激光雷达不同扫描模式和视场的长环闭合的准确性和有效性。我们还展示了我们的方法在不同激光雷达记录的多个会话中检测长期环闭合的有用性。我们将我们的软件作为开源软件发布,供社区进一步使用,以推动SLAM中位置识别和闭环的研究。

对更多实验结果和文章细节感兴趣的读者,可以阅读一下论文原文~

本文仅做学术分享,如有侵权,请联系删文。

3D视觉交流群,成立啦!

目前我们已经建立了3D视觉方向多个社群,包括 2D计算机视觉 最前沿 工业3D视觉 SLAM 自动驾驶 三维重建 无人机 等方向,细分群包括:

工业3D视觉 :相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM :视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

自动驾驶 :深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

三维重建 :3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等。

无人机 :四旋翼建模、无人机飞控等

2D计算机视觉 :图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

最前沿 :具身智能、大模型、Mamba、扩散模型、图像/视频生成等

除了这些,还有 求职 硬件选型 视觉产品落地、产品、行业新闻 等交流群

添加小助理: cv3d001,备注: 研究方向+学校/公司+昵称 (如 3D点云+清华+小草莓 ), 拉你入群。

▲长按扫码添加助理:cv3d001

3D视觉工坊知识星球







请到「今天看啥」查看全文


推荐文章
中国历史解密  ·  华 国 锋 家 史 解 密
8 年前
法律读库  ·  铭心之爱 | 女律师办案手记(1)
7 年前
中国城市中心  ·  中国经济被低估?专家说逃税也算隐形GDP
7 年前