0. 这篇文章干了啥?
近年来,3D激光雷达里程计(LO)和SLAM得到了广泛研究,有效提高了定位精度和映射质量。大多数LO系统通常生成点云地图。然而,随着规模的增加或密度的提高,内存成本也会显著增加。尽管点云地图在人眼中看起来密集,但在放大时仍然会显得离散且稀疏。因此,点云地图通常需要后处理,如体素化,以转换为连续地图用于导航。
因此,许多研究人员一直在追求更紧凑、更密集的地图,以便与下游任务无缝集成。一些方法利用正态分布变换(NDT)或曲面元素(surfel)对环境地图进行参数化,导致元素之间存在间隙,这限制了捕获精细环境细节的能力。其他方法使用占用网格或截断符号距离函数(TSDF)将3D空间划分为体素。虽然这些表示方法适合导航,但它们对注册和机器人定位没有帮助,并且无法构建足够详细的地图。
由于复杂的3D结构可以用简单格式近似,三角网格已成为一种流行的表示方法。三角网格表示不仅提供高内存效率和可扩展性,还构建连续且平滑的表面,为注册提供有价值的信息。Puma使用泊松表面重建方法实现室外场景的平滑网格构建。然而,其性能无法满足实时要求。一些最新的方法已成功构建大规模3D网格地图,但它们需要额外的GPU资源。SLAMesh使用高斯过程(GP)增量构建网格地图,使里程计和网格划分能够相互受益。然而,它需要在网格地图的效率和精度之间取得平衡。此外,上述方法假设主要是静态环境,并未过滤动态物体的影响,这可能导致注册不一致和网格划分质量下降。
在本文中,我们提出了一种适应动态环境的新型网格划分模块CAD-Mesher。受深度学习网络层模块即插即用特性的启发,CAD-Mesher旨在轻松集成到各种激光雷达里程计中(只需重新映射点云主题和里程计主题,无需其他任何修改),以进一步提高里程计的精度,并增量构建准确、密集且连续的网格地图(如图1所示)。具体而言,我们提出了一种两阶段粗到细动态移除方法。在注册之前,使用基于可见性的方法粗略移除动态点,以提高点到网格注册的准确性。注册后,使用基于体素的概率方法精细移除动态点,以确保网格划分的质量。此外,我们使用关键帧滑动窗口来累积空间相邻扫描,为GP提供更准确的训练点,并实现更密集的网格划分。为了提高效率,引入了自适应降采样和关键帧选择策略,以均匀降采样累积的点云。
下面一起来阅读一下这项工作~
1. 论文信息
标题:CAD-Mesher: A Convenient, Accurate, Dense Mesh-based Mapping Module in SLAM for Dynamic Environments
作者:Yanpeng Jia, Fengkui Cao, Ting Wang, Yandong Tang, Shiliang Shao, Lianqing Liu
机构:中国科学院
原文链接:https://arxiv.org/abs/2408.05981
代码链接:https://yaepiii.github.io/CAD-Mesher/
2. 摘要
大多数激光雷达里程计和SLAM系统以点云形式构建地图,这些地图在放大时会显得离散且稀疏,因此不适合直接用于导航。网格地图是一种密集且连续的地图格式,具有较低的内存消耗,能够用简单元素近似复杂结构,近年来吸引了大量研究者的关注。然而,大多数实现都是在静态环境假设下进行的。实际上,移动物体会导致重影现象,可能会降低网格划分的质量。为了解决这些问题,我们提出了一种适应动态环境的即插即用网格划分模块,该模块可以轻松集成到各种激光雷达里程计中,以普遍提高里程计的姿态估计精度。在我们的网格划分模块中,设计了一种新颖的两阶段粗到细动态移除方法,以有效过滤动态物体,生成一致、准确且密集的网格地图。据我们所知,这是第一个具有显式动态移除功能的网格构建方法。此外,为了有利于网格构建中的高斯过程,我们采用了基于滑动窗口的关键帧聚合和自适应降采样策略,以确保点云的均匀性。我们在五个公开可用的数据集上评估了定位和映射的准确性。定性和定量结果均表明,我们的方法相比最先进算法具有优越性。代码和介绍视频可在https://yaepiii.github.io/CAD-Mesher/上公开获取。
3. 效果展示
4. 主要贡献
我们的主要贡献总结如下:
• 一种适应动态环境的准确、密集且连续的网格划分模块,具有即插即用特性,便于与各种激光雷达里程计集成,以进一步提高姿态估计精度。
• 一种两阶段粗到细动态移除方法,以减轻动态物体的影响。
推荐学习:
当SLAM遇上3DGS!基于3D高斯的全新SLAM算法
• 自适应关键帧选择和降采样策略,以确保网格划分的质量和效率,即使对于稀疏通道激光雷达也是如此。
• 在五个公共数据集上进行了广泛的定位和映射评估,以证明我们方法的优越性和适用性。
5. 基本原理是啥?
图2展示了整体系统架构。作为SLAM中的映射模块,系统接收在时间k时位于激光雷达坐标系L中的原始点PLk,以及由里程计估计的从激光雷达坐标系L到全局坐标系O的姿态变换OTLk作为系统输入。通过提出的自适应选择机制丢弃的关键帧,在基于可见性的粗略动态去除后,会被添加到数据库中。滑动窗口内的关键帧随后被聚合并转换到世界坐标系W中,然后通过自适应降采样策略进行均匀采样以提高系统效率。利用连续性测试来去除异常值和噪声。剩余的点被划分为体素,然后进行基于GP的网格划分。在优化组件中,里程计估计的姿态被用作点到网格配准的先验信息,将当前扫描与全局地图对齐,并输出更精细的姿态。最后,在使用基于体素的概率方法进行精细动态去除后,当前网格被融合到全局网格地图中以供发布。
6. 实验结果
7. 总结
在本文中,我们提出了一个即插即用的网格划分模块,该模块可以轻松集成到各种激光雷达里程计系统中,以实现更准确的姿态估计,并构建一致、密集且清晰的地图。我们模块的核心组件包括基于滑动窗口的关键帧聚合和两阶段粗到细的动态移除方法,这些组件有助于高质量的网格重建。我们在多个公开可用的数据集上进行了实验,验证了该方法的有效性。
对更多实验结果和文章细节感兴趣的读者,可以阅读一下论文原文~
本文仅做学术分享,如有侵权,请联系删文。
3D视觉交流群,成立啦!
目前我们已经建立了3D视觉方向多个社群,包括
2D计算机视觉
、
最前沿
、
工业3D视觉
、
SLAM
、
自动驾驶
、
三维重建
、
无人机
等方向,细分群包括:
工业3D视觉
:相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。
SLAM
:视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。
自动驾驶:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。
三维重建
:3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等
无人机
:四旋翼建模、无人机飞控等
2D计算机视觉
:图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等
最前沿
:具身智能、大模型、Mamba、扩散模型等
除了这些,还有
求职
、
硬件选型
、
视觉产品落地、产品、行业新闻
等交流群
添加小助理: dddvision,备注:
研究方向+学校/公司+昵称
(如
3D点云+清华+小草莓
), 拉你入群。
▲长按扫码添加助理:cv3d008
「
3D视觉从入门到精通
」
知识星球
「3D视觉从入门到精通」知识星球
,已沉淀6年,星球内资料包括:
秘制视频课程近20门