专栏名称: 点云PCL
公众号将会推送基于PCL库的点云处理,SLAM,三维视觉,高精地图相关的文章。公众号致力于理解三维世界相关内容的干货分享。不仅组织技术交流群,而且组建github组群,有兴趣的小伙伴们可以自由的分享。欢迎关注参与交流或分享。
目录
相关文章推荐
高分子科学前沿  ·  NUS江东林教授Angew:晶态多孔8字形节 ... ·  7 小时前  
量子位  ·  DeepSeek无问西东!先行者早已趟平全国产之路 ·  16 小时前  
AIbase基地  ·  AI日报:​DeepSeek上线国家超算互联 ... ·  2 天前  
AIbase基地  ·  AI日报:​DeepSeek上线国家超算互联 ... ·  2 天前  
高分子科学前沿  ·  南京大学李宪磊课题组招聘生物材料/纳米医学方 ... ·  3 天前  
高分子科学前沿  ·  西湖大学/浙江大学合作,最新Nature ... ·  3 天前  
51好读  ›  专栏  ›  点云PCL

3D LiDAR SLAM最新综述(2)

点云PCL  · 公众号  ·  · 2024-09-24 08:11

正文

文章:3D LiDAR SLAM : A survey

作者:Yongjun Zhang, Pengcheng Shi,Jiayuan Li

编辑:点云PCL


欢迎各位加入知识星球,获取PDF论文,欢迎转发朋友圈。 文章仅做学术分享,如有侵权联系删文。未经博主同意请勿擅自转载。

公众号致力于点云处理,SLAM,三维视觉,高精地图等领域相关内容的干货分享,欢迎各位加入,有兴趣的可联系[email protected] 未经作者允许请勿转载,欢迎各位同学积极分享和交流。

摘要


SLAM(同步定位与地图构建)是机器人技术和摄影测量领域中非常具有挑战性但又极为基础的问题,也是无人系统智能感知的前提条件。近年来3D LiDAR SLAM 技术取得了显著进展。然而,据我们所知,现有的大部分综述都集中于视觉SLAM方法。为弥补这一差距,本文提供了一篇综合性的综述,概括了3D LiDAR SLAM的科学内涵、关键难点、研究现状及未来发展趋势,旨在让读者更好地理解LiDAR SLAM技术,从而激发未来的研究。具体来说,本文总结了LiDAR SLAM主要步骤的内容及其特点,介绍了其面临的关键难题,并阐述了与现有综述的关系;概述了当前的研究热点,包括仅使用LiDAR的方法和多传感器融合方法,并列举了每类中的里程碑算法和开源工具;总结了常用的数据集、评估指标和代表性的商业SLAM解决方案,并给出了主流方法在公共数据集上的评估结果。

图1 现有LiDAR SLAM方法的分类体系。主流方法分为仅基于LiDAR的框架(基于特征、直接法和基于投影)和多传感器融合解决方案(LiDAR-惯性融合、LiDAR-视觉融合以及LiDAR-惯性-视觉融合)。

仅LiDAR的SLAM


基于特征的方法

LiDAR通过主动发射和接收激光信号生成3D点云,描绘现实世界的表面。然而,密集的点云往往包含冗余数据,影响计算效率。基于特征的系统旨在提取具有实际物理意义的代表性特征,并通过特征关联来估算车辆的运动。通常,基于特征的方法根据其特点分为基础特征和高级特征。表1总结了这些方法,图3和图4展示了各种代表性方法的工作流程和地图生成结果。

基于基础特征的SLAM

基础特征是指几何属性,如坐标、颜色、强度、曲率和法线。它们可以从单个或成组的点中推导出来,用以理解3D场景的基础结构。外观特征是一类基础特征,涵盖颜色、反射率和纹理,描述点云的视觉外观,有助于区分表面的材料。正如图3a和图4a所示,LOAM-Livox引入了一种专为视场(FOV)受限的LiDAR设计的SLAM系统,在标准LOAM的基础上带来了显著创新,包括基于反射率的点选择、迭代姿态优化以及并行化处理。Intensity-SLAM提出了一个基于强度辅助的框架,利用强度和几何数据进行里程计估计,结合了基于强度的闭环检测(LCD)和因子图优化,在不同环境中表现优于仅几何方法。另一类常见的特征是几何特征,包括坐标、距离、法线、曲率和密度,描述了点与其空间布局或几何相关的属性。

图3 四种典型的基于特征的方法。图 (a) 和图 (b) 分别来自于 Lin & Zhang (2020) 和 Li, Kong, Zhao, Li 等人 (2021) 的研究。

LOAM是一个开创性的LiDAR SLAM框架,使用曲率提取3D平面和边缘点,通过最小化点到线和点到平面的距离以及基于线性插值的运动补偿,实现高频里程计计算。它通过将累计的扫描与地图配准来优化姿态,实现低频地图生成和转换整合。此后,多个LOAM变体引入了闭环检测(LCD)、局部捆绑调整和非线性畸变补偿(BA)以增强系统的鲁棒性。其他变体已成功扩展到多机器人系统。另一研究分支则利用学习技术来检测兴趣点或匹配点。CAE-LO采用卷积自编码器(CAE)里程计来检测球形环数据中的兴趣点,并使用3D编码器从多分辨率体素模型中提取特征,确保了高效计算、保留了原始3D形状,展现出较高的通用性。DMLO则设计了一种稀疏匹配里程计框架,将点云投影到圆柱平面上,并通过级联卷积神经网络(CNN)提取栅格特征及对应点,并通过奇异值分解(SVD)求解刚性变换。

图4 基于特征的代表性方法的建图结果。

高级基于特征的SLAM

高级特征包括通过复杂处理技术提取的更广泛的属性,用于描述场景和对象级信息。第一种是语义特征,涉及基于内容或三维上下文对点进行有意义的解释。通过为点分配标签(例如汽车、道路、建筑物和树木)以表示点的类别,可以增强对三维环境中元素的理解。SA-LOAM(图3b)基于F-LOAM(图4b)引入了语义增强的SLAM,采用了语义辅助ICP和基于语义图的LCD。利用语义特征提高了定位的准确性,增强了LCD并确保即使在广阔环境中也能保持全局地图的一致性。其他研究利用语义分割技术为局部形状描述、里程计估计(图4c)和优化提供了宝贵的见解。

形状特征是另一种重要的高级特征,用于描述和解释表面的整体形状和结构,便于分析三维环境中的形状相关方面。Bosse 和 Zlot将基于3D网格的局部几何和车辆运动约束整合到点匹配中,为全面的3D SLAM奠定了基础,并消除了对里程计或惯性传感器的需求。Velas 等人通过随机生成的领边线段(CLS)形成线云表示,并估算匹配线段与三维平面对齐的变换,从而解决了LiDAR点云稀疏性的问题。Grant 等人采用了一种高效的平面检测器,用于稳定的特征提取,既能用于定位,也能作为基于图的SLAM地标。该方法适应不平滑的轨迹,使其适用于类人机器人和空中机器人,而无需里程计测量。如图4d所示,MULLS利用双阈值地面过滤和PCA提取地面、立面、柱子和梁特征。它通过优化的点对点(平面、线)误差度量估算自运动,并采用分层位姿图优化来减轻因航位推算引起的漂移。

直接法

与基于特征的方法不同,直接LiDAR SLAM作用于整个点云,消除了特征提取的需要,并利用直接匹配进行位姿计算。此特点使其非常适合无特征环境,并且提供更高的精度和分辨率地图。基于匹配过程,直接SLAM方法通常包括两种主要的匹配过程:扫描到扫描(scan-to-scan)和扫描到模型(scan-to-model)。表2提供了方法分类,而图5和图6展示了几种典型的直接方法。

扫描到扫描匹配

扫描到扫描的方法通常使用点云匹配来计算两个连续点云之间的相对位姿,逐步构建点云地图。一种常见方法是使用ICP来确定两点云之间的相对位姿。ICP是一种成熟的点云配准算法,通过识别最近的对应点迭代优化变换参数,ICP广泛应用于机器人、3D重建和地理信息系统(GIS)。SLAM6D率先将ICP应用于连续扫描配准,并在图中使用距离标准来检测闭环,该方法有效缓解了顺序匹配方法中的误差累积问题,原始ICP在实现精确点云对齐和生成密集地图方面表现出色,使其适用于精确定位和建图。然而它严重依赖初始位姿,并且在高速或遮挡场景中表现不佳。后续研究引入了ICP的变体,如广义ICP(GICP)、基于KL散度的ICP(图6a),以及体素化广义ICP(VGICP)。

图 5 三种典型的直接法。图 (a–c) 分别来源于 Koide 等人 (2021a)、Li 等人 (2019) 和 Quenzel & Behnke (2021) 的研究。

受深度学习在视觉里程计中成功的启发,研究人员将这项技术扩展到LiDAR里程计中,网络以两个实时点云作为输入,预测里程计的位姿。如图5(b)所示,LO-Net引入了一种扫描到扫描的LiDAR里程计网络,通过一种新颖的基于掩码加权的几何约束损失改善特征表示,它隐式处理了连续依赖关系和数据动态。此外它包含了一个扫描到地图的模块,通过结合几何和语义信息提高了精度。DeepVCP提出了一种端到端的点云配准框架,该方法通过学习匹配概率在候选组之间生成对应点,提升了配准精度,并有效减少了动态物体的干扰。HPPLO-Net(图6b)是一种无监督的层次化框架,适用于大规模动态户外场景。它使用基于场景流信息的可微分点对平面求解器实现精确的位姿估计,并使用可微分加权点对平面SVD来解决位姿矩阵和纠正数据关联误差。基于学习的里程计在识别LiDAR数据中的复杂模式方面表现出色,从而提高了精度。然而,它缺乏透明度和可解释性,导致难以理解模型的决策过程,并在与训练数据分布显著不同的场景中难以泛化。

图 6 代表性直接法的建图结果

扫描到模型的匹配

扫描到模型的方法将获取的扫描与在线子地图或预先存在的地图对齐,模型相比稀疏的单个扫描提供了更丰富的表面信息,但显著的量化差异给匹配过程带来了挑战,常见的模型是点云地图,直接由累积的3D点构建,存储空间坐标、颜色、强度或其他属性,适合精确建模。Cartographer采用分支定界法进行扫描到子地图匹配作为闭环约束,支持实时绘制广阔区域的地图,甚至可达数万平方米,并为操作员提供优化的结果。HDL-Graph-SLAM使用图SLAM构建离线地图,并结合NDT与基于角速度的位姿预测,通过无迹卡尔曼滤波器(UKF)进行跟踪,促进长期和广域行为评估。CT-ICP通过解决扫描到地图的配准,将扫描间的连续性和不连续性结合起来,在配准过程中实现弹性扫描变形,提高了精度并增强了应对高频运动的鲁棒性。如图6c所示,KISS-ICP结合点对点ICP、自适应阈值、鲁棒核、通用运动补偿和点云下采样,创建了一个兼容多种传感器类型的低参数系统。

表面元素(surfel)地图是另一种广受欢迎的模型,每个surfel编码有关环境表面片段的信息,包括位置、半径、方向、时间戳和颜色或反射率等属性。相比存储原始3D点,surfels提供了一种更高效的空间替代方案,尽管计算需求更高。它们通过减少噪声和不确定性提高了地图精度,从而增强了定位精度。Elastic LiDAR fusion通过线性连续时间轨迹消除了全局轨迹优化的需求,引入了地图变形,并通过概率surfels融合提高了重建的密集地图精度。Droeschel & Behnke通过surfel配准聚合了局部多分辨率地图,形成了层次化图结构,将单个3D扫描视为子图。该方法采用图优化处理漂移和错位问题,同时支持在扫描位姿之间进行测量插值。SuMa(图5c)利用帧对模型ICP对顶点地图之间的点进行对齐,并构建了基于surfel的地图。它利用地图表示创建虚拟地图视图,即使在重叠有限的情况下也增强了检测的鲁棒性。SuMa++进一步结合语义信息来促进映射过程。图6d所示的MARS(Multi-adaptive-resolution-surfel)集成了连续时间B样条轨迹表示与高斯混合模型(GMM),协同对齐多分辨率surfel地图。利用稀疏体素网格和高效网格确保了地图surfels的快速访问,而自适应分辨率选择方案显著提高了配准速度。

其他工作致力于创建创新地图以提高定位和映射精度。IMLS-SLAM选择隐式移动最小二乘曲面作为地图表示。Vizzo等采用帧对网格ICP,将地图表示为滑动窗口中的Poisson曲面重建三角网格。与传统方法使用截断符号距离函数(TSDF)或surfels相比,它提供了更精细的几何细节的3D地图。

基于投影的方法

基于投影的方法通常将点云转换为图像,并采用视觉里程计技术来估计传感器的自我运动。这类方法的主要优势在于二维表示(如图像或网格),简化了数据处理,降低了计算需求,并利用了成熟的图像处理技术。然而,投影过程不可避免地会导致信息丢失,可能因扭曲或省略细微的环境细节而影响地图精度。正如表3所总结的那样,基于投影的系统根据所选的投影方法分为球形和圆柱形两类。图7和图8展示了相应的两种投影方法。

圆柱投影方法

圆柱投影方法通过将三维点投影到二维图像上,并使用视觉里程计技术估计传感器的自我运动。3D Laser VO引入了一种基于3D LiDAR的视觉里程计系统,生成强度图像,跟踪稀疏视觉特征,并使用高斯过程-高斯牛顿方法进行连续时间状态估计,从而减少运动失真。CNN-LO使用图像分类的技术减少LiDAR扫描的状态空间,并通过全连接层从提取的特征中学习里程计估计。DeepPCO采用端到端的深度并行神经网络,通过结合2D全景深度投影和多个子网络,实现了高精度的里程计估计,并有效消除传统的扫描匹配和几何估计模块。SLO通过强度图像上的特征选择方法,并采用自监督的在线微调过程,进一步提升特征提取网络的性能。TransLO则设计了首个基于Transformer的LiDAR里程计,能够处理大量点云数据,并通过将点投影到二维表面来实现高效处理。

图 7 两种典型的基于投影的方法。图 (a) 和 (b) 分别来源于 Liu 等人 (2023) 和 Zheng & Zhu (2021) 的研究。

球面投影方法

球面投影方法通过将点云映射到二维球面上,以获得全360度的视野。此类方法特别适合需要全方位视角的应用。Velodyne SLAM是专为Velodyne激光扫描仪设计的系统,侧重于平面测量,并通过离线过滤步骤来优化生成的地图,适用于城市精细测绘。Cho等提出了基于无监督学习的里程计技术,使用几何感知的一致性损失计算,避免了繁琐的标注过程。ELO通过利用非地面的球形距离图像和鸟瞰图,将里程计问题表述为非线性最小二乘优化问题,并通过自适应技术鲁棒地估计局部表面法线。ECTLO则进一步发展了一种适用于固态LiDAR的高效里程计方法,通过点对平面的高斯混合模型进行配准,利用连续时间运动模型减少失真,并在距离图像中存储所有地图点,实现并行的隐式数据关联。这两种方法各自有优点,圆柱投影更注重特征提取和稀疏匹配,适合使用现有的图像处理技术,而球面投影则侧重于全方位视角和几何一致性,适合大范围环境的精确测绘。

图 8 代表性基于特征的方法的建图结果。

总结


LiDAR专用SLAM系统被分为三大类:基于特征的方法、直接方法和投影方法,并根据它们的共同特点进一步细分为更多子类。总结了以下几点关键观察:

与视觉传感器不同,LiDAR传感器不受光照变化和纹理依赖的影响,并能提供精确的深度数据。LiDAR专用的里程计因其可靠性仍然是首选。诸如LOAM和LeGO-LOAM等突破性里程计框架的出现,推动了单传感器定位与建图的发展,促进了机器人和自动驾驶在民用、商业、教育和军事领域的广泛应用。这一进展为机器人领域注入了活力,推动了经济高效、具备强大韧性的机器人解决方案的创新。

基于特征的SLAM框架由成熟的模块组成,当前为主流解决方案,并为多传感器融合奠定了坚实基础。然而,随着传感器和硬件的快速演进,这些系统的维护和更新面临挑战,需要持续的算法改进。3D计算机视觉的快速发展推动了基于学习的里程计框架的发展,这些框架主要侧重于特征提取和匹配,而非提供完整的解决方案。尽管取得了显著成果,但提升其泛化能力和降低其高计算需求仍然是优先任务。

选择合适的LiDAR SLAM方法应根据具体需求,考虑环境、传感器、地图构建、内存和平台等因素。基于特征的方法在结构化环境中表现出色,因其优先追踪显著特征,适合在具有地标、行人和车辆的城市环境中应用,并且具有内存效率。然而,它们对特征的依赖使其在特征稀缺、无特征和动态环境中效果不佳。直接方法保留了点云数据中的完整3D信息,适合精确建图,但计算密集型。相比之下,投影方法将点云转换为图像,提升了效率,尤其在资源有限的平台上。然而,投影过程会导致信息丢失,传感器的倾斜也可能使投影变形,从而影响地图质量。

资源

自动驾驶及定位相关分享

【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法

自动驾驶中基于光流的运动物体检测

基于语义分割的相机外参标定

综述:用于自动驾驶的全景鱼眼相机的理论模型和感知介绍

高速场景下自动驾驶车辆定位方法综述

Patchwork++:基于点云的快速、稳健的地面分割方法

PaGO-LOAM:基于地面优化的激光雷达里程计

多模态路沿检测与滤波方法

多个激光雷达同时校准、定位和建图的框架

动态的城市环境中杆状物的提取建图与长期定位

非重复型扫描激光雷达的运动畸变矫正

快速紧耦合的稀疏直接雷达-惯性-视觉里程计

基于相机和低分辨率激光雷达的三维车辆检测

用于三维点云语义分割的标注工具和城市数据集

ROS2入门之基本介绍

固态激光雷达和相机系统的自动标定

激光雷达+GPS+IMU+轮速计的传感器融合定位方案







请到「今天看啥」查看全文