专栏名称: 计算机视觉工坊
专注于计算机视觉、VSLAM、目标检测、语义分割、自动驾驶、深度学习、AI芯片、产品落地等技术干货及前沿paper分享。这是一个由多个大厂算法研究人员和知名高校博士创立的平台,我们坚持工坊精神,做最有价值的事~
目录
相关文章推荐
51好读  ›  专栏  ›  计算机视觉工坊

顶刊JFR|ROLO-SLAM:首个针对不平坦路面的车载Lidar SLAM系统

计算机视觉工坊  · 公众号  ·  · 2025-02-14 07:00

正文

请到「今天看啥」查看全文


来源: 深蓝AI

添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。

扫描下方二维码,加入 「3D视觉从入门到精通」知识星球 ( 点开有惊喜 ) ,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料: 近20门秘制视频课程 最新顶会论文 、计算机视觉书籍 优质3D视觉算法源码 等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!

摘要

基于激光雷达(LiDAR)的同步定位与地图构建(SLAM)被认为是在恶劣环境中提供定位指导的一种有效方法。然而,现成的基于激光雷达的SLAM方法在经过不平坦地形时,尤其是在垂直方向相关的部分,会出现显著的姿态估计漂移。这种缺陷通常会导致全局地图明显扭曲。在本文中,提出了一种基于激光雷达的SLAM方法,以提高地面车辆在恶劣地形中的姿态估计精度,该方法被称为旋转优化激光雷达仅(ROLO)SLAM。该方法利用前向位置预测粗略地消除连续扫描之间的位置差异,从而能够在前端分别且准确地确定位置和方向。

©️【深蓝AI】编译


论⽂题目: ROLO-SLAM: Rotation-Optimized LiDAR-Only SLAM in Uneven Terrain with Ground Vehicle
论文作者:Yinchuan Wang, Bin Ren, Xiang Zhang, Pengyu Wang, Chaoqun Wang, Rui Song, Yibin Li, Max Q.-H. Meng

论文地址:https://arxiv.org/abs/2501.02166

官方网站: https://github.com/sdwyc/rolo


此外,本文采用了一种并行化的空间体素化方法进行对应匹配。本文开发了一种球面对齐引导的旋转配准方法,在每个体素内估计车辆的旋转。通过结合几何对齐,本文将运动约束引入优化公式中,以增强激光雷达平移的快速有效估计。随后提取几个关键帧来构建子地图,并利用当前扫描与子地图之间的对齐进行精确的姿态估计。同时,建立了一个全局规模的因子图,以帮助减少累积误差。在各种场景中,进行了多种实验来评估本文的方法。结果表明, ROLO-SLAM在地面车辆的姿态估计方面表现出色,并且优于现有的最先进的激光雷达SLAM框架。




在自动驾驶中,精确定位是安全高效导航的基础,尤其在不平坦地形上,车辆运动受波动影响,增加了定位难度。基于激光雷达的SLAM技术通过点云配准提供环境地图和自我定位,适用于复杂环境。该方法分为前端里程计和后端地图优化,前者提供初始姿态估计,后者细化姿态并重建环境。然而,在不平坦地形中,激光雷达SLAM易出现定位漂移,导致地图扭曲。


为解决此问题,本文提出ROLO-SLAM框架,旨在减少垂直方向的姿态漂移,提高不平坦地形中的姿态估计精度。 总的来说,本文的主要贡献在于以下几个方面:


  • 本文利用前向位置预测实现了旋转估计和平移估计之间的软解耦,这允许本文独立估计旋转和平移。


  • 在前端,本文提出了一个双阶段范式,用于使用球面对齐和连续时间优化进行旋转和平移估计。它旨在为后端优化提供精确的初始姿态。


  • 通过整合扫描到子地图对齐和全局因子图优化,建立了一个紧凑的激光雷达SLAM框架,这有助于在不平坦地形中定位地面车辆。


实验结果表明,ROLO-SLAM在不平坦地形中表现出色,优于现有方法。图1展示了示例结果和真实场景快照,源代码和视频演示也已提供。

▲图1|上图显示了一辆真实车辆在越野场景中的移动。下图显示了由ROLO-SLAM输出的点云地图和轨迹。©️【深蓝AI】编译




▲图2| 本文的ROLO-SLAM系统的流程管道包含了前端激光雷达里程计模块和后端建图模块。©️【深蓝AI】编译


■ 前向位置预测


在前端,本文将连续扫描的旋转和平移估计解耦。 这是通过前向位置预测消除平移差异来实现的。图4显示了车辆在xoz平面上同一扫描间隔期间的快照。给定第 次激光雷达扫描和相应的机器人速度 ,前一次扫描对应的机器人速度表示为 。由于时间间隔足够小,可以预期在两次连续扫描之间,使用现成的速度控制技术,即 ,会有一致的线速度。两次扫描之间的平移距离可以认为是相同的,即 。将车辆在经过k次激光雷达扫描后的位置表示为

本文可以通过以下方式估计车辆位置


其中
表示第i次扫描的时间戳。 当扫描 到达时,使用方程预先估计车辆在时间 的位置,以形成粗略约束。对于车辆的旋转,车辆的俯仰角 受到地面的约束,这比平移更容易受到地面起伏的影响。在实际应用中,地面的起伏通常是未知和非线性的;因此,在车辆移动过程中面对不平坦地形时,俯仰角变化很难保持相同的值。同样的事情也适用于横滚角的分析。因此,本文不以平移估计的方式来估计旋转。

传统配准方法常常将旋转和平移估计交织在一起,从而模糊了各自相关的独特挑战,可能导致车辆姿态和位置的潜在不准确性。通过引入前向位置预测,本文建立了连续激光雷达扫描之间的粗略平移估计。这在前端解耦了平移和旋转估计,建立了扫描位置的一致基线,并有望提高车辆旋转估计的准确性。

■ 体素化匹配和旋转配准


准确识别扫描间的点对点对应关系是具有挑战性的。 为了解决这个问题,本文首先提出使用高斯体素图。高斯体素图是在
的坐标系中按照算法1中描述的方式构建的。


基于体素化,本文避免了直接考虑点对点对应关系。 相反,本文寻找由源点 和目标体素 组成的对 。基于前向位置预测,本文获得了平移信息。


然后,本文将两个连续扫描的传感器中心对齐到同一原点并开始匹配,这在算法2中描述。本文首先按照算法1为 建立体素图 。然后,按照算法2的第4行计算每个源点 对应于 的索引。如算法2的第5-7行所示。请注意, 中包含的点不足的体素不符合与任何源点匹配的条件。 是预设的最少点数阈值。这确保了只有能够充分表示局部几何的体素才被考虑用于建立对应关系。

▲图3| 旋转对齐模型。绿色点是点集Ps中的源点,而蓝色椭球表示mk中的高斯分布。紫色箭头代表可能的旋转方向。©️【深蓝AI】编译

现在获得了源点 和目标体素之间的对应关系。然后,通过尝试将 中的点与存储在体素中的相关高斯分布的均值位置 对齐,获得 之间的旋转。旋转对齐模型由图5演示。通过前向位置预测,两个连续扫描的传感器中心被定位在同一个原点。旋转点云可以被概念化为每个点沿着球形表面滑动,激光雷达位于中心,点到点的距离作为半径。各种源点 沿着球面滑动以对齐存储在体素 中的高斯分布的均值位置 这个对齐过程估计了旋转。为此,整个旋转对齐表示为

▲图4| 旋转对齐的示例。蓝色平面表示均值位置的高斯分布的投影。©️【深蓝AI】编译

为了概念性地说明这种转换,图4展示了将源点 与相关高斯分布的均值 对齐的一个示例。这里, 表示 通过旋转的源点,而 表示 在与 相交的球面切平面上的投影:


本文构建这个高斯噪声的协方差矩阵为
其中 分别是 的噪声协方差矩阵。然后本文对 执行奇异值分解(SVD),协方差被重构为

是特征值的最大值,鉴 量化了 在球面上的径向距离,本文的主要关注点是径向距离的差异。相反 之间的轴向距离对于旋转配准不太相关。因此,SVD被用来正则化协方差,消除轴向距离的影响。这种正则化可以被解释为高斯过程的降维,其中数据从一个3D椭球流形映射到一个2D椭圆流形,如图5所示。

▲图5| 旋转对齐的示例。蓝色平面表示均值位置的高斯分布的投影。©️【深蓝AI】编译


因此,旋转 可以通过以下方式计算:

该方程可以通过包括高斯-牛顿(GN)和Levenberg-Marquardt(LM)在内的优化算法迭代求解。

■ 基于连续时间的平移优化


到目前为止,本文已经获得了旋转矩阵 和一个粗略的平移估计 为了进一步优化平移,本文设计了一个目标函数,该函数结合了基于连续时间的平移约束。这个约束是从车辆在两个连续激光雷达扫描之间连续均匀运动模型中得出的:


其中目标函数包含两个部分: ,它基于点到分布的距离解决几何对齐问题。 表示基于连续时间的平移约束。给定一个对应关系

用于实现传感器数据的几何对齐,而 确保车辆尽可能保持连续和均匀的运动。最终的平移变换 的组合,计算如下:

■ 后端建图与回环闭合


后端优化前端的变换输出,促进生成高质量的全局位姿和环境地图。 后端包括两个主要模块:局部扫描到子地图对齐和全局位姿优化。在局部层面,扫描到子地图对齐采用精确配准方法将最新扫描与累积的局部子地图对齐,从而实现更精确的激光雷达里程计。在全球层面,因子图从累积的关键帧中递增构建,调整每个历史关键帧的位姿以最小化整体历史误差。
扫描到子地图的优化。 首先,扫描到子地图对齐用于进一步优化地面车辆的位姿估计。全局点云地图由历史关键帧构建,每个关键帧由边缘特征 和平面特征 组成,表示为为了减少内存开销,关键帧以预定义的时间间隔定期选择。在滑动时间窗口内选择预定义数量的关键帧来构建子地图表示为:


扫描到子地图对齐被转化为一个优化问题,可以表示为


全局优化和回环闭合。 ROLO-SLAM利用因子图(FG)模型来解决MAP问题。整个FG由具有不同因子的节点和边组成。每个节点存储那一刻的状态,本文将状态定义为世界坐标系中车辆的姿态,即 此外,本文定义了两个因子:里程计因子和回环闭合因子。因子图的整体结构如图8所示。里程计因子约束相邻状态之间的变换,类似于马尔可夫链。相邻节点的变换由扫描到子地图对齐给出。这个因子通过扫描到子地图对齐估计的状态拒绝异常值,并平滑运动轨迹。回环闭合因子用于解决长期和大规模场景中累积的误差。为了构建这个因子,本文建立了一个以当前状态 为中心的稳定搜索窗口。在窗口中有状态和关键帧,表示为 。在车辆移动过程中,一个检查线程不断执行以评估每个 和当前关键帧之间的相似性。在识别出显著的相似性后,采用特征配准来确定变换 然后,建立回环闭合元组


这些回环闭合元组被转化为FG中的回环闭合因子,在不同时间实例引入的节点之间建立约束。通过使用FG进行全局姿态优化,细化车辆的姿态,使所有节点能够自适应调整以最小化全局差异,有效消除累积误差。




■ 平台和实验设置


为了评估ROLO-SLAM,本文进行了实验,关注姿态估计精度、鲁棒性、计算效率和建图。使用了公共和自建数据集。


KITTI里程计数据集用于评估水平定位精度,包含城市、乡村和高速公路场景的多模态数据。


真实越野场景数据集收集于校园周围山地,包含多种地形,适合评估6D姿态估计。


山东大学校园场景数据集涵盖变化地形,用于评估整体性能。这个数据集被用来评估所开发方法的整体性能。为了在户外环境中收集信息,这些车辆配备了相同的感知平台。感知平台有多个传感器,包括一个VLP-32C Puck 3D激光雷达、一个ZED2i立体相机、一个GW-GNS100 GNSS系统和一个Mti-300 9轴IMU。


ROLO-SLAM与LOAM、LeGO-LOAM、CT-ICP和HDL-SLAM等方法比较,展示其性能。实验在ROS Noetic和Ubuntu 20.04上进行,所有算法在联想Y9000P笔记本上执行。


■ 定位精度评估


本文通过与不同方法的比较来评估ROLO-SLAM的定位精度。 在KITTI里程计数据集(序列00、05和08)中,ROLO的轨迹紧密贴合地面实况(GT),尤其在图6(c)中几乎完全重叠。LOAM和CT-ICP也表现出高相似度,但在特征稀疏或表面几何急剧变化的情况下,其他方法如LeGO-LOAM和HDL-SLAM则显示出明显的轨迹误差。相比之下,ROLO与GT的对齐度最高,尤其是在水平方向上表现出色。


▲图6| ROLO和其他里程计框架对KITTI里程计数据集序列00、05和08的轨迹估计。©️【深蓝AI】编译


▲图7| 旋转对齐的示例。蓝色平面表示均值位置的高斯分布的投影。©️【深蓝AI】编译


为了评估垂直方向上的定位效果,本文在Offroad1、Offroad2和Offroad3数据集上进行了测试。结果显示,ROLO的3D轨迹与GT高度相似,特别是在图7(b)中。此外,ROLO的高程曲线与GT紧密吻合。这些结果表明,ROLO在越野场景中保持了高稳定性和瞬时精度,得益于前端独立估计旋转和平移的能力。


▲图8| 本文的方法和替代方法对山东大学校园数据集(千佛山校区、兴隆山校区)的轨迹估计。©️【深蓝AI】编译


进一步使用SDU校园数据集验证姿态估计性能,结果如图8所示。ROLO的轨迹和高程曲线基本与GT重叠,证明了其在6自由度姿态估计中的优势。表1显示,ROLO在SDU和越野数据集中具有最低的RMSE,而在KITTI数据集中,LOAM和LeGO-LOAM由于丰富的环境特征也表现良好。


▲表1| 各种方法与真值的RMSE。©️【深蓝AI】编译


为了展示前端配准方法的优势,本文将ROLO与传统点云配准方法(如ICP、NDT和PTP ICP)进行了比较。定量结果表明,ROLO在SDU和越野数据集中具有极小的RMSE,尽管在某些数据集中未能取得最佳表现。


■ 鲁棒性评估


定位鲁棒性反映了复杂场景中维持自定位稳定性的能力。 本文利用两个帧间变换的绝对误差 来测量定位鲁棒性。为了与其它方法比较鲁棒性,本文在SDU校园数据集中收集 的值。表2显示,ROLO的标准差最小,保证了连续扫描的估计稳定性,且均值最小,证明了其在执行过程中的精确性。相比之下,LOAM和HDL-SLAM的均值和标准差较高,在鲁棒性方面表现不佳。

▲表2| 针对山东大学校园数据集的帧间绝对误差(平均值/标准差)。©️【深蓝AI】编译


■ 计算效率评估


图9显示了所有数据集中每次扫描的平均处理时间,每列分别堆叠了前端和后端的处理时间。误差条代表总处理时间的变化范围。结果表明, 尽管ROLO的前端被划分为三个连续模块,但它仍保持快速处理速度。 总处理时间约为每次扫描100毫秒,满足机器人应用的实时要求。LeGO-LOAM的前端处理时间最短,但在定位精度方面表现不佳。此 外,CT-ICP和HDL-SLAM的误差条较长,这意味着它们的处理效率不可靠。ROLO比CT-ICP和HDL-SLAM快至少10%,这证明了所开发方法的效率。

▲图9|各方法每次扫描的总处理时间。请注意,CT-ICP只有前端的处理时间。©️【深蓝AI】编译


■ 建图结果


为了展示在不平坦地形场景中建图的性能,本文使用千佛山数据集比较了HDL-SLAM、LeGO-LOAM和ROLO的建图性能。 结果如图10(b)-(d)所示。在全球尺度上,本文方法生成的点云地图与卫星地图中的场景轮廓高度一致。相比之下,图10(b)-(c)顶部的HDL-SLAM和LeGO-LOAM的结果出现了明显的形态失真,尤其是在建筑物的轮廓上。在图10(d)的侧视图中,ROLO展示了一个相对平坦的建图平面,考虑到本文校园的平坦地面。然而,其他方法的侧视图显示了显著的倾斜,HDL-LOAM甚至在图10(b)中显示了重叠。这些现象反映了SLAM任务中显著的垂直漂移。相比之下,ROLO在减轻垂直漂移问题方面表现更好。


▲图10|HDL-LOAM、LeGO-LOAM和ROLO在千佛山数据集中的建图结果。在(b)-(d)中,上方的图显示了整体地图,而下方的图是从侧视角度捕捉的。©️【深蓝AI】编译




本文提出了ROLO-SLAM,以在不平坦地形中获得精确的姿态估计和环境地图。为了减轻地面车辆行驶过程中的垂直漂移,本文基于前向位置预测的粗略平移,独立估计旋转和平移。在后端,本文利用扫描到子地图和因子图来提高最终姿态估计的准确性。实验结果表明,本文的方法与最先进的方法相比表现更为出色。此外,还在不同场景中进行了建图评估,以验证ROLO-SLAM的建图质量。建图结果显示,本文的方法能够在城市和越野场景中生成高度精确的点云地图。与最先进的方法相比,本文方法输出的点云地图与真实场景的相似度最高。这也反映了本文的方法能够输出精确的姿态估计。


在未来的工作中,本文将研究在没有中心对齐条件的情况下旋转和平移的解耦,这减少了对前向位置预测的依赖。此外,本文将专注于由动态和瞬时地面波动引起的姿势变化。可能会将有限观测中提取的未来姿态预测等先验信息融合到框架中,以提高姿态估计的准确性。

Ref:
ROLO-SLAM: Rotation-Optimized LiDAR-Only SLAM in Uneven Terrain with Ground Vehicle

译|蒙牛二锅头

审核|apr

本文仅做学术分享,如有侵权,请联系删文。

3D视觉交流群,成立啦!

目前我们已经建立了3D视觉方向多个社群,包括 2D计算机视觉 最前沿 工业3D视觉 SLAM 自动驾驶 三维重建 无人机 等方向,细分群包括:

工业3D视觉 :相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM :视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

自动驾驶 :深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

三维重建 :3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

无人机 :四旋翼建模、无人机飞控等

2D计算机视觉 :图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

最前沿 :具身智能、大模型、Mamba、扩散模型、图像/视频生成等

除了这些,还有 求职 硬件选型 视觉产品落地、产品、行业新闻 等交流群

添加小助理: cv3d001,备注: 研究方向+学校/公司+昵称 (如 3D点云+清华+小草莓 ), 拉你入群。

▲长按扫码添加助理:cv3d001

3D视觉工坊知识星球

「3D视觉从入门到精通」知识星球 ( 点开有惊喜 ) ,已沉淀6年,星球内资料包括: 秘制视频课程近20门 (包括 结构光三维重建、相机标定、SLAM、深度估计、3D目标检测、3DGS顶会带读课程、三维点云 等)、 项目对接 3D视觉学习路线总结 最新顶会论文&代码 3D视觉行业最新模组 3D视觉优质源码汇总 书籍推荐 编程基础&学习工具 实战项目&作业 求职招聘&面经&面试题 等等。欢迎加入3D视觉从入门到精通知识星球,一起学习进步。

▲长按扫码加入星球
3D视觉工坊官网: www.3dcver.com

大模型、扩散模型、具身智能、3DGS、NeRF 结构光、相位偏折术、机械臂抓取、点云实战、Open3D、缺陷检测 BEV感知、Occupancy、Transformer、模型部署、3D目标检测、深度估计、多传感器标定、规划与控制 无人机仿真 C++、三维视觉python、dToF、相机标定、ROS2 机器人控制规划、LeGo-LAOM、多模态融合SLAM、LOAM-SLAM、室内室外SLAM、VINS-Fusion、ORB-SLAM3、MVSNet三维重建、colmap 、线面结构光、硬件结构光扫描仪等。

长按扫码学习3D视觉精品课程

3D视觉模组选型:www.3dcver.com

点这里 👇 关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

3D视觉科技前沿进展日日相见 ~







请到「今天看啥」查看全文