0. 论文信息
标题:The Oxford Spires Dataset: Benchmarking Large-Scale LiDAR-Visual Localisation, Reconstruction and Radiance Field Methods
作者:Yifu Tao, Miguel Ángel Muñoz-Bañón, Lintong Zhang, Jiahao Wang, Lanke Frank Tarimo Fu, Maurice Fallon
机构:Univ. of Oxford、University of Alicante
原文链接:https://arxiv.org/abs/2411.10546
官方主页:https://dynamic.robots.ox.ac.uk/datasets/oxford-spires/
1. 导读
本文介绍了使用定制的多传感器感知单元以及来自地面激光雷达扫描仪(TLS)的毫米精度地图在牛津知名地标及其周围捕获的大规模多模态数据集。感知单元包括三个同步的全球快门彩色相机,一个汽车3D激光雷达扫描仪和一个惯性传感器-所有这些都经过精确校准。我们还为涉及定位、重建和新视图合成的任务建立了基准,从而能够评估同步定位和映射(SLAM)方法、运动结构(SfM)和多视图立体(MVS)方法以及辐射场方法,如神经辐射场(NeRF)和3D高斯分布。为了评估3D重建,TLS 3D模型被用作地面实况。通过将移动激光雷达扫描与TLS 3D模型配准来计算定位地面实况。辐射场方法不仅使用从输入轨迹采样的姿态进行评估,还使用来自远离训练姿态的轨迹的视点进行评估。我们的评估证明了最先进的辐射场方法的一个关键限制:我们表明它们倾向于过度适应训练姿态/图像,并且不能很好地推广到无序姿态。与使用相同视觉输入的MVS系统相比,它们在3D重建方面也表现不佳。我们的数据集和基准旨在促进辐射场方法和SLAM系统的更好集成。原始数据和经过处理的数据,以及用于分析和评估的软件。
2. Oxford Spires Dataset
我们介绍Oxford Spires数据集,使用定制的多传感器感知单元以及地面激光雷达扫描仪(TLS)的毫米精度地图在牛津的知名地标及其周围拍摄。感知单元包括三个全局快门彩色相机、一个汽车3D激光雷达扫描仪和一个惯性传感器,所有这些都经过精确校准。
3. 手持感知单元
我们的感知单元Frontier有三个摄像头、一个IMU和一个激光雷达。如下图所示。三个彩色鱼眼镜头面向前、左、右。激光雷达安装在摄像机的顶部。
校准:相机内部和相机IMU外部使用Kalibr校准。相机-激光雷达外参使用DiffCal进行校准。所有内部和外部传感器校准参数都可以在数据集中获得。上面显示了使用此校准的图像中的激光雷达叠加。
推荐课程:
国内首个面向具身智能方向的理论与实战课程
。
在下表中,我们显示了每个传感器的规格,而在下一个表中,我们显示了为每个传感器提供的ROS topic。
4. 数据集记录
上述前沿设备安装在背包中(如下图)。我们带着这个背包走过不同的地点,记录下位点和序列部分。
5. 真值
对于地面校准,我们使用了徕卡RTC360 TLS(下图,左)。它的最大射程为130米,视场为360 × 300。最终的3D点精度在10米处为1.9毫米,在40米处为5.3毫米。点云使用三个摄像头捕捉的432百万像素图像进行着色。
我们从不同的静态位置扫描数据集的站点(下图,右侧)。从每次扫描,我们获得了一个彩色的三维点云。
3D参考模型(TLS地图):我们为每个站点提供如前所述记录的单独扫描(上图,右)。此外,我们为每个站点提供了一个合并版本(1cm分辨率),其中扫描使用徕卡的Cyclone REGISTER 360 Plus软件进行注册。我们站点的平均云到云误差在3到7毫米之间。
轨迹GT:地面真实轨迹是通过ICP将每个边界的未失真激光雷达点云配准到之前描述的TLS地图来计算的。我们对新学院和Hilti-2022进行了类似的研究。地面真实轨迹的精度大约为1-2厘米。
推荐课程:
室内、室外激光SLAM关键算法、代码和实战剖析(cartographer+LOAM+ LIO-SAM)
。
6. Sites and Sequence
下表提供了不同站点记录的数据信息。我们提供了日期、记录的序列数以及每个站点所有序列的总长度。此外,我们还提供了站点是否包含室内部分的信息。
7. 文件夹结构
在下图中,我们展示了数据集的文件夹结构。来自上述传感器的数据位于raw文件夹中。除了原始数据,我们还提供了来自VILENS-SLAM的经过处理的数据,包括未失真的点云,以及包含经过处理的图像的COLMAP。轨迹文件夹包含TUM格式的轨迹。TLS图和轨迹的地面实况在图中用红色标出。
本文仅做学术分享,如有侵权,请联系删文。
3D视觉交流群,成立啦!
目前我们已经建立了3D视觉方向多个社群,包括
2D计算机视觉
、
最前沿
、
工业3D视觉
、
SLAM
、
自动驾驶
、
三维重建
、
无人机
等方向,细分群包括:
工业3D视觉
:相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。
SLAM
:视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。
自动驾驶:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。
三维重建
:3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等
无人机
:四旋翼建模、无人机飞控等
2D计算机视觉
:图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等
最前沿
:具身智能、大模型、Mamba、扩散模型、视频\图像生成等
除了这些,还有
求职
、
硬件选型
、
视觉产品落地、产品、行业新闻
等交流群
添加小助理: cv3d001,备注:
研究方向+学校/公司+昵称
(如
3D点云+清华+小草莓
), 拉你入群。
▲长按扫码添加助理:cv3d001
「
3D视觉从入门到精通
」
知识星球
「3D视觉从入门到精通」知识星球
,已沉淀6年,星球内资料包括:
秘制视频课程近20门