专栏名称: 3DCV
关注工业3D视觉、SLAM、自动驾驶技术,更专注3D视觉产业的信息传播和产品价值的创造,深度聚焦于3D视觉传感器、SLAM产品,使行业产品快速连接消费者。
目录
相关文章推荐
CINNO  ·  南开大学攻克纯红光钙钛矿 LED ... ·  3 天前  
湖北省广播电视局  ·  数码产品国补“满月” 超2671万名消费者参与 ·  2 天前  
CINNO  ·  挑战 IMAX 规模!史上最大 767 ... ·  6 天前  
51好读  ›  专栏  ›  3DCV

总结一下顶会开源好用的双目SLAM框架!

3DCV  · 公众号  ·  · 2024-10-06 00:00

正文

点击下方 卡片 ,关注 「3D视觉工坊」 公众号
选择 星标 ,干货第一时间送达

来源:3D视觉工坊

添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。

扫描下方二维码,加入「 3D视觉从入门到精通 」知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料: 近20门秘制视频课程 最新顶会论文 、计算机视觉书籍 优质3D视觉算法源码 等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!

3D视觉工坊为您网罗最新的行业动态、学术论文、科研成果、产品发布、新闻政策!

1. ORB-SLAM3:用于视觉、视觉惯性和多地图SLAM的精确开源库

标题:ORB-SLAM3: An Accurate Open-Source Library for Visual, Visual-Inertial and Multi-Map SLAM

作者:Carlos Campos, Richard Elvira, Juan J. Gómez Rodríguez, José M. M. Montiel, Juan D. Tardós

原文链接:https://arxiv.org/abs/2007.11898

代码链接:https://github.com/UZ-SLAMLab/ORB_SLAM3

摘要:本文介绍了ORB-SLAM3,这是第一个能够使用针孔和鱼眼镜头模型,通过单目、立体和RGB-D相机执行视觉、视觉惯性和多地图SLAM的系统。第一个主要创新是基于特征的紧密集成视觉惯性SLAM系统,该系统完全依赖于最大后验概率(MAP)估计,即使在IMU初始化阶段也是如此。其结果是,该系统能够在小型和大型室内和室外环境中实时稳健地运行,并且比以前的方法精确2到5倍。第二个主要的创新是一个多重地图系统,它依赖于一个新的地点识别方法,提高了召回率。多亏了它,ORB-SLAM3能够在长时间的视觉信息不佳的情况下生存下来:当它迷路时,它会启动一个新的地图,当重新访问已映射的区域时,它会与以前的地图无缝合并。与仅使用最后几秒钟信息的视觉里程计系统相比,ORB-SLAM3是第一个能够在所有算法阶段重复使用所有先前信息的系统。这允许在束调整中包括共同可见的关键帧,即使它们在时间上相隔很远或者它们来自先前的映射会话,也可以提供高视差观察来提高精度。我们的实验表明,在所有传感器配置中,ORB-SLAM3与文献中可用的最佳系统一样健壮,并且明显更精确。值得注意的是,我们的立体惯性SLAM在EuRoC无人机上实现了3.6厘米的平均精度,在TUM-VI数据集(代表AR/VR场景的设置)的房间中,在快速手持运动下实现了9毫米的平均精度。为了社区的利益,我们公开源代码。

2. 单目视觉惯性系统的在线时间校准

标题:Online Temporal Calibration for Monocular Visual-Inertial Systems

作者:Tong Qin, Shaojie Shen

机构:香港科技大学

原文链接:https://ieeexplore.ieee.org/abstract/document/8593603

代码链接:https://github.com/HKUST-Aerial-Robotics/VINS-Fusion

摘要:精确的状态估计是各种智能应用的基本模块,例如机器人导航、自动驾驶、虚拟和增强现实。视觉与惯性融合是近年来流行的六自由度状态估计技术。记录不同传感器测量值的时刻对于系统的稳定性和准确性至关重要。在实践中,每个传感器的时间戳通常遭受触发和传输延迟,导致不同传感器之间的时间不对准(时间偏移)。这种时间偏移极大地影响了传感器融合的性能。为此,我们提出了一种用于校准视觉和惯性测量之间的时间偏移的在线方法。我们的方法通过联合优化SLAM系统中的时间偏移、相机和IMU状态以及特征位置来实现时间偏移校准。此外,该方法是一个通用模型,可以很容易地在几个基于特征的优化框架中使用。仿真和实验结果表明,与其他离线工具相比,我们的校准方法具有较高的精度。与其他方法的VIO比较证明,在线时间校准对视觉惯性系统非常有益。时间校准的源代码被集成到我们的公共项目VINS-Mono。

3. DROID-SLAM:用于单目、双目和RGB-D相机的深度视觉SLAM

标题:DROID-SLAM: Deep Visual SLAM for Monocular, Stereo, and RGB-D Cameras

作者:Zachary Teed, Jia Deng

机构:普林斯顿大学

原文链接:https://arxiv.org/abs/2108.10869

代码链接:https://github.com/princeton-vl/DROID-SLAM

摘要:我们介绍DROID-SLAM,一种新的基于深度学习的SLAM系统。DROID-SLAM包括通过密集束调整层对相机姿态和像素深度的循环迭代更新。DROID-SLAM是精确的,在以前的工作基础上实现了巨大的改进,并且健壮,遭受灾难性故障的几率大大降低。尽管对单目视频进行了训练,但它可以利用立体或RGB-D视频来提高测试时的性能。

4. OV2SLAM:一个用于实时应用的完全在线和通用的可视SLAM

标题:OV2SLAM : A Fully Online and Versatile Visual SLAM for Real-Time Applications

作者:Maxime Ferrera, Alexandre Eudes, Julien Moras, Martial Sanfourche, Guy Le Besnerais

原文链接:https://arxiv.org/abs/2102.04060

代码链接:https://github.com/ov2slam/ov2slam

摘要:视觉SLAM的许多应用,如增强现实、虚拟现实、机器人或自动驾驶,需要通用、鲁棒和精确的解决方案,通常具有实时能力。在这部作品中,我们描述了OV2SLAM是一个完全在线的算法,处理单目和立体相机设置,各种地图比例和帧速率,范围从几赫兹到几百赫兹。它在一个高效的多线程体系结构中结合了视觉本地化的众多最新成果。与竞争算法的广泛比较显示了结果算法的最新精度和实时性能。为了社区的利益,我们发布了源代码。 推荐课程: (第二期)彻底搞懂基于LOAM框架的3D激光SLAM:源码剖析到算法优化

5. 基于相贯线的双目平面SLAM

标题:Stereo Plane SLAM Based on Intersecting Lines

作者:Xiaoyu Zhang, Wei Wang, Xianyu Qi, Ziwei Liao

原文链接:https://arxiv.org/abs/2008.08218

代码链接:https://github.com/fishmarch/Stereo-Plane-SLAM

摘要:平面特征是SLAM系统中减少漂移误差的一种稳定标志。从密集的点云中提取平面简单而快速,密集的点云通常由RGB-D相机或激光雷达获取。但是对于立体摄像机来说,精确高效地计算密集点云是很困难的。本文提出了一种利用立体图像中提取的相交直线计算平面参数的新方法。平面特征普遍存在于人造物体和结构的表面,具有规则的形状和直线的边缘线。在3D空间中,两条相交的线可以确定这样一个平面。因此,我们从左右立体图像中提取线段。通过立体匹配,我们计算3D空间中的端点和线方向,然后从两条相交的线计算平面。我们在帧跟踪中丢弃那些不准确的平面特征。在立体声SLAM系统中增加这样的平面特征减少了漂移误差并改善了性能。我们在公共数据集上测试了我们提出的系统,并与最先进的SLAM系统相比较,展示了其稳健和准确的估计结果。

本文仅做学术分享,如有侵权,请联系删文。

3D视觉交流群,成立啦!

目前我们已经建立了3D视觉方向多个社群,包括 2D计算机视觉 最前沿 工业3D视觉 SLAM 自动驾驶 三维重建 无人机 等方向,细分群包括:

工业3D视觉 :相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM :视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

自动驾驶:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

三维重建 :3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

无人机 :四旋翼建模、无人机飞控等

2D计算机视觉 :图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

最前沿 :具身智能、大模型、Mamba、扩散模型等

除了这些,还有 求职 硬件选型 视觉产品落地、产品、行业新闻 等交流群

添加小助理: cv3d001,备注: 研究方向+学校/公司+昵称 (如 3D点云+清华+小草莓 ), 拉你入群。

▲长按扫码添加助理:cv3d001

3D视觉工坊知识星球

「3D视觉从入门到精通」知识星球 ,已沉淀6年,星球内资料包括: 秘制视频课程近20门 (包括 结构光三维重建、相机标定、SLAM、深度估计、3D目标检测、3DGS顶会带读课程、三维点云







请到「今天看啥」查看全文