专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
爱可可-爱生活  ·  //@爱可可-爱生活:欢迎参与~-20241 ... ·  3 天前  
爱可可-爱生活  ·  几篇论文实现代码:《MimicTalk: ... ·  3 天前  
爱可可-爱生活  ·  [LG]《IGNN-Solver: A ... ·  6 天前  
爱可可-爱生活  ·  【Fullmoon ... ·  6 天前  
51好读  ›  专栏  ›  机器学习研究会

【学习】SLAM的现在与未来

机器学习研究会  · 公众号  · AI  · 2017-06-15 20:12

正文



点击上方“机器学习研究会”可以订阅哦
摘要
 

转自:极客头条

当前的开源方案

本文将带着读者去看看现有的SLAM方案能做到怎样的程度。特别地,我们重点关注那些提供开源实现的方案。在SLAM研究领域,能见到开源方案是很不容易的。往往论文中介绍理论只占20%的内容,其他80%都写在代码中,是论文里没有提到的。正是这些研究者们的无私奉献,推动了整个SLAM行业的快速前进,使后续研究者有了更高的起点。在我们开始做SLAM之前,应该对相似的方案有深入的了解,然后再进行自己的研究,这样才会更有意义。

本讲的前半部分将带领读者参观一下当前的视觉SLAM方案,评述其历史地位和优缺点。表1列举了一些常见的开源SLAM方案,读者可以选择感兴趣的方案进行研究和实验。限于篇幅,我们只选了一部分有代表性的方案,这肯定是不全面的。在后半部分,我们将探讨未来可能的一些发展方向,并给出当前的一些研究成果。


方案名称 传感器形式 地址

MonoSLAM 单目 https://github.com/hanmekim/SceneLib2

PTAM 单目 http://www.robots.ox.ac.uk/~gk/PTAM/

ORB-SLAM 单目为主 http://webdiis.unizar.es/~raulmur/orbslam/

LSD-SLAM 单目为主 http://vision.in.tum.de/research/vslam/lsdslam

SVO 单目 https://github.com/uzh-rpg/rpg_svo

DTAM RGB-D https://github.com/anuranbaka/OpenDTAM

DVO RGB-D https://github.com/tum-vision/dvo_slam

DSO 单目 https://github.com/JakobEngel/dso

RTAB-MAP 双目/RGB-D https://github.com/introlab/rtabmap

RGBD-SLAM-V2 RGB-D https://github.com/felixendres/rgbdslam_v2

Elastic Fusion RGB-D https://github.com/mp3guy/ElasticFusion

Hector SLAM 激光 http://wiki.ros.org/hector_slam

GMapping 激光 http://wiki.ros.org/gmapping

OKVIS 多目+IMU https://github.com/ethz-asl/okvis

ROVIO 单目+IMU https://github.com/ethz-asl/rovio

表1 常用开源 SLAM 方案


MonoSLAM

说到视觉SLAM,很多研究者第一个想到的是A. J. Davison的单目SLAM工作。Davison教授是视觉SLAM研究领域的先驱,他在2007年提出的MonoSLAM是第一个实时的单目视觉SLAM系统[2],被认为是许多工作的发源地。MonoSLAM以扩展卡尔曼滤波为后端,追踪前端非常稀疏的特征点。由于EKF在早期SLAM中占据着明显主导地位,所以MonoSLAM亦是建立在EKF的基础之上,以相机的当前状态和所有路标点为状态量,更新其均值和协方差。

图1所示是MonoSLAM在运行时的情形。可以看到,单目相机在一幅图像当中追踪了非常稀疏的特征点(且用到了主动追踪技术)。在EKF中,每个特征点的位置服从高斯分布,所以我们能够以一个椭球的形式表达它的均值和不确定性。在该图的右半部分,我们可以找到一些在空间中分布着的小球。它们在某个方向上显得越长,说明在该方向的位置就越不确定。我们可以想象,如果一个特征点收敛,我们应该能看到它从一个很长的椭球(相机Z方向上非常不确定)最后变成一个小点的样子。


图1 MonoSLAM的运行时截图。左侧:追踪特征点在图像中的表示; 右侧:特征点在三维空间中的表示。


这种做法在今天看来固然存在许多弊端,但在当时已经是里程碑式的工作了,因为在此之前的视觉SLAM系统基本不能在线运行,只能靠机器人携带相机采集数据,再离线地进行定位与建图。计算机性能的进步,以及用稀疏的方式处理图像,加在一起才使得一个SLAM系统能够在线地运行。从现代的角度来看,MonoSLAM存在诸如应用场景很窄,路标数量有限,稀疏特征点非常容易丢失的情况,对它的开发也已经停止,取而代之的是更先进的理论和编程工具。不过这并不妨碍我们对前人工作的理解和尊敬。


原文链接:

http://geek.csdn.net/news/detail/202128?url_type=39&object_type=webpage&pos=1

“完整内容”请点击【阅读原文】
↓↓↓