专栏名称: CSDN
CSDN精彩内容每日推荐。我们关注IT产品研发背后的那些人、技术和故事。
目录
相关文章推荐
新浪科技  ·  【#无创血糖手表靠谱吗# ... ·  22 小时前  
得物技术  ·  Java性能测试利器:JMH入门与实践|得物技术 ·  3 天前  
得物技术  ·  Java性能测试利器:JMH入门与实践|得物技术 ·  3 天前  
51好读  ›  专栏  ›  CSDN

无人驾驶刚刚开始的未来

CSDN  · 公众号  · 科技媒体  · 2017-05-25 11:35

正文

作者 | 刘少山,唐洁,吴唯玥

责编 | 何永灿


本文是无人驾驶技术系列的第12篇,也是最后一篇。本文梳理总结了前面11篇涉及到的技术点,尝试呈现一个宏观的无人驾驶系统架构。另外,简单分析了无人驾驶的产业链现状以及根据笔者自己的经验提出了一些给开发者、创业者,以及投资者的建议。

无人驾驶系列文章链接:http://geek.csdn.net/news/detail/199280

无人驾驶技术总结


无人驾驶是一个复杂的系统,如图1所示,系统主要由三部分组成:算法端、Client端和云端。其中算法端包括面向传感、感知和决策等关键步骤的算法;Client端包括机器人操作系统以及硬件平台;云端则包括数据存储、模拟、高精度地图绘制以及深度学习模型训练。



图1 无人驾驶系统架构图


算法子系统从传感器原始数据中提取有意义的信息以了解周遭环境情况,并根据环境变化做出决策。Client子系统融合多种算法以满足实时性与可靠性的要求。举例来说,传感器以60HZ的速度产生原始数据,Client子系统需要保证最长的流水线处理周期也能在16ms内完成。云平台为无人车提供离线计算以及存储功能。通过云平台,我们能够测试新的算法、更新高精度地图并训练更加有效的识别、追踪、决策模型。

无人驾驶算法


算法系统由几部分组成:第一,传感并从传感器原始数据中提取有意义信息;第二,感知,以定位无人车所在位置以及感知现在所处的环境;第三,决策,以可靠安全抵达目的地。


传感


通常来说,一辆无人驾驶汽车装备有许多不同类型的主传感器。每一种类型的传感器都各有优劣,因此,来自不同传感器的传感数据应该有效地进行融合。现在无人驾驶中普遍使用的传感器包括以下几种。


  • GPS/IMU:通过高达200Hz频率的全球定位和惯性更新数据以帮助无人车完成自我定位。GPS是一个相对准确的定位用传感器,但是它的更新频率过低,仅仅有10HZ,不足以提供足够实时的位置更新。IMU的准确度随着时间降低,在长时间内并不能保证位置更新的准确性,但是,它有着GPS所欠缺的实时性,IMU的更新频率可以达到200HZ或者更高。通过整合GPS与IMU,我们可以为车辆定位提供既准确又足够实时的位置更新。


  • LiDAR:激光雷达可被用来绘制地图、定位以及避障。雷达的准确率非常高,因此在无人车设计中雷达通常被作为主传感器使用。激光雷达是以激光为光源,通过探测激光与被探测无相互作用的光波信号来完成遥感测量。激光雷达可以用来产生高精度地图,并针对高精地图完成移动车辆的定位;以及满足避障的要求。以Velodyne 64-束激光雷达为例,它可完成10HZ旋转并每秒可达到130万次读数。


  • 摄像头:被广泛使用在物体识别以及物体追踪等场景中,像是车道线检测、交通灯侦测、人行道检测中都以摄像头为主要解决方案。为了加强安全性,现有的无人车实现通常在车身周围使用至少八个摄像头,分别从前、后、左、右四个维度完成物体发现、识别、追踪等任务。这些摄像头通常以60HZ的频率工作,当多个摄像头同时工作时,将产生高达1.8GB每秒的巨数据。


  • 雷达和声呐:雷达通过把电磁波能量射向空间某一方向,处在此方向上的物体反射碰到的电磁波;雷达再接收此反射波,提取有关该物体的某些信息(目标物体至雷达的距离,距离变化率或径向速度、方位、高度等)。雷达和声呐系统是避障的最后一道保障。雷达和声呐产生的数据用来表示在车的前进方向上最近障碍物的距离。一旦系统检测到前方不远有障碍物出现,则有极大的相撞危险,无人车会启动紧急刹车以完成避障。因此,雷达和声呐系统产生的数据不需要过多的处理,通常可直接被控制处理器采用,并不需要主计算流水线的介入,因为可实现转向,刹车、或预张紧安全带等紧急功能。


感知


在获得传感信息之后,数据将被推送至感知子系统以充分了解无人车所处的周遭环境。在这里感知子系统主要做的是三件事:定位、物体识别以及物体追踪。



图2 基于GPS/IMU的定位


定位


GPS以较低的更新频率提供相对准确的位置信息;IMU则以较高的更新频率提供准确性偏低的位置信息。我们可使用卡尔曼滤波来整合两类数据各自的优势,合并提供准确且实时的位置信息更新。如图2所示,IMU每5ms更新一次,但是期间误差不断累积精度不断降低。所幸的是,每100ms可以得到一次GPS数据更新,以帮助我们校正IMU积累的误差。因此,我们最终可以获得实时并准确的位置信息。然而,我们不能仅仅依靠这样的数据组合以完成定位工作。原因有三:其一,这样的定位精度仅在一米之内;其二,GPS信号有着天然的多路径问题将引入噪声干扰;其三,GPS必须在非封闭的环境下工作,因此在诸如隧道等场景中GPS都不适用。



图3 基于立体视觉的测距


因此作为补充方案,摄像头也被用为定位。简化来说,如图3所示,基于视觉的定位由三个基本步骤组成:1. 通过对立体图像的三角剖分,将首先获得视差图用以计算每个点的深度信息;2. 通过匹配连续立体图像帧之间的显著特征,可通过不同帧之间的特征建立相关性,并由此估计这两帧之间的运动情况;3. 通过比较捕捉到的显著特征和已知地图上的点来计算车辆的当前位置。然而,基于视觉的定位方法对照明条件非常敏感,因此其使用受限并可靠性有限。


因此,借助于大量粒子滤波的激光雷达通常作为车辆定位的主传感器。由激光雷达产生的点云对环境进行了“形状化描述”,但并不足以区分各自不同的点。通过粒子滤波,系统可将已知地图与观测到的具体形状进行比较以减少位置的不确定性。 


为了在地图中定位运动的车辆,我们使用粒子滤波的方法来关联已知地图和激光雷达测量过程。粒子滤波可以在10厘米的精度内达到实时定位的效果,在城市的复杂环境中尤为有效。然而,激光雷达也有其固有的缺点:如果空气中有悬浮的颗粒比如雨滴或者灰尘,测量结果将受到极大的扰动。因此,为了完成可靠并精准的定位,需要传感器融合,如图4所示,处理来整合所有传感器的优点。



图4 定位中的传感器融合


物体识别与跟踪


激光雷达可提供精准的深度信息,因此常被用于在无人驾驶中执行物体识别和追踪的任务。近年来,深度学习技术得到了快速的发展,通过深度学习可达到较显著的物体识别和追踪精度。


卷积神经网络(CNN)是一类在物体识别中被广泛应用的深度神经网络。通常,卷积神经网络由三个阶段组成:1. 卷积层使用不同的滤波器从输入图像中提取不同的特征,并且每个过滤器在完成训练阶段后都将抽取出一套“可供学习”的参数;2. 激活层决定是否启动目标神经元;3. 汇聚层压缩特征映射图所占用的空间以减少参数的数目,并由此降低所需的计算量;4. 对物体进行分类。一旦某物体被CNN识别出来,下一步将自动预测它的运行轨迹或进行物体追踪。



图5 面向行为预测的随机模型


物体追踪可以被用来追踪邻近行驶的车辆或者路上的行人,以保证无人车在驾驶的过程中不会与其他移动的物体发生碰撞。近年来,相比传统的计算机视觉技术,深度学习技术已经展露出极大的优势,通过使用辅助的自然图像,离线训练好的模型直接应用在在线的物体追踪中。


决策


在决策阶段,行为预测、路径规划以及避障机制三者结合起来实时完成无人驾驶动作规划。


行为预测


车辆驾驶中的一个主要考验是司机如何应对其他行驶车辆的可能行为,这种预判断直接影响司机本人的驾驶决策,特别是在多车道环境或者交通灯变灯的情况下,司机的预测决定了下一秒行车的安全。因此,过渡到无人驾驶系统中,决策模块如何根据周围车辆的行驶状况决策下一秒的行驶行为显得至关重要。


为了预测其他车辆的行驶行为,可以使用随机模型产生这些车辆的可达位置集合,并采用概率分布的方法预测每一个可达位置集的相关概率。


路径规划


为无人驾驶在动态环境中进行路径规划是一件非常复杂的事情,尤其如果车辆是在全速行驶的过程中,不当的路径规划有可能造成致命的伤害。路径规划中采取的一个方法是使用完全确定模型,它搜索所有可能的路径并利用代价函数的方式确定最佳路径。然后,完全确定模型对计算性能有着非常高的要求,因此很难在导航过程中达到实时的效果。为了避免计算复杂性并提供实时的路径规划,使用概率性模型成为了主要的优化方向。


避障


安全性是无人驾驶中最为重要的考量,我们将使用至少两层级的避障机制来保证车辆不会在行驶过程中与障碍物发生碰撞。第一层级是基于交通情况预测的前瞻层级。交通情况预测机制根据现有的交通状况如拥堵、车速等,估计出碰撞发生时间与最短预测距离等参数。基于这些估计,避障机制将被启动以执行本地路径重规划。如果前瞻层级预测失效,第二级实时反应层将使用雷达数据再次进行本地路径重规划。一旦雷达侦测到路径前方出现障碍物,则立即执行避障操作。

Client系统


Client系统整合之前提到的避障、路径规划等算法以满足可靠性及实时性等要求。Client系统需要克服三个方面的问题:其一,系统必须确保捕捉到的大量传感器数据可以及时快速地得到处理;其二,如果系统的某部分失效,系统需要有足够的健壮性能从错误中恢复;其三,系统必须在设计的能耗和资源限定下有效地完成所有的计算操作。


机器人操作系统


机器人操作系统ROS是现如今广泛被使用、专为机器人应用裁剪、强大的分布式计算框架。每一个机器人任务,比如避障,作为ROS中的一个节点存在。这些任务节点使用话题与服务的方式相互通信。


ROS非常适用于无人驾驶的场景,但是仍有一些问题需要解决。


  • 可靠性:ROS使用单主节点结构,并且没有监控机制以恢复失效的节点。

  • 性能:当节点之间使用广播消息的方式通信时,将产生多次信息复制导致性能下降。

  • 安全:ROS中没有授权和加密机制,因此安全性受到很大的威胁。


尽管ROS 2.0 承诺将解决上述问题,但是现有的ROS版本中仍然没有相关的解决方案。因此为了在无人驾驶中使用ROS,我们需要自行克服这些难题。


可靠性


现有的ROS实现只有一个主节点,因此当主节点失效时,整个系统也随之奔溃。这对行驶中的汽车而言是致命的缺陷。为了解决此问题,我们在ROS中使用类似于ZooKeeper的方法。如图6所示,改进后的ROS结构包括有一个关键主节点以及一个备用主节点。如果关键主节点失效,备用主节点将被自动启用以确保系统能够无缝地继续运行。此外,ZooKeeper机制将监控并自动重启失效节点,以确保整个ROS系统在任何时刻都是双备份模式。



图6 面向ROS的Zoo-Keeper结构


性能


性能是现有ROS版本中有欠考虑的部分,ROS节点之间的通信非常频繁,因此设计高效的通信机制对保证ROS的性能势在必行。首先,本地节点在与其他节点通信时使用回环机制,并且每一次回环通信的执行都将完整地通过TCP/IP全协议栈,从而引入高达20微秒的时延。为了消除本地节点通信的代价,我们不再使用TCP/IP的通信模式,取而代之采用共享内存的方法完成节点通信。其次,当ROS节点广播通信消息时,消息被多次拷贝与传输,消耗了大量的系统带宽。如果改成目的地更明确的多路径传输机制则将极大地该改善系统的带宽与吞吐量。


安全


安全是ROS系统中最重要的需求。如果一个ROS节点被挟制后,不停地在进行内存分配,整个系统最终将因内存耗尽而导致剩余节点失效继而全线奔溃。在另一个场景中,因为ROS节点本身没有加密机制,黑客可以很容易地在节点之间窃听消息并完成系统入侵。


为了解决安全问题,我们使用Linux containers (LXC)的方法来限制每一个节点可供使用的资源数,并采用沙盒的方式以确保节点的运行独立,这样以来可最大限度防止资源泄露。同时我们为通信消息进行了加密操作,以防止其被黑客窃听。



图7 基于Spark和ROS的模拟平台


硬件平台


为了深入理解设计无人驾驶硬件平台中可能遇到的挑战,让我们来看看现有的领先无人车驾驶产品的计算平台构成。此平台由两个计算盒组成,每一个装备有Intel Xeon E5处理器以及4到8个Nvidia Tesla K80 GPU加速器。两个计算盒执行完全一样的工作,第二个计算盒作为计算备份以提高整个系统的可靠性,一旦第一个计算盒发生故障,计算盒二可以无缝接手所有的计算工作。


在最极端的情况下,如果两个计算盒都在峰值下运行,及时功耗将高达5000W,同时也将遭遇非常严重的发热问题。因此,计算盒必须配备有额外的散热装置,可采用多风扇或者水冷的方案。同时,每一个计算盒的造价非常昂贵,高达2万-3万美元,致使现有无人车方案对普通消费者而言无法承受。


现有无人车设计方案中存在的功耗问题、散热问题以及造价问题使得无人驾驶进入普罗大众显得遥不可及。为了探索无人驾驶系统在资源受限以及能耗受限时运行的可行性,我们在ARM面向移动市场的SoC实现了一个简化的无人驾驶系统,实验显示在峰值情况下能耗仅为15W。


非常惊人地,在移动类SoC上无人驾驶系统的性能反而带给了我们一些惊喜:定位算法可以达到每秒25帧的处理速度,同时能维持图像生成的速度在30帧每秒。深度学习则能在一秒内完成2-3个物体的识别工作。路径规划和控制则可以在6毫秒之内完成规划工作。在这样性能的驱动之下,我们可以在不损失任何位置信息的情况下达到每小时5英里的行驶速度。

云平台


无人车是移动系统,因此需要云平台的支持。云平台主要从分布式计算以及分布式存储两方面对无人驾驶系统提供支持。无人驾驶系统中很多的应用,包括用于验证新算法的仿真应用,高精度地图产生和深度学习模型训练都需要云平台的支持。我们使用Spark构建了分布式计算平台,使用OpenCL构建了异构计算平台,使用了Alluxio作为内存存储平台。通过这三个平台的整合,我们可以为无人驾驶提供高可靠、低延迟以及高吞吐的云端支持。


仿真


当我们为无人驾驶开发出新算法时,我们需要先通过仿真对此算法进行全面的测试,测试通过之后才进入真车测试环节。真车测试的成本非常高昂并且迭代周期异常之漫长,因此仿真测试的全面性和正确性对降低生产成本和生产周期尤为重要。在仿真测试环节,我们通过在ROS节点回放真实采集的道路交通情况,模拟真实的驾驶场景,完成对算法的测试。如果没有云平台的帮助,单机系统耗费数小时才能完成一个场景下的模拟测试,既耗时同事测试覆盖面有限。


在云平台中,Spark管理着分布式的多个计算节点,在每一个计算节点中,都可以部署一个场景下的ROS回访模拟。在无人驾驶物体识别测试中,单服务器需耗时3小时完成算法测试,如果使用8机Spark机群,时间可以缩短至25分钟。


高精度地图生成


如图8所示,高精度地图产生过程非常复杂,涉及到:原始数据处理、点云生成、点云对其、2D反射地图生成、高精地图标注、地图生成等阶段。使用Spark,我们可以将所有这些阶段整合成为一个Spark作业。由于Spark天然的内存计算的特性,作业运行过程中产生的中间数据都存储在内存中。当整个地图生产作业提交之后,不同阶段之间产生的大量数据不需要使用磁盘存储,数据访问速度加快,从而极大提高了高精地图产生的性能。



图8 基于云平台的高精地图生成


深度学习模型训练


在无人驾驶中我们使用了不同的深度学习模型,为了保证模型的有效性及效率,有必要对模型进行持续的更新。然而,原始数据量异常巨大,仅使用单机系统远不能完成快速的模型训练。


为了解决这一问题,我们使用Spark以及Paddle开发了一个高可扩展性分布式深度学习平台。Paddle是百度开发的一个深度学习开源平台。在Spark driver上我们同时管理Spark运行上下文以及Paddle运行上下文,在每个节点上,Spark执行进程运行一个Paddle训练实例。在此基础上,我们使用Alluxio作为参数服务器。实验证明,当计算节点规模增长时,我们可以获得线性的性能提升,这说明Spark+Paddle+Alluxio这套深度学习模型训练系统有着高可扩展性。

无人驾驶的产业发展


为了深入了解无人驾驶的产业发展,我们邀请了牛津大学商学院的同学一起做了个产业链分析。宏观来说,一个产业的发展应该是至上而下的,上游产业的发展让下游产业更加繁荣,反过来刺激上游产业的发展。理想来说,无人驾驶的产业发展应该分为三个阶段:第一阶段,感知系统的发展,主要包括各类传感器的融合使用及感知决策系统的准确度提升,实现辅助信息的交互及部分自动驾驶功能。第二阶段,支持算法以及决策的芯片成熟,包括算法及芯片设计的发展,实现协同决策及自动驾驶。第三阶段,车联网的发展,实现高精度地图及实时路况信息的更新及通过深度学习实现协同感知。


传感器的融合使用


毫米波雷达:车载毫米波雷达市场主要供应商为传统的汽车电子企业,如博世、大陆、 海拉等,市场占有率头三位的企业占领了50%以上的市场份额。中国市场中高端汽车装配的毫米波雷达传感器依赖进口为主,国内自主品牌的研发生产能力尚需提高。毫米波雷达的核心组成部分为前端单片微波集成电路MMIC和雷达天线高频PCB板,此两项核心技术仅掌握在国外厂商手中。国内企业总体尚处于研发阶段,24GHz的产品已经取得部分研发成果,华域汽车、湖南纳雷、芜湖森思泰克、智波科技等企业在此方面有部分技术积累。


激光雷达:激光雷达是无人驾驶汽车硬件端的核心能力,受益于无人驾驶汽车市场规模的爆发,预计2030年全球激光雷达市场可达到360亿美元的规模。相比于国外的Velodyne、Quanergy等厂商已经具有相对成熟的产品,国内公司在激光雷达生产研发尚处于初步成型阶段。目前国内研发生产激光雷达的初创公司数量很多,但是大多数缺乏完整的产业链及相应的配套设备,受制于硬件成本及技术门槛较高等因素,能够做出成型产品的公司往往很少。目前有产品落地的激光雷达公司包括欧镭激光、镭神智能、思岚科技和速腾聚创等。此类公司竞争的着力点包括四个方面:1. 建立与各车厂的合作关系:发展新客户,抢占新市场并积累市场需求方面的经验;2. 硬件的量产及成本的控制:实现大规模生产的同时降低成本,通过量产实现更大的利润(目前激光雷达的毛利率约为27%);3. 提高产品性能的稳定性,通过快速迭代提高产品工艺,建立技术门槛;4. 综合提供数据存储分析的服务,实现数据格式的统一。


摄像头:预计2020年全球车载摄像头的市场规模约为200亿人民币,模组组装及CMOS供应商共占据超过60%的产业价值,该产业链的其他环节还包括镜头供应商及其他部件的供应商。该模块的行业技术壁垒较高,只有少数厂商具有垂直整合的能力。大部分厂商将业务集中在产业链中的少数环节,行业的集中度很高,大多数环节的前三厂商市场份额合计占总体一半以上:光学镜头主要是台湾的大立光学、大陆的舜宇光学主导,CMOS传感器及图像处理器以欧美和日本韩国的厂商为主,大陆厂商在红外滤光片和模组封装有一定的优势(如欧菲光、水晶光电等)。通常摄像头硬件设备和配套的算法及系统难以分割,硬件设备商将摄像头提供给自动驾驶算法公司或者汽车一级供应商,由这些下游的公司进行硬件、芯片及算法的合成。由于车载摄像头对安全性及稳定性的要求比普通的工业用摄像头高,产品壁垒较高,所以摄像头大厂相对有竞争优势。台湾的同致电子2016年的营业收入预计比2015年增长超过40%,毛利率达到30%。未来的车载摄像头厂商的竞争将主要体现在:1. 与芯片及算法的适配性,提供整体解决方案的能力;2. 产品稳定性安全性等工艺的领先。


总体上说,传感器与配套的算法及芯片相辅相成,未来的趋势是提供完整的一套解决方案,而不是单个零星的硬件。另外,各种类型的传感器的功能各有优势,互相补充,汽车整车厂将融合使用各类传感器,并通过量产及新技术推动传感器的成本下降。


算法及芯片协同发展


ADAS算法及芯片技术门槛高,需要对传感系统采集的数据进行处理,完成对周围环境及自身车况的识别及探知,市场集中度较高。国内的ADAS算法公司主要有深圳佑驾、前向启创、苏州智华等。此类公司根据自身特点及战略目标的不同,围绕算法为中心,有三种商业模式:1. 向汽车一级供应商直接提供算法(或者外购芯片及传感器,提供完整的ADAS模组);2. 建立生产线,提供自产的完整ADAS模组给一级供应商或后装市场;3. 将自身研发的芯片与算法绑定出售。 由于可以通过算法升级实现更多功能,且企业内部的自身成本与建立传感器生产线相比非常低(主要是人工的成本),所以产业链中的算法环节可以带来30%以上的产品溢价。


高精度地图及车联网的发展


高精度地图参与者主要有图商(如HERE、四维图新)、无人驾驶科技公司(如Google、特斯拉等)、ADAS方案提供商(如Mobileye、前向启创)和传统车企(如通用、大众)等四类。其中除了图商的高精度地图是为地图的标准化准备外,其他参与者绘制的高精度地图都是为了各自环节中的特定需求定制的,标准化程度较低。地图行业的进入壁垒较高,主要由于地图绘制的牌照数量少,数据库建设周期长,投入资金大,而且需要大量依赖长期积累起来的实施技术。另一方面,该行业的规模经济效应明显,一旦建立起市场份额则利润非常可观。以四维图新为例,2016年该公司的综合毛利率约为80%,近50%的营业收入来自车载导航领域。在离线地图的时代,图商主要以销售地图使用许可证(License)为主,但在高精度地图时代下,图商将为用户提供持续的服务。届时一次性收费的模式将被按时间或按产品类型收费的模式取代。


车联网市场的参与方可大致分为四种: 车联网服务提供商、设备供应商、增值服务提供商以及电信运营商。1. 车联网服务提供商居于产业链核心,地位类似于智能手机的操作平台,是传统整车厂和高科技行业巨头竞争的主战场。传统整车厂利用捆绑销售的方式,通过在旗下产品搭载自家品牌的车联网系统,完成用户的原始积累。科技公司则通过与车企在地图、车联网方案、自动驾驶等领域的合作进入车联网生态系统。2. 设备供应商是整个车联网产业链实现的硬件基础。目前该领域尚未形成巨头竞争的格局,留给创业公司发展的空间较大。纵向一体化或者专攻高利润市场将有助于尽快确立竞争地位。3. 增值服务提供商与智能手机App应用的价值类似,市场空间十分巨大,但目前尚处于初级的服务模式当中,参与者鱼龙混杂,竞争的关键点在于精准理解用户需求,提高用户体验。4. 电信运营商主要将用户请求及处理结果在车联网中传递并收取通信费用。国内三大电信运营在通信市场处于绝对的寡头地位。


下游过热


但是根据目前无人驾驶产业链的发展,显然有点下游过热了,大量的风投涌入下游,特别是L4/L5整车的无人驾驶初创公司,而许多上游部件以及核心模块却没有引起太多的注意。资本突然的涌入也造成了L4/L5整车的无人驾驶公司估值的暴涨,也直接导致了无人驾驶从业者人心浮动,大量人才从行业领先地位的无人驾驶公司(包括Google、百度等)流失。这个现象对无人驾驶产业发展并非是好事,也让我们想起了2016年的AR/VR风潮以及后来的AR/VR企业的倒闭潮。个人认为AR/VR的核心问题也是在上游产业链没准备好的情况下,下游产品概念被炒作过热,导致资本的疯狂。

一点个人的感想与建议


这是无人驾驶系列最后一期,开始写这个系列是因为自己对这个集大成技术的热爱以及追求。写每一期都是对自己做过技术的一次总结以及重新学习。在之前的11期我们都聚焦技术而不谈个人的见解。最后一期想总结一下个人的一些观点,读者们未必会认同,但是希望可以通过这篇文章多与各位交流学习。


我为什么没有做无人驾驶创业


许多投资人问过我,为什么没有选择无人驾驶创业,而选择了机器人。因为在我看来无人驾驶整合了40~50个技术点,即使做好了其中90%的技术点,无人车还是上不了路。而机器人只是整合了4~5个技术点,相对容易许多,责任也小许多。做机器人解决方案我们很快就可以出产品,很快能得到市场反馈,从中学习到许多,也可以得到不断出货的满足感。而做无人车做得好也可能只是一个好的Demo,而且做无人驾驶创业需要很强的技术以及资本掌控能力,我能力还到不了这个程度。在我看来市场上有几家无人驾驶初创公司有很强的技术把控能力,包括NURO.AI、PONY.AI、以及AutoX.AI,NURO.AI与PONY.AI应该属于传统的LiDAR流派,而AutoX应该是视觉流派的佼佼者。


给开发者的建议


当前的人工智能热潮是一次大的技术革命,对广大技术人员来说是个特别好的机会,但是如果只掌握一个技术点是不足够的。根据我过去几年的经验,在技术行业隔行如隔山,比如做算法的对软件设计未必熟悉,专注做软件的很少懂系统,而懂系统的了解硬件也不多。反过来也一样,让一个硬件工程师去写软件,他可能会觉得很难而不敢触碰。但是如果能静下心来花点时间去学一下,其实并没有想象中那么难。我在工作以及创业的过程中,发现能跨跃几个细分行业(比如软件、系统、硬件)的工程师非常难得也非常有价值。通常可以跨跃几个细分行业的人都比较有好奇心,也有勇气去尝试新的东西。我以前是学系统的,觉得算法不是我的本行,一直拒绝接触。但是当自己深入接触后,觉得并没有想象中那么困难,只要保持着好奇心,不断学习,可以很快成才。


给投资人的建议


下游现在过热了,多关注上游。我个人信奉的是更细的分工达至更高的效率。只有上游发展好后,下游才会真正的繁荣。如果每个公司都说可以全栈把每个点都做好那是不成熟以及低效的。比如无人驾驶安全,基本没人关注也没人在这个行业创业。很多投资人说,无人驾驶本身都没做好,哪有功夫看这种方向。但是当车做好后,如果安全没做好,车是不可能上路的。无人驾驶安全必须随着无人驾驶其他技术点一起发展。另外为无人驾驶服务的云计算,也是鲜有人投入,但是这在我看来是个极大的市场。

序幕刚启


无人驾驶作为人工智能的集大成应用, 从来就不是某单一的技术,而是众多技术点的整合。技术上它需要有算法上的创新、系统上的融合,以及来自云平台的支持。除了技术之外,无人驾驶的整条产业链也是刚刚开始,需要时间去发展。目前在市场上许多创业公司都是做全栈,做整车。但是如果产业链没发展成熟,做全栈与做整车公司的意义更多是Demo这项技术,而很难产品化。个人认为一个成熟的产业是应该有层次感的,上下游清晰,分工细致以达到更高的效率。但是今天无人驾驶行业还是混沌的,上下游不清晰,而且资本的热捧也导致了市场过热。但是相信通过几年的发展,当上下游发展清晰后,无人驾驶就可以真正产业化了。无人驾驶序幕刚启,其中有着千千万万的机会亟待发掘。预计在2020年,将有真正意义上的无人车开始面市,很可能是在园区以及高速公路等可控场景,然后到2040年,我们应该可以看到无人驾驶全面普及,让我们拭目以待。



 

作者简介


  • 刘少山,PerceptIn联合创始人。加州大学欧文分校计算机博士,研究方向:智能感知计算、系统软件、体系结构与异构计算。现在PerceptIn主要专注于SLAM技术及其在智能硬件上的实现与优化。

  • 唐洁,华南理工大学计算机科学与工程学院副教授。主要从事面向无人驾驶和机器人的大数据计算与存储平台、面向人工智能的计算体系架构、面向机器视觉的嵌入式系统研究。

  • 吴唯玥,牛津大学工商管理硕士。牛津大学种子基金投资经理,曾任德勤咨询汽车行业服务高级顾问,主要专注于销售业绩提升与企业管理流程重组优化,带领团队参与多个汽车品牌及零售业品牌咨询项目。中国注册会计师协会会员。


本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请点击「阅读原文」订阅《程序员》。




推荐本文作者的新书《第一本无人驾驶技术书》,无人驾驶是一个复杂的系统,涉及的技术点种类多且跨度大,入门者常常不知从何入手。本书的作者都是无人驾驶行业的从业者与研究人员,有着多年无人驾驶及人工智能技术的实战经验。适合对无人驾驶技术感兴趣的在校学生、工业从业者,以及相关人士阅读。

购买链接:https://item.jd.com/12184804.html