来源:人工智能快报(ID:AI_News)
麦肯锡专家Kersten Heineke、Philipp Kampshoff、Armen Mkrtchyan和Emily Shao等人撰文讨论了自动驾驶面临的主要挑战与发展方向,主要内容如下:
自动驾驶汽车(AV)无疑开创了交通运输行业的新时代,但该行业仍然需要克服一些挑战,自动驾驶技术才能变得实用。高级辅助驾驶系统(Advanced Driver Assistance Systems,ADAS)解决方案已经能够减轻驾驶负担,让驾驶变得更安全。但在某些情况下,技术也会带来问题。其中一个就是,人类过度信任或依赖这些新系统。这并非一种新现象。安全气囊在二十世纪九十年代成为主流时,一些驾驶员和乘客将之视为可以不系安全带的信号,因为他们认为安全带现在是多余的。这种错觉导致了额外的伤亡。
与之类似,高级辅助驾驶系统会让驾驶员在超出此类解决方案能力范围的场景中仍然依赖于自动化技术。例如,自适应巡航控制在一辆汽车直接跟随另一辆时有出色的表现,但通常无法检测到静止的物体。遗憾的是,现实生活场景以及受控实验场景均表明,过度信赖自动化技术的驾驶员最终都会撞上静止不动的车辆或其他物体。目前,高级辅助驾驶系统的能力有限,但许多早期使用者没能理解到这一点。
这仍然是一个安全难题。2015年,美国因驾驶员注意力不集中而导致的传统车辆事故造成了近3500人死亡、39万人受伤,这还是在驾驶员主动控制车辆的情况下。遗憾的是,据专家预计,即使引入能够提供高水平自动化控制的自动驾驶汽车,撞车事故数量在一开始也不会大幅下降,因为这些自动驾驶汽车仍然需要驾驶员高度集中注意力,充当候补的角色,提供故障保险。
安全专家担心,半自动驾驶汽车的驾驶员可能会尝试阅读或发短信等活动,因而在要求接管汽车的控制权时会缺少所需的情景意识。随着驾驶员重新参与进来,他们必须立即评估周围环境、确定车辆所处位置、分析危险状况并决定安全的行动方案。以每小时65英里的速度行驶时,汽车只需不到四秒就能行驶足球场那么长的距离,而司机脱离驾驶状态的时间越长,重新参与驾驶所需的时间就越长。汽车公司必须开发出更好的人机界面来确保新技术能够拯救生命,而不是带来更多事故。
在其他情况下已经出现过类似的问题:2009年,因为飞机使用自动驾驶仪飞行时飞行员未参与驾驶,一架商业航班飞过了,比终点多飞了150英里。对于半自动驾驶汽车而言,“空域”(地面)更加拥挤,而“飞行员”(驾驶员)则远远称不上训练有素,因此,心不在焉的驾驶员长时间使用自动驾驶模式会更加危险。
根据当前的发展趋势,全自动驾驶车辆在未来十年内不会成为现实。主要障碍在于所需软件的开发。虽然硬件创新能够提供所需的计算能力,且价格(特别是传感器价格)可能持续降低,但软件仍然是关键的瓶颈。
事实上,硬件能力已经接近经过高度优化的自动驾驶汽车软件流畅运行所需的水平。当前技术应该很快就能达到图形处理器(GPU)和中央处理器(CPU)所需的计算能力水平了。
摄像头传感器具有所需的范围、分辨率和视野,但在糟糕天气条件下受到诸多限制。雷达在技术上已经成熟,是天气和道路条件不佳情况下的最好选择。激光雷达系统提供最佳视野,能够以高粒度水平提供360度覆盖范围。尽管这些设备目前价格过高且体积过大,但在未来一两年内,会有多种具有商业可行性的小型廉价设备上市。多家高科技公司声称已将激光雷达的成本降至500美元以下。还有一家公司首次推出了能够以一万美元左右的成本(借助约十二个传感器)实现完全自动化的系统。从商业化的角度来看,公司需要了解五级(完全自动化)车辆所需的最佳传感器数量。
开发出能够完善自动驾驶汽车硬件并充分利用其潜能的软件仍然有很长的一段路要走。鉴于这个问题的复杂性及其以研究为主的性质,开发工作止步不前。
其中一个问题是,自动驾驶汽车必须学习如何处理涉及人类驾驶员和其他自动驾驶汽车的驾驶模式。使用易于出错的GPS传感器实现高度准确的车辆位置定位则是另一个需要解决的复杂问题。应对这些挑战不仅需要完成大量的前期研发工作,还要经历很长的测试和验证阶段。
有三类问题能够更具体地说明所存在的软件问题。第一个问题是物体分析,即检测物体并理解物体代表的含义,这对于自动驾驶汽车而言十分关键。例如,对于静止不动的摩托车和在街边骑自行车的人,系统应采用不同的应对方式,因而必须在物体分析阶段捕捉到关键的区别。
物体分析的首要挑战是检测,这个问题可能很难,取决于一天中所处的时间段、背景环境以及任何可能的移动。此外,要实现传感器融合去验证物体的存在和类型,这在技术上存在挑战,因为此类系统必须比较不同数据类型之间的差异:点云(来自激光雷达)、物体列表(来自雷达)以及图像(来自摄像头)。
第二个问题是决策系统。为了模仿人类的决策过程,这些系统必须处理大量场景并接受密集而全面的“训练”。对于自动驾驶系统而言,理解并标记所收集的不同场景和图像是一个重大课题,但要创建涵盖送客至家门(door-to-door)的自动驾驶所有可能场景的“如果-那么(if-then)”规则通常不可行。尽管如此,开发人员可以构建“如果-那么”规则的数据库,利用人工智能(AI)引擎对其进行补充。这种引擎能够做出智能推断,并且可在“如果-那么”规则没有涵盖的场景中进行决策。创建此类引擎是一项非常困难的任务,需要进行大量开发、测试和验证。
该系统还要有故障保险机制,以免出现故障的汽车让乘客和周围的行人处于危险之中。我们无法检查每个可能的软件状态和结果,而构建保障措施来确保不会出现最糟糕的结果并控制车辆使其能安全停下来,这是更艰巨的任务。需要冗余度和长时间测试。
随着各家公司推出软件包(software envelope),尝试打造第一批全自动驾驶汽车,它们需要围绕多组因素解决问题。
表1:自动驾驶要素与相关技术
自动驾驶要素 | 相关技术 |
驱动 | 转向、制动和加速 |
云 | 学习和更新高清地图,包括交通数据,以及物体检测、分类和决策的算法 |
感知和物体分析 | 物体和障碍物检测、分类及跟踪 |
驾驶控制 | 将算法输出转换为驱动器的驾驶信号 |
决策 | 规划车辆路径、轨迹和动作 |
位置定位和地图构建 | 数据融合用于环境地图构建和车辆位置定位 |
分析 | 用于监控自动驾驶系统操作、检测故障以及生成建议的平台 |
中间件或操作系统 | 运行算法的中间件和实时操作系统 |
计算机硬件 | 具有高度可靠性的高性能、低功耗系统级芯片(SOC) |
传感器 | 多种传感器,包括激光雷达、声纳、雷达和摄像头 |
(1)感知、位置定位和地图构建
为了完善自动驾驶汽车,该领域各公司现正研究不同的方法,重点放在感知、地图构建和位置定位上。
感知。旨在使用最少的测试和验证英里数来实现可靠的感知水平。这方面目前有两种相互竞争的方法。
专家认为,第二种方法最终会成为许多未来自动驾驶汽车公司青睐的方法。它的重要性可从许多汽车制造商(OEM)、一级供应商以及正在开发自动驾驶汽车的科技公司目前所使用的测试车辆上得到印证。
地图构建(Mapping)。自动驾驶汽车开发人员正在使用两种地图构建方法。
高清粒度地图。为了构建高清(HD)地图,公司通常使用配备了激光雷达和摄像头的车辆。这些车辆沿目标道路行进,创建包含四周环境的360度信息(包括深度信息)的三维高清地图。
特征地图构建。该方法并不一定要求配置激光雷达,可使用摄像头(通常与雷达组合使用)来绘制特定道路特征,实现导航。例如,地图采集了车道标识、道路和交通标志、桥梁以及其他相对靠近道路的物体。虽然这种方法提供的粒度级别要低一些,但处理和更新更容易。
所采集的数据经过(手动)分析,生成语义数据,例如具有时间限制的速度标志。地图制作者可利用一队手动驾驶或自动驾驶的汽车来改进这两种方法,这种汽车要配备持续收集和更新地图所需的传感器组。
位置定位。位置定位可确定车辆在环境中所处的确切位置,是进行导航位置和导航方式有效决策的重要先决条件。位置定位有多种常见方法。
高清地图构建。该方法使用车载传感器(包括GPS)将自动驾驶汽车感知的环境与对应的高清地图进行对比。这一方法提供车辆可用的参照点,让车辆以非常精确的水平确定其具体位置(包括车道信息)和行驶方向。
无高清地图的GPS位置定位。另一种方法依赖GPS来得到大致定位,然后使用自动驾驶汽车传感器来监控环境变化,进而优化定位信息。例如,此类系统使用GPS位置数据和车载摄像头采集的图像。逐帧比较分析可缩小GPS信号的误差范围。GPS水平地理定位的95%置信区间约为8米,相当于沿正确车道或错误(相反)方向行驶的区别。
这两种方法都严重依赖惯性导航系统和测距数据(odometry data)。经验表明,第一种方法通常更可靠,能够实现更加精确的位置定位,而第二种方法则更容易实现,因为不需要高清地图。鉴于两者之间存在的准确度差异,在车辆的准确位置信息对于导航而言并不关键的区域(例如,农村和人口较少的道路),设计人员可使用第二种方法。
(2)决策
全自动驾驶汽车每行驶一英里的路程都需要做出数千个决策。它们需要持续正确地做出决策。目前,自动驾驶汽车设计人员主要使用以下几个方法来确保汽车在正确的道路上行驶。
神经网络。为了确定具体场景并做出适当决策,目前的决策系统主要采用神经网络。但是,这些网络的复杂特性使得它很难理解某些决策的根本原因或逻辑。
基于规则的决策。工程师想出所有可能的“如果-那么”规则组合后,采用基于规则的方法对车辆进行相应编程。由于需要大量时间和精力,并且可能无法涵盖每种可能的情况,所以这种方法不可行。
混合方法。许多专家认为结合了神经网络和基于规则的编程的混合方法是最佳解决方案。开发人员为每个由中央神经网络连接的单独进程引入具有冗余特异性的神经网络,从而解决神经网络固有的复杂性问题。然后,“如果-那么”规则可对这种方法进行补充。
混合方法是目前最常见的方法,特别是与统计推断模型结合使用。
(3)测试和验证
汽车行业在测试和验证技术方面拥有丰富经验。以下是用于开发自动驾驶汽车的典型方法。
蛮力(Brute force)。工程师让车辆行驶数百万英里,通过统计方法来确定系统是否安全并按预期运行。该方法面临的挑战是所需行驶的英里数,这可能需要花费大量时间进行累积。研究表明,自动驾驶汽车需要行驶约2.75亿英里才能以95%的置信度证明,它的故障率最多为每1亿英里发生1.09起致命事故,相当于2013年美国因人为原因造成的交通事故死亡率。为了证明自动驾驶汽车比人类驾驶员的表现更好,所需行驶的英里数可能需要达到数十亿英里。如果100辆自动驾驶汽车以25英里每小时的平均速度每天行驶24小时,每年行驶365天,那么需要超过十年才能累积2.75亿英里的行驶里程。
软件在环(software-in-the-loop)或模型在环(model-in-the loop)仿真。更加可行的方法是将现实世界测试与仿真结合,这样能大幅减少所需的测试英里数,并且汽车行业已熟知这种方法了。仿真通过算法在各种场景下运行车辆,以证明系统能够在各种情境中做出正确决策。
硬件在环(hardware-in-the-loop,HIL)仿真。为了验证实际硬件的运行状况,硬件在环仿真可对其进行测试,并将预先记录的传感器数据提供给系统。这种方法可降低测试和验证成本,增加结果的置信度。
最终,各公司可能会实施涉及上述所有方法的混合方法,以便在最短的时间内实现所需的置信水平。
自动驾驶要来了吗?
司机们还能干多久?
来源:汽车工厂(ID:art-boss ),作者:西门厂长
7月5日,李彦宏坐自动驾驶汽车去参加百度人工智能大会。凭着李总的知名度和自动驾驶的热度,此事吸引了不少眼球,于是乎给人一个感觉:自己会跑的汽车即将进入我们的生活,而司机这个职业将很快消失。那么自动驾驶到底离我们还有多远?
自动驾驶这个梦想恐怕早就有了,不少科幻作品提出这种设想,通用更是早在1939就提出了类似的规划。然而幻想归幻想,技术上实现是需要一步一个脚印的,最初的几个脚印就是各种驾驶辅助系统,比如泊车辅助、车道保持、自适应巡航、自动刹车等等。
2016年有驾驶辅助系统的车辆全球已经超过了1.5亿辆,比2015年增长50%以上。很多高端车型都配备了主动刹车功能,这就离完全自动驾驶又近了一步。
自动驾驶目前还处于群雄逐鹿的时代,业内并没有制定出相关的标准。虽然SAE和NHTSA把自动驾驶按层次分级,但只有最高等级的完全自动驾驶才能算是成功,目前各个团队只是在不停的测试和改进。经过众多企业的长期实践,目前主要有3种技术方案。
相机为主,电磁波雷达为辅。
电磁波雷达为主,相机为辅。
激光雷达、电磁波雷达和相机结合。
所有的方案都还不完善,各有千秋,比如电磁波雷达方案成本低,在路况简单的封闭道路上效果不错,但在路况复杂的街道就不好用。激光雷达方案能应对更加复杂的路况,但是运算复杂,成本高昂。
SAE(美国汽车工程师协会)把驾驶分为6级(L0-L5)。李彦宏7月5日坐的那辆车,应该处于L3级,人基本不必操作,但必须时刻注意路况,遇到危险需要及时介入。五年内,自动驾驶也许能达到SAE的L4级,也就是人基本不必操作,也不必关注路况,但系统还是会遇到不能处理的情况,此时仍然需要人类驾驶员介入。
自动驾驶L4级和L5级必须要应对一些特殊环境,比如没有划线的道路、未铺装道路、甚至电子地图没有覆盖的地区,比如草地、荒原。此外冰雪覆盖的道路,对于图像识别系统来说也是一大难题。要确保可靠性和安全性,这还有待于一系列测试,这将花费数年时间。
对于智能系统,所有硬件的功能最终都需要通过软件来实现,而软件技术还有很长的路要走,数据算法还有待改进。
首先物体分析对于机器来说是个难点。例如,对于停在路边的摩托车和骑车人,在机器看来他们的差别并不大,区别两者并作出正确反应,机器需要进行复杂的计算。
其次识别物体的效果也受到诸多因素限制,比如光线是否明亮,背景和物体的对比是否明显,物体是否运动等等。
最后系统要做出决策,自动驾驶实质上是交通领域的人工智能,要让机器模仿人类的决策,系统必须具备学习能力,这正是难点所在。
感知系统目前有电磁波雷达、声呐、相机和激光雷达。专业人员更看好激光雷达的前景,采用增强激光雷达结合电磁波雷达和相机,此方案功能强大,能适应各种复杂环境,比如狭窄空间,交通繁忙路段,然而挑战是需要开发更强的算法,这正是难点所在。
映射:一种是测绘高清地图,使用配备激光雷达和照相机的车辆,沿着目标道路行驶,360度全方位测绘3D高清地图。还有一种是特征映射,用相机与电磁波雷达相结合,绘制出道路的特征。这个方案像素粒度级别低,但是计算简单和更新容易。
定位:一种方法是使用高精度传感器,把感知到的环境和相应的高清地图对比,车辆可以精确地确定它所处的环境和位置,此方案适用于城市。另一种方案是用GPS的近似定位,结合相机拍摄的图像逐帧对比分析,种方法简,便但精度较差,适用于偏僻地区的道路。
决策:自动驾驶1公里需要做出上千个决策。以前主要是基于规则的决策,这种方法需要预设所有的情景,然后让程序车辆根据预设的程序处理,这样必然有遗漏。今天的决策系统主要采用的神经网络,但这是一种的极其复杂网络,人类很难理解其内部逻辑。许多专家主张采用神经网络和规则编程结合,这个方法可以使神经网络的应用简化。
测试和验证:
“蛮干”,工程师们让测试车辆行驶几百万公里,以统计系统是否安全,这需要大量的时间来积累。而研究表明,自动驾驶需要约4亿公里来证明其可靠性。如果100辆自动驾驶汽车每天行驶24小时,平均时速为40公里,需要十年以上的时间。
硬件在回路下的模拟。在环路中验证实硬件功能,给测试系统输入预先录制的数据,这种方法降低了测试和验证的成本。
软件在回路下模拟。将真实世界与虚拟世界结合在一起,这大大减少了测试里程的数量,而且在汽车行业已经深谙此道,通过模拟车辆在各种路况下行驶的算法,证明一个系统可以在任何情况下作出正确的决定。
自动驾驶说到底就是让汽车拥有人工智能,既然AlphaGo能战胜人类,那么人工智能汽交通也是必然趋势。为此相关企业投下了巨大的赌注,但是开发者们面临着诸多的技术障碍,这些困难不是短时期能够解决的。此外还有安全这个大难题,监管机构的政策必然会保守,这也可能会阻碍创新的步伐。
一网打尽系列文章,请回复以下关键词查看: |
创新发展:习近平 | 创新中国 | 创新创业 | 科技体制改革 | 科技创新政策 | 协同创新 | 成果转化 | 新科技革命 | 基础研究 | 产学研 | 供给侧 |
热点专题:军民融合 | 民参军 | 工业4.0 | 商业航天 | 智库 | 国家重点研发计划 | 基金 | 装备采办 | 博士 | 摩尔定律 | 诺贝尔奖 | 国家实验室 | 国防工业 | 十三五 | 创新教育 | 军工百强 | 试验鉴定 | 影响因子 | 双一流 | 净评估 |
预见未来:预见2016 | 预见2020 | 预见2025 | 预见2030 | 预见2035 | 预见2045 | 预见2050 | |
前沿科技:颠覆性技术 | 生物 | 仿生 | 脑科学 | 精准医学 | 基因 | 基因编辑 | 虚拟现实 | 增强现实 | 纳米 | 人工智能 | 机器人 | 3D打印 | 4D打印 | 太赫兹 | 云计算 | 物联网 | 互联网+ | 大数据 | 石墨烯 | 能源 | 电池 | 量子 | 超材料 | 超级计算机 | 卫星 | 北斗 | 智能制造 | 不依赖GPS导航 | 通信 | MIT技术评论 | 航空发动机 | 可穿戴 | 氮化镓 | 隐身 | 半导体 | 脑机接口 |
先进武器:中国武器 | 无人机 | 轰炸机 | 预警机 | 运输机 | 战斗机 | 六代机 | 网络武器 | 激光武器 | 电磁炮 | 高超声速武器 | 反无人机 | 防空反导 | 潜航器 | |
未来战争:未来战争 | 抵消战略 | 水下战 | 网络空间战 | 分布式杀伤 | 无人机蜂群 | 太空站 |反卫星 |
领先国家:俄罗斯 | 英国 | 日本 | 以色列 | 印度 |
前沿机构:战略能力办公室 | DARPA | Gartner | 硅谷 | 谷歌 | 华为 | 俄先期研究基金会 | 军工百强 |
前沿人物:钱学森 | 马斯克 | 凯文凯利 | 任正非 | 马云 | 奥巴马 | 特朗普 |
专家专栏:黄志澄 | 许得君 | 施一公 | 王喜文 | 贺飞 | 李萍 | 刘锋 | 王煜全 | 易本胜 | 李德毅 | 游光荣 | 刘亚威 | 赵文银 | 廖孟豪 | 谭铁牛 | 于川信 | 邬贺铨 | |
全文收录:2016文章全收录 | 2015文章全收录 | 2014文章全收录 |
其他主题系列陆续整理中,敬请期待…… |
“远望智库”聚焦前沿科技领域,着眼科技未来发展,围绕军民融合、科技创新、管理创新、科技安全、知识产权等主题,开展情报挖掘、发展战略研究、规划论证、评估评价、项目筛选,以及成果转化等工作,为管理决策、产业规划、企业发展、机构投资提供情报、咨询、培训等服务,为推动国家创新驱动发展和军民融合深度发展提供智力支撑。