雷锋网将联合英伟达 DLI ,面向 AI 技术从业者,特别推出深度学习课程,对深度学习和英伟达 GPU 加速技术感兴趣的朋友可以参阅文末介绍!
雷锋网按:Drive PX 是 NVIDIA 专门针对自动驾驶的产品线,Xavier 又是 Drive PX 家族中最高阶的计算机。Xavier 最早于 2016 年 GTC Europe 上被公开,到 2017 年 CES 上黄仁勋第一次对外展示了 Xavier 的样机,而在刚刚落幕的硅谷 GTC 上,官方又展示了从 Drive PX2 到 Xavier,从端到云的完整自动驾驶计算平台规划。
NVIDIA Drive PX 是在移动芯片 Tegra 家族的基础上搭建起来的。Tegra 在一开始就提供了传统车载计算平台所不具备的高性能和高能效,因而为辅助驾驶和自动驾驶的开发提供了可能,而经过从 Maxwell - Pascal - Volta 三代架构和工艺的优化,Drive PX 系列在针对深度学习的训练和推理上日益精进。加上与全球各地技术团队、Tier 1 以及车企的自动驾驶开发实践,NVIDIA 在初代 Drive PX 的基础上又形成了一套从传感器融合、高精地图的生成和定位、司机行为检测、驾驶态势感知在内的一系列软硬件配置方案。
可以说到 GTC 2017,NVIDIA 真正完成了自动驾驶计算平台的完整布局,它与 ZF、Bosch 深度绑定,并且与 Tesla 和 Audi 有了明确量产自动驾驶汽车的时间线。对外,NVIDIA 用了 2 年时间从一家提供图形计算芯片的公司变成目前推动自动驾驶商业化链条中最重要的公司。
在移动芯片 Tegra 基础上搭建的自动驾驶超级计算机
2015 年 CES 上,NVIDIA 一下子发布了 2 款车载计算机:用于自动驾驶开发的 Drive PX 和用于数字化座舱开发的 Drive CX。
NVIDIA 对这两款产品的设想是,借助 Drive PX,汽车可以运用深度学习和计算机视觉形成对环境的感知理解,从而实现自动巡航、自动泊车这样的功能;而 Drive CX 除了支撑车载信息系统需要的图形计算外,还会通过对车内和车身周围 360 度影像的处理提供导航和驾驶行为检测。
值得注意的是 Drive PX 和 Drive CX 的内核都是基于 Maxwell 架构的 Tegra X1 SoC(Drive CX 还有一个可选配置是 Tegra K1 SoC)。初代 Drive PX 集成了 2 颗 Tegra X1,最高能支持 12 路高清图像输入,每秒最高能处理 13 亿颗像素点,而 Drive CX 则是整合了一颗 Tegra X1/K1,最高能驱动多个屏幕上总计 1680 万像素点。
实际上,Tegra 家族被应用到车载系统已经由来已久。Tesla Model S 和 Model X 上的中控大屏都是 Tegra SoC 驱动的,而 Audi 2012 年就宣布将采用 Tegra 3 作为车载信息娱乐系统和数字仪表的中央处理器并陆续部署到了后来旗下的全系车型内。
Tegra SoC 让 NVIDIA 很早就进入了 Tesla、Audi、BMW、BENZ 等一批顶级车企的供应商体系,而从 Tegra 开始 NVIDIA 也建立了符合 ISO 26262 ASIL 汽车级安全标准的生产线。
相比于独立的 Tegra SoC,Drive PX 和 Drive CX 带来的变化则是 NVIDIA 希望通过系统集成的方式提供一站式的智能驾驶计算平台解决方案。
Drive PX2,从车载超级计算机到自动驾驶生态
“自动驾驶所需要的计算力,是过去任何一台计算机都没有达到过的。” 黄仁勋后来在公开场合一遍遍重复讲道,这也是 Drive PX 系列追逐的方向。
2016 年,Drive PX2 VS. 百度无人车当时搭载的计算机
第二年的 CES 上,NVIDIA 发布了第二代自动驾驶超级计算机 Drive PX2。Drive PX2 的核心从上一代 Maxwell 架构的 Tegra X1 更新到 Pascal 架构的 Tegra Parker,整体性能从上一代的 2.3 teraflops(每秒万亿次浮点运算) 提升了至少十倍,达到 24 teraflops。
据雷锋网新智驾所知的数据,初代 Drive PX 大约吸引了 50 家左右的开发者,到 2016 年 8 月随着 Drive PX2 推出,这个数字变成了 80 多家,再到 2017 年 5 月开发者数量继续增加到 200 多家。大部分主流车企和 Tier 1 都在早期开始了 Drive PX 平台上的试验和开发,后期推动开发数量快速增长的更多的是中小型的技术公司。
在性能提升之外,Drive PX2 与初代产品最大的差异是 NVIDIA 跟车企、Tier 1 和技术公司们花了一年多时间搭建了一套完整的自动驾驶技术架构 DriveWorks,一套从云端服务器和超级计算机进行大规模训练、在车载计算机上进行小型模型的训练和推理的硬件框架,一套包含物体 / 行人 / 车辆检测、高精地图生成、定位、路径规划等能力在内的软件参考解决方案 / SDK。
云端 + 本地配合的深度神经网络训练平台
NVIDIA DriveWorks 目前提供的 SDK
2016 - 2017 年,Drive PX2 也逐步分化成 3 个版本:
Drive PX2 for AutoCruise,搭载一颗 Tegra Parker,主要支持高速公路自动驾驶和高精地图绘制的计算;
Drive PX 2 for AutoChauffeur,搭载 2 颗 Tegra Parker 和 2 颗独立的 Pascal 架构 GPU,支持点到点的自动驾驶;
Drive PX 2 for Fully Autonomous Driving,由多套 Drive PX2 组成的计算矩阵。
这 3 个版本也说明,基于 Pascal 架构和 Tegra SoC 的 Drive PX2 是具有一定定制空间的。
2016 年 10 月中旬之后 Tesla 量产的每一台 Model S 和 Model X 都会搭载一块 Drive PX2,这块 Drive PX2 也是两家一起定制的。
商业落地的一大步:ZF、Bosch 和 Delphi
2016 年 9 月的 GTC Europe 上,NVIDIA 对外公布了比 Drive PX2 更高阶的 Xavier,到次年 CES 黄仁勋展示了 Xavier 的样机。基于 Volta 架构的 Xavier 把 “性能 / 功耗” 做到了 1 terflops/watt。不过 Xavier 到 2017 年 Q4 才会向客户小批量提供样机。从黄仁勋最近的两次公开演讲看,Xavier 似乎还在持续改进(Xavier 最初公布的性能是 20 terflops/20 watt,到 GTC 2017 已经是 30 terflops/30 watt )。
黄仁勋在 BCW 2017(Bosch Connect World)上说 “NVIDIA 今年会提供能够支撑 L3 自动驾驶的技术,到明年底将提供 L4 自动驾驶能力的技术”。前者指的就是稳定量产的基于 Drive PX2 的方案,而后者指的自然是 Xavier。
2017 年,NVIDIA 率先宣布与 ZF 合作量产基于 Drive PX2 的车载自动驾驶系统 ZF ProAI:
随后到今年 3 月份,NVIDIA 又联合 Bosch 推出 Bosch AI Car Computer:
而在 ZF 和 Bosch 之前,还有一家 Tier 1 更早布局了基于 NVIDIA SoC 的自动驾驶计算机——Delphi。
2015 年 3 月份,Audi 对外公布了驾驶辅助中央控制器 zFAS,zFAS 正是基于 NVIDIA Tegra K1 SoC,并且集成了 Mobileye 的视觉专用芯片 EyeQ3。这一中央控制器也是 Audi 联合 Delphi、NVIDIA、Mobileye 以及 TTTech 一同开发的,其中 NVIDIA 和 Mobileye 分别提供计算平台的 IP,TTTech 负责车载以太网等联网解决方案,设计整合由 Audi 和 Deliphi 完成,最后交由 Delphi 来生产。因为有了 zFAS,Audi A8L 目前也是 “全球第一款量产的 L3 级别自动驾驶车型” 最有力的竞争者。
不过有意思的是,在准备 zFAS 量产的同时,Delphi 和 Mobileye 还共同研发了一套中央感知定位规划自动驾驶系统(CSLP),这是一套面向 OEM 开放的 turnkey 的自动驾驶感知与计算解决方案,计划的量产时间是 2019 年。CSLP 集成了 Mobileye 的 EyeQ4/Q5 以及 REM 系统,同时 Delphi 整合了收购 Ottomatika 之后积累的软件算法。CSLP 在公布之初并没有明确会使用何种平台作为主要的计算平台,不过在 CES 2017 上 Delphi 工程师告诉雷锋网 (公众号:雷锋网) 新智驾他们正在测试不同的 Intel 平台的处理器,晚些的信息也验证了 Delphi 将联合宝马、英特尔、Mobileye 共同研发量产高度自动驾驶解决方案,这是后话。
从 zFAS(Tegra K1 内核)到 ZF ProAI 到 Bosch AI Car Computer,恰好是 NVIDIA Maxwell - Pascal - Volta 3 代架构的演进,也是初代 Drive PX 到 Xavier 的进阶之路。
NVIDIA 通过跟 Delphi、ZF、Bosch 的紧密开发合作,完整布局了各个级别自动驾驶所需要的计算平台,并且摸清了 OEM 和 Tier 1 在自动驾驶开发中所需要的工具和服务。作为一家计算平台提供商,NVIDIA 真正从一家汽车电子 “局外人” 变成了自动驾驶的 “最强大脑”。
附上:从初代 Drive PX 到 Xavier 的工程之美
初代 Drive PX
Drive PX2 for AutoChauffeur
Xavier
在即将开幕的第二届 CCF-GAIR 2017 全球人工智能与机器人峰会上,雷锋网将联合英伟达 DLI ,面向 AI 技术从业者,特别推出一个深度学习开发者专场。对深度学习和英伟达 GPU 加速技术感兴趣的朋友,可以通过这次专场对英伟达 DLI 课程来一个现场体验。
专场的具体议程安排如下
----------------------------------------
NVIDIA DLI Course 英伟达深度学习课程
9:00-10:00
Deep Learning Demystified 揭秘深度学习 (lecture 讲演)
10:00-10:10
Break
10:10-12:00
Getting Started with Deep Learning 深度学习入门 (Lecture with lab 讲演与实验)
13:30- 15:30
Approaches to Object Detection 目标检测的方法 (Lecture with lab 讲演与实验)
15:30-15:40
Break
15:40- 17:40
Image Segmentation Using Deep Learning 使用深度学习进行图像分割 (Lecture with lab 讲演与实验)
17:40- 18:00
Closing Comments & Questions 互动答疑 / 结束
目前,开发者专场门票已经开始火热预售,只需 1999 元即可获得与英伟达官方深度学习团队现场交流的机会,数量有限,售完即止!(详情点击)