专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
目录
相关文章推荐
爱可可-爱生活  ·  【[54星]mmgp:为消费级Nvidia ... ·  22 小时前  
爱可可-爱生活  ·  [LG]《Statistical ... ·  昨天  
爱可可-爱生活  ·  【[63星]gradio-app/groov ... ·  3 天前  
爱可可-爱生活  ·  基于过程的大语言模型自我奖励机制 ... ·  3 天前  
51好读  ›  专栏  ›  AI科技评论

黄仁勋在GTC上带来什么惊喜?除了TensorRT 3,还有英伟达在自动驾驶的最新动向

AI科技评论  · 公众号  · AI  · 2017-09-26 16:06

正文

AI科技评论 今年是英伟达 GTC(GPU 技术大会)在中国举办的第二年。在 AI 革命势头正劲之际,英伟达创始人兼 CEO 黄仁勋亮相北京。据了解,为期三天的 GTC 盛会将吸引超过 3500 名科学家、工程师和媒体参加。

首日的 英伟达GPU技术峰会上,由 英伟达创始人兼CEO黄仁勋宣布了一系列重要消息,包括新版 神经网络推理加速器 TensorRT 3,与国内OEM厂商联合推出基于 Tesla V100 的 HGX-1 加速器,此外还有更多关于自动驾驶的新动态。本文将围绕英伟达 TensorRT 3 与自动驾驶领域的最近进展做详细介绍。

TensorRT 3

在英伟达GPU技术峰会上,黄仁勋正式发布TensorRT 3 神经网络推理加速器。据官方介绍,TensorRT 3能极大改善处理性能,削减从云到边缘设备(自动驾驶汽车、机器人等)的推理开销。TensorRT 3 是在Volta GPU 实现最优推理性能的关键,比起CPU它能实现高达40倍的吞吐量,时延在7ms之内。目前,对于英伟达开发者计划成员,现在有针对Tesla GPU (P4, P100, V100)和Jetson嵌入式平台的TensorRT 3提供免费下载。

英伟达TensorRT 是一种高性能神经网络推理引擎,用于在生产环境中部署深度学习应用程序。应用有图像分类,分割和目标检测,提供的帧/秒速度比只有CPU的推理引擎高14倍。

TensorRT是世界上第一款可编程推理加速器,能加速现有和未来的网络架构,TensorRT可编译到广泛的目标CUDA GPU中,从120 TOPS到1 TOPS,从250瓦到低于1瓦。

它包含一个为优化在生产环境中部署的深度学习模型而创建的库,可获取经过训练的神经网络(通常使用 32 位或 16 位数据),并针对降低精度的 INT8 运算来优化这些网络。

为何TensorRT 3有着无可比拟的地位,他提到了以下几点:

  • 一是网络设计呈爆发性增长:AI推理平台必须具备可编程性才能运行种类繁多且不断演进的网络架构;新的架构、更深的网络、新的分层设计会继续提升CNN的性能。

  • 二是智能机器呈爆发性增长:AI会将智能诸如到2000万台云服务器、上亿台汽车和制造机器人中;最终,以万亿计的物联网设备和传感器将智能地监测一切,从心率和血压监测,到需维修设备的震动监测;AI推理平台必须可扩展,以解决海量计算的性能、公号和成本需求。

TensorRT 3新的亮点如下:

  • 相较Tesla P100,在Tesla V100上能实现3.7倍的加速,时延在7ms之内

  • 在Tesla V100上进行优化和配置TensorFlow模型时,比起TensorFlow框架能实现18倍的推理加速

  • 轻松使用Python API接口,生产力得到极大改进

据黄仁勋现场介绍,

TensorRT3的性能非常卓越,运行在Volta上的TensorRT3在图像分类方面比最快的CPU还要快40倍,在语言翻译方面则要快140倍。

另外,现场他还提到,神经网络的响应时间或处理延时会对服务质量造成直接影响,运行在V100上的TensorRT在处理图像是可实现7ms的延时,在处理语音是延时不到200ms,这是标准云服务的理想目标,单靠CPU是无法实现的。

TensorRT3能支持Caffe2、mxnet、PaddlePaddle、Pytorch、TensorFlow、theano、Chainer等所有的深度学习框架,将TensorRT 3和英伟达的GPU结合起来,能在所有的框架中进行超快速和高效的推理传输,支持图像和语言识别、自然语言处理、可视化搜索和个性化推荐等AI服务。

自动驾驶新惊喜

在演讲中,黄仁勋提到,现在已是计算新纪元,包括TensorRT在内的NVIDIA多个平台已被BAT等多家科技巨头采用:

  • 目前,NVIDIA TensorRT已经被BAT、科大讯飞、京东所采用;

  • 除了 TensorRT,NVIDIA Tesla V100 AI平台已被BAT、华为、浪潮和联想在内的中国领军IT公司采用;

  • NVIDIA AI 城市平台已被阿里巴巴、海康威视、大华和华为所采用,以解决最大规模的AI和推理难题之一;

那么在自动驾驶领域,黄仁勋又带来了哪些新惊喜呢?

145 家自动驾驶合作伙伴

在今年的 GTC 中国站,英伟达在自动驾驶领域的朋友圈又扩大了。

英伟达 CEO 黄仁勋宣布:通过最前沿的深度学习和计算机视觉计算机,英伟达可以让新兴的初创公司设计新的算法和软件。这其中,已经有 145 家初创公司正在研制基于 NVIDIA DRIVE 的自动驾驶汽车、卡车、高清制图以及服务。

与此同时,另外一个重磅消息是,英伟达 GPU Ventures 战略投资了由前百度自动驾驶事业部总经理王劲创办的自动驾驶公司景驰。

据雷锋网了解,在这一轮融资汇总,景驰获得 5200 万美元资金,由启明创投、华创资本和包括英伟达 GPU Ventures 在内的其他机构及个人参与联合投资。

英伟达在 GPU Ventures Program 下已投公司超过 25 家,横跨 AI、生命科学、自动驾驶、VR等领域

自 2015 年后,英伟达的投资主要聚焦在两个方向:应用 GPU 进行大规模数据处理的公司与应用 GPU 研发自动驾驶技术的公司。

围绕这两个方向,尤其是在自动驾驶领域,英伟达投资了不少这一类型的公司。

据公开消息显示,在今年 8 月,英伟达战略投资了另外一家来自中国的自动驾驶初创公司图森未来,前者在此次投资后持有 3% 后者的股份。更早之前,英伟达还投资了匈牙利 AImotive 和来自美国硅谷的 Drive.ai。

开放的自动驾驶平台:NVIDIA DRIVE

黄仁勋在演讲中表示,英伟达 NVIDIA DRIVE 是一个为自动驾驶行业带来变革的端到端平台。

汽车厂商将训练汽车 AI,共享和车队服务将训练 AI 用于管理车队,自动驾驶计算机可以支持 Level 3、Level 4 和 Level 5 级别的自动驾驶。

这个开放软件栈包含了 ASIL-D OS(Drive OS)、深度学习(Drive PX)、计算机视觉 SDK (Driveworks SDK)到自动驾驶的应用 Drive AV。

需要指出的是,Drive AV 是英伟达开发的自动驾驶应用。这一应用围绕摄像头、雷达和激光雷达的传感数据融合,多种深度学习和计算机视觉算法将为 Level 4、Level 5 级别自动驾驶技术提供所需的多样性和冗余性。英伟达的合作伙伴则能利用这一平台的所有或部分特征。

黄仁勋表示,NVIDIA DRIVE 自动驾驶计算平台支持 Level 3 到 Level5 级别的自动驾驶,并达到 ASIL-D (汽车安全完整性等级最高等级)功能安全。

Perception(感知,利用雷达、激光雷达和其他传感器感知周围环境)、Location(定位)、Planning(规划,比如如何行车变换车道)是自动驾驶三大核心要素。在现场,英伟达展示了这个自动驾驶平台的效果(如上图)。

在今年 5 月的 GTC 大会上,英伟达向外界阐释了自动驾驶计算平台各产品线的定位:

  • Drive PX 2:单个处理器性能可实现 Level 2 到 Level 3 级别自动驾驶,多个 Drive PX 2 的并行使用可实现 Level 4 到 Level 5 级别的自动驾驶。

  • Drive PX Xavier:单个处理器可实现 Level 4 到 Level 5 级别自动驾驶。








请到「今天看啥」查看全文