用 10 周时间,让你从 TensorFlow 基础入门,到搭建 CNN、自编码、RNN、GAN 等模型,并最终掌握开发的实战技能。4 月线上开课,www.mooc.ai 现已开放预约。
雷锋网按:在人工智能大热的当下,拥有强大计算能力的 NVIDIA 走上了发展的快车道,公司 Slogan 也变成了 “引领人工智能计算”。凭借着在 GPU 领域的深耕,NVIDIA 在深度学习和人工智能领域推出了诸多产品,各类超级计算平台和数据处理加速器赫然在列,而 Jetson 平台便是 NVIDIA 诸多此类产品中的一员。
NVIDIA 中国区高级技术经理李铭
具体来说,Jetson 是 NVIDIA 推出的嵌入式人工智能超级计算平台,可以部署在诸多终端(可能是摄像头、无人机、机器人和无人小车等)之上,令其具备人工智能计算能力。而 “嵌入式” 则可以很好地解决这些终端要具备人工智能计算能力所要面临的带宽不足、延迟等问题。
被寄予厚望的 TX2
今年 3 月 8 日,Jetson 家族的新一代产品 Jetson TX2 正式发布,也标志着 NVIDIA 在终端人工智能领域的布局又往前迈进了一步。
Jetson TX2
据雷锋网了解,Jetson 平台此前已有 TK1 和 TX1 两代产品,而且还积累了诸多客户以及应用案例,其中包括思科的电视电话会议系统(人脸识别、智能识别)、法拉赫的工厂自动化(零部件的分拣)、丰田的服务类机器人等。而在国内,也不乏 Jetson 平台的使用者,其中比较知名的有安防领域的企业海康威视,其摄像头产品中便采用了 TX1,此外,京东的送货无人车也是 TX1 的客户。可见,终端人工智能已经深入到了人类日常生活的诸多方面。
事实上,在 TX2 发布前,NVIDIA 中国区高级技术经理李铭便阐述了这款新产品的性能细节。当时,雷锋网获知,相比前一代,TX2 的 GPU 和 CPU 都进行了升级,内存增加、存储增加,支持 Wifi 和蓝牙,编解码支持 H.265,体型同样小巧;套件方面有 USB 接口、SD 卡接口、HDMI 接口等,连上鼠标、键盘以及显示器,实际就是一台电脑,可以进行人工智能开发或日常使用。
Jetson TX1 与 Jetson TX2 的性能对比
另据 NVIDIA 官方介绍,TX2 所提供的性能是之前版本的 2 倍,也就是说能够以 2 倍以上的功效运行,且功率低于 7.5 瓦。这样的性能可让 TX2 在终端应用上运行更庞大、更深度的神经网络,让终端设备更加智能化,同时在执行图像分类、导航和语音识别等任务时在更短的时间内达到更高的精度。
此外,为了方便开发者基于 TX2 平台进行开发,NVIDIA 还配套推出了 JetPack 3.0 的软件开发包,配备的开发工具非常齐全,大大降低了开发者的准入门槛。
正因为 TX2 的性能提升,目前 Jetson 的很多客户都在进行平台迁移。李铭告诉雷锋网,目前 TX2 在向上以及向下兼容两方面都做得比较好,所以以往使用 TX1 的用户转移到 TX2 上完全没有转移成本。
至此,关于 TX2 的各类优势已经非常明晰:无论是性能上的成倍增长、还是开发门槛的降低、亦或是无需平台转移成本。NVIDIA 对这款产品的市场表现同样寄予厚望。
为了让这款产品更加具有说服力,NVIDIA 官方在 TX2 发布一个多月后,再一次举办了一场产品解读活动,详解了一些 Demo,还特地请来了 TX2 的代表性客户海康威视的相关负责人以及资深技术专家分享其与 Jetson 平台结缘的故事以及其在技术上的考量。
在展示 Demo 前,李铭提到了 NVIDIA 的 “AI City”(人工智能城市)构想。在 NVIDIA 眼中,这个世界每时每刻都会产生大量的视频流,这些视频在 2020 年会出自全球超过 10 亿个摄像头。面对海量的数据,只有采用深度学习相关的技术才能加以理解和分析——把像素级的信息直接转化成一种语义,或者说是一种对场景的理解。这些场景包括但不限于智慧交通,未来还有更多的应用场景,最后将覆盖整个城市,形成所谓的 “AI City”。
具体怎么做?李铭向雷锋网新智驾展示了两段视频 Demo。
一段是在美国金门大桥上行车的视频,当 4K 的视频流传输进搭载 Jetson TX2 的工作站后,人工智能终端可以实时解读视频信息,识别车辆、行人、路牌等信息,甚至还能识别出车辆的颜色和品牌型号以及行人的性别、年龄以及手上是否提有物品等信息。
整个数据处理过程遵循:视频流输入-视频解码-使用人工智能的手段识别目标(如车牌、人脸等)并框选-编码、完成本地处理-存储到云端或者显示在监控屏幕上。
另一段则是美国警察在停车场巡逻的视频,搭载了 TX2 的摄像头终端可以监测记录车辆、人口的各类细节信息,如果在停车场发现可疑的车辆和人口,那么系统会自动与内部构建的嫌疑模型比对,警察很快就可以锁定有问题的对象。这样高效率处理视频信息的手段,是安防和公安领域的福音。
李铭表示,以上 “AI City” 相关 Demo 的源代码和 Pipeline 都会打包到 Jetpack 3.0 中供使用者参考。
为什么选择 TX2?
此次,NVIDIA 请来了海康威视研究院高性能计算部总监王鹏和以及资深技术专家蒋超为 Jetson TX2 站台。
海康威视是安防领域全球领先的解决方案提供商。他们在去年与 NVIDIA 共同发布了基于深度学习技术的从后端到前端的全系列安防产品。其双目智能人脸摄像机 “深眸”(前端)与视频云结构化服务器 “猎鹰”(后端)都采用了 NVIDIA 的技术解决方案。
海康威视研究院高性能计算部总监王鹏
王鹏表示,此前选择与 NVIDIA 合作的原因就是看中其在 GPU 以及深度学习方面能力,而且这些年 NVIDIA 在这方面的能力提升也非常迅猛。
王鹏告诉雷锋网,“我们这几年的安防发展目标从原来的‘看得见’转向了‘看得清’。而最近几年人工智能的火热,也让我们有了新方向,就是‘看得懂’”。“看得懂” 其实与 NVIDIA“AI City” 的构想不谋而合,所以其中对于计算能力和海量视频信息处理能力的要求也拔高了,因此 Jetson 平台对于海康威视来说,是非常合适的终端智能化选择。
而在实际效果上,王鹏称,采用了 NVIDIA 的一套技术解决方案后,“我们引以为傲的产品——1U 智能处理服务器 “刀锋” 的计算性能达到了 16T,在 1U 的空间里它的功耗只有 300 瓦。而通用的服务器要达到 14T 左右的性能,它的功耗要达到 8000 瓦以上……”。所以无论从空间还是电力方面,采用这种高性能芯片,对海康威视整个后端部署的成本实施都有非常大的好处。
“NVIDIA 的高性能深度学习引擎以及端到端的解决方案,使得我们能以最快的速度、在最短的时间内把研究成果在产品上落地”,王鹏总结道。
资深技术专家蒋超则将自家的室内机器人带到了现场。在他看来,当一个机器人进入家庭或者商用场合时,它必须解决的一个问题是 “怎么样走路”。这个问题又衍生出三个核心子问题:机器人是否知道自身所处的空间位置?机器人是否知道路在哪里?机器人能否接收使用者的指令?
资深技术专家蒋超(来自猎户星空)
所以,蒋超认为,vSLAM(visual Simultaneous Localization and Mapping,基于视觉的即时定位与地图构建)其实是整个机器人技术最底层、最核心的部分。
最终,当机器人走起来之后,各类传感器会产生相关信息,还有控制指令不断发送给机器人,意味着将形成一个非常复杂的操控网络。在真实的商业场景中,机器人必须当下就能工作。
这里面就产生了矛盾——如果采用 “云计算” 技术或者把数据传回去计算再返回的话,以目前的网络状况来说,是无法达到实时性要求的。
因此这些复杂的计算必须在终端上完成,“我们必须在端上、离用户最近的地方解决问题,所以我们就需要非常强大的计算平台”,蒋超说。
NVIDIA 的 TX1 则提供了很好的计算能力,但计算能力总是不够用的,当蒋超去做应用的时候,还是发现一些局限。“所以当我看到 TX2 的时候,我就非常兴奋,因为 TX2 整体的性能比 TX1 整整提高的一倍,所以就有余下一些空间,让我们做更多的事情。” 而所谓的 “更多的事情” 则包括了 “语义地图” 这样的应用。
蒋超还向雷锋网提到,TX2 能够支持其产品研发的不仅仅是硬件本身,还有非常好的软件——VisionWorks(包含在 Jetpack 3.0 当中),该软件其实是在 OpenVX 这个标准上实现了很多机器视觉的底层操作,还提供编程框架,“我们可以用这些东西去进行快速开发。”
此外,TX2 还可以用在 SLAM 的后端优化上,因为在 CPU 上运行的一些优化工具,性能会有非常大的限制。
2017 新智造成长榜评选启动
雷锋网正式启动 2017「新智造成长榜」评选,旨在寻找智能未来三年十倍的创新变量。
即日起雷锋网接受创新企业的报名,最终榜单将由雷锋网于 7 月份举行的 CCF-GAIR 2017 大会期间公布。
如果您有意参加我们的评选活动,可以点击「阅读原文」,加入榜单评选!