北京时间 5 月 10 日24:00,黄仁勋在2017年GPU技术大会(GPU Technology Conference, GTC)上发表主题演讲。随着过去一年AI技术的快速发展,Nvidia这家“意外”成为AI宠儿的公司市值也是节节攀升。
当然,任何聪明的商人都不会放过快速扩张的窗口期。如果读者们还有印象,DT君曾在今年 1 月拉斯维加斯的 CES 上现场报道过黄仁勋的开幕致辞。如果说CES上黄仁勋更多谈到的是公司战略和商业模式,那么一年一度的GTC则是Nvidia引爆各种“核武器”的试验场,势必顺应技术发展潮流推出一批令人印象深刻的硬件产品。
黄仁勋在这场历时两个多小时的演讲中,充满激情的发布一系列最新产品,简单来说就是如下这些:计算加速、Volta架构与Tensor核心、TensorRT、搭载 Tesla V100的DGX与HGX、Nvidia GPU Cloud云平台、Xavier系统芯片及加深度学习速器开源、丰田汽车正式搭载Nvidia Drive PX,以及ISAAC机器人模拟系统。
以下是DT君整理的黄仁勋在本次GTC大会上演讲的大致内容:
Nvidia刚刚于昨天下午公布了一份漂亮的2018财年Q1财报,公司收入增长非常迅速,而且在每个业务领域都有不俗表现。今年我们会带给大家怎样的惊喜?
Nvidia数据中心业务增长非常迅猛,这得益于公司在神经网络方面的技术优势,以及基于Pascal架构产品的出色性能。Nvidia也会继续促进数据业务的发展,同时也会向开发者们提供更高效的硬件和工具,以及更多的培训机会。
微处理器的性能在过去30年提升了近百万倍,但在过去几年中,这一进程慢了下来,不论是在制造工艺改进,还是工业过程控制方面。这导致目前我们似乎走到了一个十字路口。
图丨后摩尔时代
对于CPU来说,GPU是一种有着特殊用途的加速器,而GPU的并行处理能力现在已经成为了一种不可或缺的计算能力,这是Nvidia最初也没想到的。从十年前发布G80到现在,Nvidia已经在GPU领域耕耘了很长时间,也经历了长期的技术积累,现在似乎到了收获的时候。
就拿GPU技术大会来说,参加这个大会的人数在五年间增长了三倍。今天的大会上,全球10家最大的汽车公司在这里,全球最顶尖的10家科技公司在这里,80家AI创业公司在这里。GPU从来没有像现在这样受到如此的关注,这一点令我们非常欣慰。
下面要宣布的是Holodeck计划。这其实是一个全息图像平台,包括VR技术、全动作追踪,以及3D虚拟形象。所有的效果都是实时渲染的。今天的Demo我们找到了著名的超跑厂商柯尼塞格公司,那里的工作人员会以虚拟形象接入现场,画面上的超级派车也是实时渲染的。
图丨Holodeck计划
画面上的机器人都是实时捕捉的真人动作,他们可以使用Holodeck提供的工具来与车辆互动,比如进入驾驶室进行操作,将跑车透明化,展示内部结构,甚至直接分解整部跑车。
图丨Holodeck演示柯尼塞格的工作人员与跑车互动
可能Holodeck现在的效果还不尽人意,但可以看见它会向什么方向发展。沉浸式VR体验、高精度渲染,以及对周围环境的物理模拟。Holodeck平台将在今年9月正式开放。
接下来的话题是“机器学习时代”。黄仁勋展示了在过去五年中,基于AI的神经网络都发展出了哪些能力,并表示我们正在进入一个机器自学、机器自编程的时代,这将是人类技术领域最重要的革命之一。
近期一个重要的创新就是对抗网络,神经网络A尝试其误导神经网络B,但B网络试图对抗这种误导,每次对抗成功,正确的决策行为就会被强化。
图丨用深度学习进行光线追踪
举个例子,用深度学习来试图为一张色彩不完整的图片重新上色,机器自己会知道哪些地方是需要优化的,而不用还原光照条件,同时还节省了大量的计算资源。
当前,全世界最热门的课程之一可能就是机器学习了。比如在斯坦福大学、麻省理工学院等,越来越多的人投入到了这个领域。随着人才的涌入和计算能力的提升,真正迎来了“计算的民主化时代”。
图丨现代AI大爆发
而Nvidia在这个新时代的战略就是:为机器学习创造最高效的平台。黄仁勋也非常自信的表示,世界上所有提供云服务的平台,没有一个不会用到Nvidia的GPU产品。同时Nvidia一刻也没有放松在AI领域的基础科研及应用开发。
图丨Nvidia与1300家深度学习初创公司建立了合作关系
下面将发布的是一个重量级产品,Nvidia投入数千人、耗时数年的研发成果,也是公司历史上难度最大、最昂贵的项目:Tesla V100正式发布!
Tesla V100采用台积电12nm工艺制程,815平方毫米面积,共210亿个晶体管,15Tflops的单精度浮点性能,7.5Tflops的双精度浮点性能,拥有5120个CUDA,16MB缓存,采用16GB HBM2显存,显存带宽为900GB/S。
图丨Tesla V100
Nvidia总共投入了30亿美元来打造这款产品。黄仁勋在发布这款产品时显得非常激动,称Tesla V100的研发是一项几乎不可能完成的任务,令人难以置信。
接下来,黄仁勋通过一系列视频及游戏展示了Tesla V100怪兽级的性能。那些曾经在Titan X上需要数分钟才能处理完成的任务,在Tesla V100上只需要花数秒就能完成。
此外,基于8块Tesla V100搭建的DGX-1也开始预售,价格为149000美元(合100万人民币),预计在今年第三季度交付。
图丨DGX-1
当然,Nvidia还准备了低配版本的DGX Station,搭载了4块Tesla V100,售价为69000美元(合48万人民币)。
此外,新发布的产品还包括Nvidia GPU Cloud, 这款产品为用户提供云端硬件的同时,也提供软件入口,只需要花几分钟进行简单设置,就可以开始运行深度学习相关任务。其优点是全栈优化、实时更新、Nvidia官方负责测试及维护。其测试版将在今年7月推出。
图丨Nvidia GPU Cloud
当然,Nvidia的发布会必然会谈到自动驾驶的话题。黄仁勋宣布,丰田汽车已全面采用Nvidia Drive PX平台。
随后介绍的是Xavier系统芯片,这套搭载Volta架构GPU的系统其实早在2016年就已经公布。Xavier拥有用于负责单线程任务的CPU、负责并行任务的GPU,以及负责深度学习的Tensor内核。Nvidia表示,会将Xavier的深度学习加速器进行开源。
图丨Xavier系统芯片
Xavier系统芯片对AI研究其实是具有重大意义的,但不知为何,黄仁勋在这一部分并没有花太多时间进行详述,而是快速转到了最后一个话题:如何用深度学习来训练机器人。
全新的机器人训练系统ISAAC模拟器,允许人们在虚拟环境下训练真实世界的机器人。由一个GPU来进行物理计算,其他GPU则根据计算出来的物理结果来进行神经网络训练。
图丨ISAAC机器人模拟器
这套机器人模拟器借鉴了遗传学领域的一些算法,并将其应用到神经网络中,去尝试教机器人打高尔夫。