专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
36氪  ·  今后,麻六记的酸辣粉不好卖了 ·  昨天  
知产力  ·  附判决 | ... ·  3 天前  
知产力  ·  附判决 | ... ·  3 天前  
51好读  ›  专栏  ›  DeepTech深科技

史上最务实GTC:AI教父黄仁勋把“核弹”藏哪了?

DeepTech深科技  · 公众号  · 科技媒体  · 2019-03-19 09:12

正文


在经过动荡不安的 2018 年,以及表现欠佳的财季发布之后,NVIDIA 在 2019 年的首次 GTC 上宣示了怎样的内容,相当值得我们关注。


而纵观整场GTC,过去几年总有震憾性发布、而被外界称为 "AI核弹大会" 业界年度大事, 在今年却似乎没有太多重磅发布,反而更强调于挖掘既有架构潜力,并加速扩大整体生态实力。

去年因为矿灾,导致产品严重库存,加上消费端市场与服务器端市场需求低于预期,让 NVIDIA 的股价从将近 300 美元,市值近 1800 亿美元,至今下挫近半,虽然不少人认为这只一直以来在 AI 核心技术与娱乐绘图领域发光发热的金鸡母或将就此失去光芒,但做为全球最聪明的公司之一,只要计算的需求不退,AI 的发展仍持续发烧,那么对于 NVIDIA 而言,这些发展过程的波折并不足以拖累其发展脚步。

(来源:DeepTech)

然而 NVIDIA 本身技术优势虽在,但值得注意的是, 从 2019 年开始,挑战只会越来越严苛 ,其最大对手 AMD 在 CPU 市场站稳脚步之后,也重新收拾起荒芜的 GPU 产品线,欲力图振作,并即将在 2019 年 GDC(Game Developers Conference) 上发表最新绘图架构与技术;另一方面,英特尔亦同样重回 GPU 战场,并要同时在计算与娱乐绘图市场向 NVIDIA 发起挑战,并同样要在 GDC 上揭露其即将在 2020 年面世的最新 GPU 架构布局。

当然,原本市场也预期 NVIDIA 在本次 GTC 上将会提前揭露应对这些竞争对手的核心武器,也就是 7nm 的产品布局, 不过可惜的是,NVIDIA 并未发布针对对手产品布局的反应或者是下一代产品, 而是专注于 AI 主题,并最大化的去挖掘 RTX 绘图架构的绘图与计算潜力

产品布局更新以服务器计算方案为主


在 NVIDIA 的主场 GTC 上,黄仁勋依旧维持一贯的舞台风格,皮衣皮裤则是感觉更紧绷了些。


首先进入主题,黄仁勋再次对过去在计算方面的成绩又强调了一次,包括在各种行业中的科学计算、高效率的超级计算机,还有各种针对计算环境的努力,都和 NVIDIA 脱不了干系。

而计算并不只是芯片设计,而是整套的生态环境,黄仁勋在此也进入了主题,他带出了这次最重要的主题之一,也就是 CUDA-X 加速计算环境 ,通过这个一致性的环境,让 NVIDIA 的所有产品都能够得到软件加速的最大好处,而且能够大大的简化开发的流程。

就目前的计算架构而言,大部分都是软件定义的编程工作,如果接入,并取用计算性能的接口能够最简化,那么就能极大的加速整个软件,或者是应用的开发工作。

最聪明的作法就是用最少的工作流程来达到最大的工作成效,而这也是黄仁勋一再强调的,买越多省越多,如果能够大大的加速工作的进行,增加公司的竞争力,这些硬件的支出是相对低成本的。

图|NVIDIA CUDA-X GPU 加速计算“大军”(来源:DeepTech)

黄仁勋也提到,关于架构方面的定义,当计算已经走到现代,架构定义了很多计算的方式,而也决定了未来效能的扩展,以及应用的广度。

而黄仁勋也逗趣的用每个字的开头来去形容他所描述的单一架构可编程扩展性的计算方式,也就是 PRADA(PRogrammable Acceleration Domains Architecture)。

图|今年的 GTC 关键词“PRADA”(来源:DeepTech)

接下来,黄仁勋依旧把 RTX 的光线追踪绘图效果当作宝贝再度秀了一波,他利用电脑绘图和真实照片进行了对比,显示出目前通过 RTX 绘图架构,已经可以做到以假乱真的地步。当然,这部分其实没有太新的东西,但值得注意的是,NVIDIA 所展示的软件效果相较于前几次 GTC 的效果已经更稳定,调整方式也更成熟。

图|RTX powerred 的实时光线追踪(来源:DeepTech)

而提到 RTX 图形架构带来的绘图效果,黄仁勋也再度把已经炒过几次,有点冷掉的 RTX 绘图芯片冷饭再度拿出舞台上炒热,不过这次更强调的是弹性可变动的光线着色能力,以及更大范围、更多元材质的绘图能力与软件支持功能。

黄仁勋也再度提到 Tensor Core 在娱乐绘图卡中能够肩负的工作,就是通过深度学习来降低绘图工作的负载,通过减少计算的图素数量,提高绘图性能表现。

另一方面,黄仁勋也提到, 包含 Unreal 在内的众多游戏引擎供应商也已经把光线追踪的能力整合进去,并且作为默认的功能 ,这也代表未来图灵架构以及其代表的光线追踪优势能力将可更广泛的被游戏玩家所看到,在不远的将来就可摆脱前几个月空有强大光线追踪硬件,却没有光线追踪游戏软件可玩的窘况。

不仅如此,最新的 NVIDIA RTX 图形技术也将走出仅帮助 PC 游戏创建逼真画面的边界,帮助塑造未来的汽车设计。Unity Technologies 和 Nvidia 宣布建立新的合作伙伴关系,将创建一个增强的软件平台,为汽车设计师、制造商和广告客户带来实时光线跟踪技术和高分辨率 3D 渲染。

接下来,黄仁勋讲了点历史,那就是 20 年前首款真正 3D 加速游戏,也就是 ID 软件公司的 Quake 游戏的面世,彻底改变了游戏产业的景象,也改变了游戏绘图硬件的发展,自此之后,所游戏绘图硬件的 3D 化成为不可逆的方向。为了纪念这个大事件,NVIDIA 团对利用公开的 Quacke 源码打造出一个完全光线追踪的版本,通过这个游戏版本的执行,让在场参与者发思古之幽情的同时,也看到通过最新绘图技术的进展可以对老东西造成多么深远的影响。

图|图灵 RTX 对 Quake 的支撑(来源:DeepTech)

另外,针对创造者而言,3D 化的加速功能也改变了整个图像、影像产业的发展,诸多出名的多媒体编辑程序已经先后加入 GPU 计算加速的能力,并通过该功能大大的加速了内容创作的速度与品质呈现。

而通过最新 RTX 世代绘图技术带来的 TensorCore 以及光线追踪计算单元,是在 GPU 的基础之上针对光线与物理等现象的模拟或创作达到更好的效果。而相较起过去使用纯粹 CPU 的计算方式,不只成本更低,效率更高,而且效果更好。

图| CPU vs. RTX 的 Benchmarking data(来源:DeepTech)

买越多省越多 ”黄仁勋又自信满满的讲了这句话。不过,今年这句话又多了个后缀:“But all the RTX technology are free for you to use.”(而所有的 RTX 技术都是免费供你们使用。)

图|RTX 受到了 100 万建筑师、300 万设计师、300 万 3D 设计师和 200 万 M&E 专业人士的支持(来源:DeepTech)

图|GPU 也同时改变了全球电影生态的格局,通过更好的工具,让电影特效的建立可以用更低成本并以更好的效果呈现(来源:DeepTech)

图|黄仁勋也展示了 OMNIVERSE 这个 3D 协同创作工具,让美术从建模、贴材质,到空间设计等原本需要不同软件与工作流程的内容可以同时进行,大大的加速了美术工作的效率(来源:DeepTech)

黄仁勋也把过去的云端游戏平台再度提出来,毕竟大部份的游戏玩家还是缺乏强大的平台来进行游戏,而显卡和 CPU 等相关的成本还是太高,降低成本就变得十分重要。 黄仁勋表示 这次不是类似过去的网络随选游戏平台,而是真正的云端 GeForce 绘图平台,即 GeForce NetWork。目前软银与 LG U+已经加入到这个服务的联盟之中,并将在各地提供服务,玩家可以在网络商店上购买游戏,并通过这个云端平台来执行,通过未来的低时延 5G 技术,我们甚至可以在手机上玩最高端的 PC 游戏,而且画面效果毫不打折。

图|流媒体视频服务领域 ,NVIDIA 与 日本软银集团在日本构建合作伙伴关系,与 LG 在韩国构建合作伙伴关系(来源:DeepTech)

图|黄仁勋宣布推出 RTX Server,拥有 40 个图灵 GPU 和多达 320 个虚拟化 GPU,用于渲染、虚拟化和云游戏(来源:DeepTech)

图像技术之后,GTC 的第二大主题—— AI 登场 。在这个环节开始,黄仁勋首先提到了数据科学的迅猛发展。 近年来, 数据科学是计算机科学领域发展最快的领域,黄仁勋称之为人类新发现的又一支柱 NVIDIA 为了帮助市场上超过三百万个数据科学家解决数据问题,推出了CUDA X,亚马逊、谷歌、微软都已经有使用案例。CUDA X 可以通过NGX 平台免费获得。

(来源:DeepTech)

在这个段落,黄仁勋提到,数据科学研究带来的数据计算需求,也是计算需求成长最快的市场领域,包括各大学的科研、医药、材料等,还有各种 IoT 的传感器的广泛应用,创造的广大的计算需求,这些都需要更有效率的计算方式。要如何应对这些具备庞大量级的数据计算需求,AI,也就是常见的深度学习或机器学习等则是很好的武器。

通过对大量数据的处理、计算,并经过良好的预测模型,最终经过推理的阶段,就可以形成一个针对大量数据计算而得出的合理预测,这个预测可以推测出包含医药开发、社会现象观察、自然科学、物理、天文等各种领域的研究,而这些都可以在 CUDA-X 的生态下达成。

通过对基础计算架构、软件平台、计算模型、不同云服务商的计算服务工作的整合,NVIDIA 为数据研究科学家提供了最好的一致性平台,让这些数据研究与分析工作可以根据数据规模的大小,在不同的平台上面达成、转移或者是建立。

最后,黄仁勋也强调了 TensorCore 在 CUDA-X 生态中所扮演的重要角色,这也代表了,NVIDIA 希望这些 AI 工作,尤其是偏推理的部份,能够更快的转移到 TensorCore 架构上,对 NVIDIA 而言,TensorCore 会成为未来在专业计算中极为重要的角色,甚至不下于原有的 GPU 架构。

图|NVIDIA CUDA-X AI 生态系统。Google,Microsoft、AWS、Accenture 和 Databricks 支持 CUDA-X AI 采用 GPU 加速数据分析,深度学习和机器学习。如今,开发芯片不构建配套生态系统几乎等于徒劳(来源:DeepTech)

而谈到深度学习与云端 AI 计算,黄仁勋也强调, 不同数据精度的支持是非常重要的,毕竟在 AI 环境中所需要处理的数据型态、科技领域,会产生各种不同的数据计算需求,所以某些公司强调的特定精度的效率优势其实并不可靠 ,业界看的是整体,如何能够兼顾最大量的数据处理类型与规模需求,才能让你的计算架构被最大范围的应用到市场当中。

图|黄仁勋宣布 CLARA AI 工具包,可用于构建、管理、部署放射学应用程序,帮助注释图像。这是 AI 在医学上最激动人心的用途之一(来源:DeepTech)

CLARA AI 则是另一个 NVIDIA 提供的重量级 AI 工具,它提供了预先定义好的模型可供使用,当研究者或开发者使用这些模型时,会加入自己的数据来进一步训练,并更产生更精准的结果,而 NVIDIA 则是利用这个过程让预定义的模型更为精准,同时也加速最终模型的产生速度,并直接提供给开发者,作为双赢的经营模式,可大幅加速数据分析工作的进行,加速产业的发展。

图|利用 XGBoost 可以快速的对大量数据进行深度学习,并同时利用视觉化工具显示出结果,同时通过深度学习,可以对数据的未来进行预测,而这在传统的数据处理方式是完全不可能达到的。(来源:DeepTech)

图|NVIDIA 推出专为数据科学设计的工作站,戴尔、联想、惠普将与其合作开发,运行两个 Quadri RTX 8000(来源:DeepTech)

但数据科学的需求并不仅仅是这么简单,甚至可以说处于 supercomputer 和 hyperscalar 之间。这正是 NVIDIA 宣布推出 T4 GPU 用于 Data Science Server,每台服务器都有 4 个 T4 GPU,并与 Mellanox 互连。

图|RAPIDS 工具(来源:DeepTech)


一同亮相的还有 RAPIDS 工具。通过 RAPIDS 工具,可以串连不同的云端计算平台共同处理一件计算工作,形成一个虚拟的超大型超级计算机,这种工具的发布甚至可能改变未来数据中心的设计方式。通过高效能网络,可以串连不同地方的数据中心,形成巨大的计算串列, 而这也是 NVIDIA 之所以要收购 Mellanox 的最大原因。


Microsoft Azure 机器学习(AML)服务是第一个集成 RAPIDS 的主要云平台,RAPIDS 是 NVIDIA CUDA-X AI 的关键组件。通过访问 RAPIDS 开源库库,数据科学家可以使用 AML 服务上的 NVIDIA GPU 以极快的速度进行预测分析。


根据反馈,使用 RAPIDS 的企业可以将培训 AI 模型所需的时间减少多达 20 倍,将培训时间从数天减少到数小时或从数小时减少到数分钟,具体取决于数据集大小。而这也是 RAPIDS 首次本地集成到云数据科学平台。

图|NVIDIA 将以 69 亿美元的价格收购 Mellanox,Mellanox CEO 作为重磅嘉宾上台亮相(来源:DeepTech)


图|本次 GTC 黄仁勋最经典 pose 诞生(来源:DeepTech)


在 GTC 接近尾声之时, 99 美元的 JETSON NANO 似乎承担了“one more thing”的惊喜。 这个响应边缘计算大潮而诞生的产物,是一个应用于机器人 AI开发的计算机,最低功耗可至 5w,看起来 NVIDIA 是要抢树莓派的饭碗了。


图|NVIDIA DRIVE Constellation™(来源:DeepTech)


自动驾驶作为这两年 GTC 的重头戏, 今年 NVIDIA 继 续宣布生态圈的扩大和稳固, 与 Toyota 的合作成为重点 ,双方合作涉及自动驾驶的开发、训练和测试三大方面 ,基于 NVIDIA 这次推出的 NVIDIA DRIVE Constellation™自动驾驶汽车仿真平台,基于云可以在数百万英里的范围内驱动自动驾驶在虚拟世界中的测试和训练,涵盖从常规驾驶到罕见和危险情况各种情景,而且和现实世界相比,兼具更高效率、成本效益和安全性。


图|NVIDIA DRIVE Constellation™的首个合作对向是Toyota(来源:DeepTech)

求稳为主,持续强调身为 AI 基础生态建设的核心价值


虽然挑战严苛,但 NVIDIA 仍然坚持自己的步伐。回顾本次 GTC ,我们也没有看到太激进的消息,或者是手足无措的慌乱感。取而代之的是, NVIDIA 还是一贯的以核心技术作为开场,并且进一步强调自家 GPU 与 AI 计算在技术与应用生态上的优势。

看来是老生常谈?其实没有这么简单。AI 虽然已经从概念开始大量转换成实际的市场模式,但仍有许多未知的市场空间需要开拓,而 NVIDIA 自诩为 AI 生态的开拓者,其在基础理论研究,以及如何更好的发挥 GPU 计算的优势等方向,仍然持续投入了庞大的研究人力,并且在全球范围建立了多家研究院。从基础理论、编程框架、芯片架构、图学、计算学等各个领域进行研究,并取得了相当可观的成果,其为全球开发者引路的决心其实相当令人佩服。

虽然就整体市场风向来看,中国游戏市场的萎缩,以及云端计算基础建设需求成长停滞,都是让 NVIDIA 跌一大跤的关键原因,但 NVIDIA 在包含游戏绘图与云计算的平台产品方面,都还是推出了新产品,其中 RTX 产品线已经全线上阵,其相较于前代较高的性能表现,以及独家的硬件光线追踪能力,使其在市场上具备独一无二的地位。

而作为应对前阵子 AMD 推出的 7nm 主流卡的竞争,并瞄准主流市场甜点定位的 GTX1660 产品,甚至更低端的 GTX1650 产品,也以全新的图灵架构上阵,虽然缺了光线追踪,但是在性能方面则是不打折扣。通过这些产品布局,NVIDIA 继续维持其在市场上的垄断地位,根据 Jon Peddie 的调研报告,NVIDIA 在最新一季的独立显卡市占数据中,依旧维持垄断等级的高水平,达到 81.2%,狠狠的碾压了 AMD。







请到「今天看啥」查看全文