首先谈谈31年前,你创立公司时的一些想法。从那时起,你将公司从一个专注于游戏的GPU公司转型为一个为数据中心行业提供广泛硬件和软件的公司。你能不能先谈谈这个历程?当你开始时,你在想什么?它是如何演变的?你未来的关键优先事项是什么,以及你如何看待未来的世界?
黄仁勋:我想说,我们做对的一件事是,我们预见到未来会有另一种计算形式,它可以增强通用计算,解决通用工具永远无法解决的问题。这种处理器一开始会做一些对CPU来说极其困难的事情,那就是计算机图形处理。
但我们将逐步扩展到其他领域。我们选择的第一个领域当然是图像处理,这与计算机图形处理是互补的。我们将其扩展到物理模拟,因为在我们选择的视频游戏领域中,你不仅希望它美观,还希望它动态化,能够创建虚拟世界。我们一步一步地扩展,并将其引入科学计算。第一个应用之一是分子动力学模拟,另一个是地震处理,这基本上是逆物理。地震处理与CT重建非常相似,是另一种形式的逆物理。所以我们一步一步地解决问题,扩展到相邻行业,最终解决了这些问题。
我们一直坚守的核心理念是加速计算能够解决有趣的问题。我们的架构保持一致,意味着今天开发的软件可以在你留下的大量已安装基础上运行,过去开发的软件可以通过新技术加速。这种关于架构兼容性的思维方式、创建大量已安装基础、与生态系统共同发展的心理从1993年就开始了,我们一直延续到今天。这就是为什么英伟达的CUDA拥有如此庞大的已安装基础的原因,因为我们一直在保护它。保护软件开发者的投资是我们公司自始至终的首要任务。
保护软件开发者的投资是我们公司自始至终的首要任务。展望未来,我们在一路上解决的一些问题,当然包括学习如何成为创始人、如何成为首席执行官、如何经营业务、如何建立公司,这些都是新的技能。这有点像发明现代计算机游戏行业。人们可能不知道,但英伟达是世界上最大的视频游戏架构的安装基础。GeForce拥有大约3亿玩家,仍然在快速增长,非常活跃。所以我认为,每次我们进入一个新市场时,我们都需要学习新的算法、市场动态,创建新的生态系统。
我们需要这样做的原因是,与通用计算机不同,通用计算机一旦构建好处理器,所有的东西最终都会运行。但我们是加速计算机,这意味着你需要问自己,你要加速什么?不存在所谓的通用加速器。
黄仁勋:如果你看看现在的软件,你写的软件中有大量的文件输入输出,有设置数据结构的部分,还有一些魔法般的算法核心。这些算法不同,取决于它们是用于计算机图形处理、图像处理还是其他什么。它可以是流体、粒子、逆物理或者图像领域的东西。所以这些不同的算法都是不同的。如果你创建一个处理器,专门擅长这些算法,并补充CPU处理它擅长的任务,那么理论上,你可以极大地加速应用程序的运行。原因是通常5%到10%的代码占据了99.99%的运行时间。
因此,如果你把那5%的代码卸载到我们的加速器上,技术上,你可以将应用程序的速度提高100倍。这并不罕见。我们经常可以将图像处理加速500倍。现在我们做的是数据处理。数据处理是我最喜欢的应用之一,因为几乎所有与机器学习相关的内容都在演进。它可以是SQL数据处理、Spark类型的数据处理,或者是向量数据库类型的处理,处理无结构或结构化的数据,这些数据都是数据帧。
我们对这些进行极大的加速,但为了做到这一点,你需要创建一个顶级的库。在计算机图形处理领域,我们很幸运有了Silicon Graphics的OpenGL和Microsoft的DirectX,但在这些之外,没有真正存在的库。因此,举个例子,我们最著名的一个库是与SQL类似的库。SQL是存储计算的库,我们创建了一个库,它是世界上第一个神经网络计算库。
我们有cuDNN(用于神经网络计算的库),还有cuOpt(用于组合优化的库),cuQuantum(用于量子模拟和仿真的库),以及很多其他的库,比如用于数据帧处理的cuDF,类似于SQL的功能。因此,所有这些不同的库都需要被发明出来,它们可以把应用程序中的算法重新整理,使我们的加速器能够运行。如果你使用这些库,你就可以实现100倍的加速,获得更多的速度,非常惊人。
因此,概念很简单,而且非常有意义,但问题是,你如何去发明这些算法,并让视频游戏行业使用它们,编写这些算法,让整个地震处理和能源行业使用它们,编写新的算法并让整个AI行业使用它们。你明白我的意思吗?因此,所有这些库,每一个库,首先我们必须完成计算机科学的研究,其次,我们必须经历生态系统的开发过程。
我们必须去说服每个人使用这些库,然后还要考虑它们运行在哪些类型的计算机上,每种计算机都不一样。因此,我们一步一步地进入一个领域又一个领域。我们为自动驾驶汽车创建了一个非常丰富的库,为机器人开发了一个非常出色的库,还有一个令人难以置信的库,用于虚拟筛选,无论是基于物理的虚拟筛选还是基于神经网络的虚拟筛选,还有一个令人惊叹的库用于气候技术。
我们必须去结交朋友,创建市场。事实证明,英伟达真正擅长的事情是创建新的市场。我们现在已经做了这么久,以至于英伟达的加速计算似乎无处不在,但我们确实必须一步步地完成,一次一个行业地开发市场。
现场的许多投资者非常关注数据中心市场,能否分享一下你对中长期机会的看法?显然,你的行业推动了你所称的“下一次工业革命”。你如何看待数据中心市场的现状以及未来的挑战?
黄仁勋:有两件事同时在发生,它们经常被混为一谈,分开讨论有助于理解。首先,我们假设没有AI存在的情况下。在没有AI的世界里,通用计算已经停滞不前了。大家都知道,半导体物理学中的一些原理,比如摩尔定律、Denard缩放等,已经结束了。我们不再看到CPU的性能每年翻倍的现象。我们已经很幸运了,能在十年内看到性能翻倍。摩尔定律曾经意味着五年内性能提升十倍,十年内提升一百倍。
然而现在这些已经结束了,所以我们必须加速一切能加速的东西。如果你在做SQL处理,加速它;如果你在进行任何数据处理,加速它;如果你在创建一个互联网公司并拥有推荐系统,必须加速它。如今最大的推荐系统引擎已经全部加速了。几年前这些还在CPU上运行,而现在已经全部加速了。因此,第一个动态是,全世界价值数万亿美元的通用数据中心将会现代化,转变为加速计算的数据中心。这是不可避免的。
此外,因为英伟达的加速计算带来了如此巨大的成本降低,过去十年中,计算能力不是以100倍,而是以100万倍的速度增长。那么问题来了,如果你的飞机能快一百万倍,你会做什么不同的事情呢?
因此,人们突然意识到:“为什么我们不让计算机来编写软件,而不是我们自己去想象这些功能,或者我们自己去设计算法呢?”我们只需要把所有的数据、所有的预测性数据交给计算机,让它去找出算法——这就是机器学习,生成式AI。因此,我们在许多不同的数据领域大规模应用了它,计算机不仅知道如何处理数据,还理解数据的含义。因为它同时理解多种数据模式,它可以进行数据翻译。
因此,我们可以从英文转换为图像,从图像转换为英文,从英文转换为蛋白质,从蛋白质转换为化学物质。因为它理解了所有的数据,因此可以进行所有这些翻译过程,我们称之为生成式AI。它可以将大量的文字转换为少量的文字,或者将少量的文字扩展为大量的文字,等等。我们现在正处于这个计算机革命的时代。
而现在令人惊讶的是,第一批价值数万亿美元的数据中心将被加速,并且我们还发明了这种新型的软件,称为生成式AI。生成式AI不仅仅是一种工具,它是一种技能。正是因为这个原因,新的行业正在被创造出来。
这是为什么?如果你看看直到现在的整个IT行业,我们一直在制造人们使用的工具和仪器。而第一次,我们正在创造出能够增强人类能力的技能。因此,人们认为AI将超越价值数万亿美元的数据中心和IT行业,进入技能的世界。