专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
相关文章推荐
凤凰网科技  ·  DeepSeek创始人梁文锋回老家过年:家乡 ... ·  2 天前  
雷峰网  ·  硬件战火重燃,谁能定义AI耳机? ·  2 天前  
钛媒体  ·  第一批回老家的人,已经后悔县城有房了 ·  2 天前  
钛媒体  ·  刷屏!蛇年春晚黑科技大揭秘 ·  4 天前  
51好读  ›  专栏  ›  腾讯科技

黄仁勋最新万字访谈:我们终将成为超人,不是因为拥有了超能力,而是因为拥有了超级AI

腾讯科技  · 公众号  · 科技媒体  · 2025-02-02 19:12

主要观点总结

英伟达CEO黄仁勋接受访谈,回顾了公司如何由游戏起步,利用GPU的并行处理能力推动计算领域重大突破,并预测了AI未来的应用科学时代。他强调AI将渗透各行各业,未来移动设备将全部成为机器人,人类将成为“超人”。黄仁勋也分享了他对AI的担忧,如偏见、有害性、幻觉等,并呼吁提高AI计算的能源效率。他讨论了Transformer在AI架构中的角色,认为未来会有与现在截然不同的新架构。黄仁勋对英伟达的技术创新感到自豪,并期待其技术影响未来。

关键观点总结

关键观点1: 英伟达的发展历程

英伟达从游戏起步,利用GPU的并行处理能力推动计算领域重大突破,并预测了AI未来的应用科学时代。

关键观点2: AI的未来

黄仁勋认为AI将渗透各行各业,未来移动设备将全部成为机器人,人类将成为“超人”。

关键观点3: 对AI的担忧

黄仁勋分享了对AI的担忧,如偏见、有害性、幻觉等,并呼吁提高AI计算的能源效率。

关键观点4: Transformer在AI架构中的角色

黄仁勋讨论了Transformer在AI架构中的角色,认为未来会有与现在截然不同的新架构。

关键观点5: 英伟达的技术创新

黄仁勋对英伟达的技术创新感到自豪,并期待其技术影响未来。


正文

腾讯科技《AI未来指北》特约作者 涵清
编辑 腾讯科技编译组


1 月 7 日,英伟达 CEO 黄仁勋做客 Huge If True 访谈,与主持人 Cleo Abram 进行了深度对话。

Huge If True 是一档由 Cleo Abram 主持的访谈节目,旨在深入探讨科技、创新和社会变革等前沿话题。 Cleo Abram 曾在 Vox 工作,在之前的节目中采访过扎克伯格(Meta CEO)、Daniel Ek(Spotify 的 CEO)等科技领袖。

在一个小时的访谈中,黄仁勋回顾了我们是如何走到今天的,是什么洞见推动计算机领域发生了如此重大的突破;他畅谈了他对当下正在发生的一切事情的看法,并对人工智能的未来做了大胆的预测。

• 起点:缘起于游戏。90 年代电子游戏对 3D 图形的需求催生了 GPU,而GPU 的核心优势在于其并行处理能力,这与传统 CPU 的串行处理模式截然不同。


• 关键:CUDA 的推出使得研究人员能更便捷地利用 GPU 的算力,加速了人工智能的发展。


• 突破:AlexNet。2012 年 Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 提出的 AlexNet 深度卷积神经网络,在 ImageNet 竞赛中取得突破性胜利,开启人工智能革命的序幕。


• 现在:AI 应用时代。黄仁勋认为,过去十年是人工智能的科学研究阶段,而未来十年将是人工智能的应用科学时代,AI 将渗透到各行各业。


• 未来:黄仁勋预言,未来一切移动的设备都将是机器人,并且人类将成为“超人”。

以下为专访内容全文,由腾讯科技编译,为保证阅读体验,对口语化内容有所删减。本文无投资建议,仅供读者阅读和分享。




过去:我们是如何走到今天的

从游戏机到计算机,我们如今所处的计算领域,是如何走到这一步的?

主持人:为了讨论我们现在所处的这个人工智能的关键时刻,我认为有必要回溯 90 年代的电子游戏产业。当时,游戏开发者们希望创造出更加逼真的图形,但硬件的能力无法满足所需。英伟达当时提出了一个解决方案,这个方案不仅改变了游戏行业,也改变了整个计算机运算领域。


您能否带领我们回到那个时代,解释一下当时的情况,以及是什么样的洞见促使您和英伟达团队创造了第一个现代 GPU?



黄仁勋:在 90 年代初,当我们刚开始创建公司时,我们观察到,在软件程序内部,只有少数几行代码,可能只占 10% 的代码,却完成了 99% 的处理任务。而且这 99% 的处理任务是可以并行完成的。然而剩下的 90% 的代码则必须按顺序执行。事实证明,真正完美的计算机是可以同时进行顺序处理和并行处理的计算机,而不是只能进行其中一种处理的计算机。


这是我们当时最重要的发现,基于此,我们开始创建一家公司,致力于解决普通计算机无法解决的计算难题。


这便是英伟达的真正开端。



1、缘起于电子游戏


主持人:为什么首先选择游戏?


黄仁勋:电子游戏需要并行处理来渲染 3D 图形。我们选择电子游戏的原因有两点:


第一,我们热爱这个应用,它本质上是对虚拟世界的模拟,而谁又不想进入虚拟世界呢?


第二,我们敏锐地观察到,电子游戏有潜力成为有史以来最大的娱乐市场。


事实证明,我们的判断是正确的。拥有一个庞大的市场至关重要,因为这项技术非常复杂。如果市场足够大,我们的研发预算就可以相应增加,从而能够创造出更多新技术。技术、市场和更强大的技术之间形成的良性循环,真正推动了英伟达成为世界上最重要的科技公司之一。


这一切的起点,都源于电子游戏。



主持人: 我听说你曾说过 GPU 就像一台时间机器?


黄仁勋:是的。


主持人:你能解释下这么说的原因吗?


黄仁勋:GPU 就像一台时间机器,因为它能让你更早地看到未来。


一位量子化学科学家曾对我说过一句令我印象非常深刻的话。他说:“因为英伟达的工作,我可以在有生之年完成毕生研究。” 这就是时间旅行。他能够在有生之年完成原本超越他生命长度的工作,这是因为我们让应用程序的运行速度大幅提升,使你能够看到未来。


所以,当你进行天气预报时,你实际上是在预测未来;当你在虚拟城市中通过仿真测试自动驾驶汽车时,实际上是在进行时间旅行,模拟未来的驾驶场景。



主持人:因此,并行处理技术在游戏领域取得了巨大成功,它使我们能够在计算机中创造出过去无法想象的世界。游戏是并行处理技术最初的绝佳应用案例,它释放了巨大的算力。


正如您所说,后来人们开始在许多不同的行业中运用这项技术。以量子学研究人员为例,他在 NVIDIA GPU 上并行运行分子模拟的速度,甚至比以前在超级计算机上使用 CPU 运行的速度还要快得多。


这项技术也在彻底改变着其他行业,在 2000 年初,它开始改变我们对计算机潜力的认知,您看到了这一点,并意识到这样做实际上有些困难,因为当时研究人员必须“欺骗” GPU,让 GPU 认为他们的问题是图形问题。


黄仁勋: 完全正确,你做了一些研究。


2、CUDA是什么?


主持人:所以你创造了一种让这一切变得容易得多的方法。



黄仁勋:没错。


主持人:具体来说,这是一个名为 CUDA 的平台,它让程序员可以使用他们已经熟悉的编程语言来指示 GPU 执行操作。


这非常重要,因为它使得更多人能够更容易地利用这些强大的计算能力。你能解释一下,是什么样的愿景促使你创建了 CUDA ?



黄仁勋:CUDA 的诞生,一部分源于研究人员的发现,一部分源于内部的灵感,还有一部分是为了解决实际问题。你知道,许多有趣的想法都是在这样的复杂背景下产生的。有些想法是出于渴望和灵感,而另一些则纯粹是出于解决问题的紧迫感。


在 CUDA 的案例中,情况也是如此。最早将我们的 GPU 用于并行处理的外部想法,可能源于医学成像领域的一些研究。当时,麻省总医院的一些研究人员正在尝试使用我们的图形处理器进行 CT 重建。他们的工作给了我们很大的启发。


与此同时,我们在公司内部也面临着一个挑战:当你想为电子游戏创造逼真的虚拟世界时,你不仅希望它看起来很漂亮,还希望它能够动态地变化。例如,水应该像真实的水一样流动,爆炸应该有真实的爆炸效果。


这意味着你需要进行粒子物理模拟和流体动力学模拟。但如果你的计算流程只能处理计算机图形,那么这些模拟就很难实现。因此,我们有很强的内在动力,希望在自己服务的市场中解决这个问题。


此外,一些研究人员也在尝试将我们的 GPU 用于通用计算加速。所有这些因素汇集在一起,最终促使我们决定采取行动,正式开发了 CUDA。


从根本上说,我坚信 CUDA 会取得成功,并且我们为此投入了整个公司的资源,因为我们知道,我们的 GPU 将会成为世界上产量最高的并行处理器,而庞大的电子游戏市场保证了这一点。因此,这种架构有很大的潜力惠及更多人。


主持人:在我看来,创建 CUDA 像是一个难以置信的那种“如果成真就太好了”的事情,你在说,如果我们创造一种让更多人使用更多计算能力的方式,它们可能会创造出令人难以置信的东西。然后,它变成了现实。


3、为什么 AlexNet 如此重要?


主持人:2012年,一个由三名研究人员(分别是Ilya Sutskever、Alex Krizhevsky 和 Geoff Hinton,如今他们已成为AI领域大名鼎鼎的人物了 )组成的小组,提交了名为 AlexNet 的参赛作品,参加了著名的 ImageNet 竞赛。


该竞赛旨在创建能够识别图像并进行分类标记的计算机系统。他们的作品直接击败了所有竞争对手,以极低的误差率震惊了所有人,它被称为 AlexNet,是一个卷积神经网络。



它之所以如此出色,是因为他们使用了海量的数据进行系统训练,并且这项工作是在 NVIDIA GPU 上完成的。


突然之间,GPU 不再仅仅是使计算机运行更快、效率更高的工具,而是成为了全新计算模式的引擎。我们正在从使用逐步指令引导计算机,转变为通过展示大量示例来训练计算机学习。


2012 年的这个时刻,是否真正开启了我们现在所看到的人工智能的巨大变革?您能否从您的角度,来描述一下那一刻的情景,以及您认为它对我们所有人的未来意味着什么?



黄仁勋:当你创造像 CUDA 这样的新事物时,即使你建造了它,他们也可能不会来,这是悲观者的观点;但乐观主义者的观点会说,但如果你不建造它,它们就不能来。这通常是我们看待世界的方式,我们必须凭直觉来推断为什么这会非常有用。


事实上,在2012年,多伦多大学的 Ilya Sutskever、Alex Krizhevsky 和 Geoff Hinton 在他们所在的实验室开始使用 GeForce GTX 580,因为他们了解到 CUDA,并认为 CUDA 可以作为训练 AlexNet 的并行处理器,所以我们的灵感是 GeForce 可以成为将这种并行架构带入世界的载体。



与此同时,我们正在公司内部努力解决计算机视觉问题,并且努力使 CUDA 成为一个好的计算机视觉处理器,我们对内部计算机视觉的早期开发进度感到沮丧,并且 CUDA 无法提供更多的帮助。


突然之间,我们看到了 AlexNet,这是一种与以前的计算机视觉算法完全不同的新算法,它在计算机视觉的能力方面取得了巨大的飞跃。


当我们看到这一点时,一部分是出于兴趣,另一部分是因为我们自己也在因工作推进不顺利而挣扎。所以当看到 AlexNet 时,我们受到了启发。


但我要说,最大的突破是当我们看到 AlexNet 时,我们问自己,AlexNet 能走多远?如果它能用计算机视觉做到这一点,它能走多远?如果它能达到我们认为它能达到的极限,那对计算机行业意味着什么?那对计算机架构意味着什么?


我们有理由推断,如果机器学习、深度学习架构可以扩展,那么绝大多数机器学习问题都可以用深度神经网络来覆盖。


我们可以用机器学习解决的问题类型如此之多,以至于它有可能彻底重塑整个计算机行业,这促使我们重新设计了整个计算堆栈,这就是 DGX 的由来,而这个小小的 DGX 就坐在这里,这一切都来自于我们逐层重新设计整个计算堆栈的观察。


你知道,自 IBM System 360 推出现代通用计算 65 年以来,我们已经彻底重塑了我们所知的计算方式。


主持人:把这看作一个完整的故事,所以并行处理重新塑造了现代游戏,并彻底改变了一个完整的行业,然后那种并行处理的计算方式开始在不同的行业中使用。


你通过构建 CUDA 来投资它,然后 CUDA 和 GPU 的使用使得神经网络和机器学习飞速的发展,并开始了一场我们现在看到的计算革命。




现在:世界正在发生什么?

人工智能和深度学习具备了一项革命性能力:它可以学习并转化几乎任何形式的数据


1、英伟达的核心信念


黄仁勋: 计算机视觉、语音识别、语言理解——这些曾经被认为无解的人工智能难题,在短短几年间相继被攻克。一个接一个地被突破,令人惊叹不已。


主持人: 是的,我们看到你很早以前就为此做出风险很高的赌注。我作为一个外行人,认为这需要很长的时间才能实现,你坚持了多久?


黄仁勋:10 年。


主持人:这 10 年你感觉怎样?


黄仁勋:这是个好问题。首先你必须有核心信念。


我们应当深入理解行业和科学,但最根本的是要始终遵循第一性原理思维。


在探索的过程中,有时我们能找到证据证明方向正确;但更多时候,走了很长的路却找不到任何验证,这时就需要适时调整航向。


为什么我们能够长期坚持?答案很简单:因为我们对这个方向深信不疑,所以没有理由不继续前行。


我对英伟达的信念已经持续了 30 多年。我坚信我们在革新计算领域所做的一切,不仅在今天依然有效,而且比过去任何时候都更具价值。


当然,前进的道路上难免会遇到重重挑战。但你必须对未来有信念,持续投资自己。正是这份坚定的信念,驱使我们投入数百亿美元,最终实现了目标。那确实是漫长的 10 年历程,但整个过程充满快乐。


主持人: 你如何总结这 10 年的核心信念?计算机究竟应该如何为人类工作?对未来几十年,你又有哪些判断?


黄仁勋:第一个核心信念聚焦于加速计算,特别是并行计算与通用计算的结合。通过将多个处理器结合在一起,我们能够实现计算加速。这个理念我至今依然坚信不疑。


第二个核心信念源于对深度神经网络(DNN)潜力的洞察。自 2012 年问世以来,这些深度神经网络展现出了强大的能力,能够从各类数据中提取模式和关联。更重要的是,这些网络具有优秀的可扩展性——通过扩大规模,它们能够学习更为精细的特征;通过增加深度或宽度,它们的性能也能相应提升。这种架构上的可扩展性已经在实践中得到了充分验证。



经验表明,模型和数据规模的增长与知识获取量呈正相关。那么,这种增长是否存在上限?除非我们遇到物理、架构或数学层面的根本限制,否则这种扩展似乎可以持续下去。


这就引出了一个关键问题:我们究竟能从数据中学到什么?从经验中获取什么?实际上,数据就是人类经验的数字化呈现。我们已经看到,机器可以通过图像学习物体识别,通过声波掌握语音辨识,甚至仅仅通过研究海量的文字符号就能理解语言、词汇和语法规则。



如今,我们已经证实人工智能和深度学习具备了一项革命性能力,它可以学习并转化几乎任何形式的数据。


这种能力意味着什么?让我们来看看这些令人振奋的可能性:


在文本领域,AI可以实现文本间的转化,比如文章摘要和语言翻译;在视觉领域,它能将文本转化为图像(图像生成),或将图像转化为文本(图像描述);在生物领域,它甚至能够将氨基酸序列转换为精确的蛋白质结构。


展望未来,我们还将实现从蛋白质到自然语言的转换,使我们能够提出诸如"这种蛋白质的功能是什么"或"请举例说明具有特定特性的蛋白质"这样的问题。


既然AI已经可以将文字转化为视频,那么将文字转化为机器人的动作指令又有何不同?从计算机的底层逻辑来看,这些转换本质上是相通的。这打开了一扇通向充满机遇与挑战的大门,正是这些无限可能让我们对未来充满期待。


2、为什么此时此刻如此与众不同?


主持人:我感觉我们正站在一场巨大变革的风口浪尖上。回顾过去十年,我们确实经历了翻天覆地的变化。但展望未来十年,我发现自己已经无法准确预测,我们将如何运用当下正在开发的这些技术。


黄仁勋:你的感受非常准确。这种难以预测的感觉源于一个重要的转折点:过去十年主要聚焦于人工智能的基础科学研究。而接下来的十年,虽然人工智能的科学突破仍将持续,但更具标志性的是我们即将进入人工智能的应用科学时代。


这是一个从基础研究到实践应用的重要转变。现在的核心问题已经转向了具体应用:如何将人工智能应用于数字生物学?如何将人工智能用于气候技术研究?如何让人工智能服务于农业、渔业、机器人技术?如何通过人工智能优化运输和物流系统?如何利用人工智能改革教育教学?如何将人工智能融入播客等媒体形式?


3、机器人的未来是什么样子的?


主持人:让我们聚焦其中几个具体例子,来帮助大家更好地理解我们所讨论的这场计算革命将如何实质性地改变人们的生活体验,以及人们将如何实际运用这些新兴技术。


在我们刚才讨论的诸多领域中,物理人工智能特别引起了我的兴趣。这里的物理人工智能不仅包括人形机器人,还包括自动驾驶汽车、智能建筑、自主仓库、智能割草机等各类实体智能系统。根据我的了解,这些机器人的能力可能即将迎来一个重大突破,这源于我们在训练方法上的革新。


在过去,机器人的训练面临两个主要限制:


一是必须在现实环境中进行训练,这可能导致设备损坏和磨损。


二是只能从有限的数据来源获取训练数据,比如穿着动作捕捉服的人类。这些限制导致机器人无法获得足够多的学习样本,从而影响了它们的学习效率和速度。



但现在,我们开创了在数字世界中训练机器人的新纪元。这种突破性的改变带来了几个关键优势:机器人可以进行更多次数的训练重复、适应更多样化的条件,并且大幅提升学习效率。这让我们很可能正站在机器人技术大爆发的前夜,而英伟达正在开发强大的工具来推动这场革命。


具体来说,你们开发的 Omniverse 平台提供了一个完整的 3D 虚拟世界,使机器人系统能够在不依赖物理环境的情况下进行训练。更令人振奋的是,你们最新发布的 Cosmos 技术进一步提升了这个 3D 宇宙的真实度。


举个例子,如果我们要在这张桌子上训练机器人,Cosmos 可以模拟:各种不同的光照条件、一天中不同时段的环境变化、丰富多样的场景体验等,这些进步使得机器人能够从 Omniverse 中获得远超以往的学习经验。



在我的童年时代,我深深着迷于《星际迷航》中描绘的机器人世界。从现在我们已经实现的机器人技术出发,您认为通往这个充满未来感的机器人世界,我们还需要哪些重要突破?


黄仁勋:让我以 ChatGPT 这个语言模型为例,来帮助理解 Omniverse 和 Cosmos 的发展逻辑。ChatGPT 最初版本虽然在文本生成方面表现出色,但在处理长文本或不熟悉的主题时,常常会产生"幻觉"——即生成看似合理但缺乏事实依据的内容。


为应对这一问题,新一代模型引入了上下文学习能力,通过接入 PDF 文档和搜索引擎作为事实基础,从而能够基于可靠信息进行推理和回答。在此基础上,它可以推理出如何生成你所要求的答案。


因此,第一部分是生成式人工智能,第二部分是基本事实。现在让我们将视角转向物理世界。要让机器人真正理解物理环境,我们需要构建一个类似于 ChatGPT 核心模型的世界模型。


这个模型必须准确理解:基础物理定律(重力、摩擦力、惯性)、空间几何认知、物体永久性(物体在视线之外依然存在的概念)、因果关系(如物体倾斜导致倒下的关系)这些物理常识必须被编码到一个世界基础模型中,这正是我们通过 Cosmos 实现的目标——创建一个"世界语言模型",就像 ChatGPT 是文本语言模型一样。



接下来,我们必须像处理 PDF 和上下文那样,用真实数据对其进行基础化处理。这就是为什么我们用物理模拟来增强 Cosmos。Omniverse 采用基于牛顿物理学原理的求解器,将我们长期以来理解的基本物理定律编码其中,使其成为一个精确的模拟器。


通过使用这个模拟器调节 Cosmos ,我们能够生成无数符合物理规律的场景预测。Omniverse 加上 Cosmos 的组合,就像是将搜索能力赋予 ChatGPT 一样,让我们能够在物理世界中产生无限可能的、基于真实物理法则的互动场景。


主持人: 让我用一个具体的工厂场景来说明这项技术的革命性:假设我们需要训练一个工业机器人学习所有可能的运动路线。传统方法需要在实体工厂中进行反复训练,这不仅耗时数天,还会导致机器人硬件的严重损耗。


而现在,借助数字模拟技术,我们可以在极短时间内完成全部路线的训练。更重要的是,我们能够模拟机器人在各种复杂环境下的表现——比如光线不足、视线受阻等多种工况。这种突破性的训练方法大大加快了机器人的学习速度。


从这个角度来看,未来的机器人技术将会与当下有着质的不同。




未来十年的愿景

未来,所有会移动的设备都将进化成为机器人,并且人类将成为“超人”


主持人: 如果把时间线拉长到十年,您认为人们在不久的将来会如何与这项技术互动?


黄仁勋: 在不远的将来,所有可移动的设备都将进化为机器人,这个转变正在加速到来。想想看,人们还在手动推割草机这件事本身就显得有些过时了。这不仅效率低下,而且完全没有必要。同样的道理,每一辆汽车都将成为自主运行的机器人。至于人形机器人,实现这一技术的所有要素已经触手可及。


所有会移动的设备都将进化成为机器人,它们将在 Omniverse Cosmos 平台中完成学习进化。在这个平台上,我们可以生成无数符合物理规律且逻辑合理的未来场景,机器人在虚拟环境中学习后,再将所学运用到现实世界中。


这个过程就像人类的学习一样自然。可以预见,在不久的将来,我们的生活环境将不可避免地被智能机器人所环绕。作为科技爱好者,我特别期待能拥有一个类似星球大战中 R2-D2 那样的个人助手。


这位个人助手可能会以多种形态存在,但本质上都是同一个 R2。它将无处不在地陪伴着我:有时以虚拟助手的形式出现在我的智能眼镜中,有时存在于我的手机里,有时又体现在我的电脑中,当然还包括我的智能汽车系统。


甚至当我回到家中,还能与一个实体版本的 R2 互动。无论它以什么形式出现,我们都能与之自然交流。我坚信,在未来每个人都将拥有一个类似 R2-D2 这样的终身数字伙伴,它会随着我们的生活经历不断成长进化,这已经是一个确定的未来图景。


1、黄仁勋对 AI 的担忧


主持人: 我觉得很多新闻媒体在谈论人工智能高度发达的未来时,往往会关注可有危害的地方, 您会考虑哪些方面?


黄仁勋: 嗯,有很多大家都在谈论的事情——偏见、有害性或仅仅是幻觉。


比如,人工智能会自信地说一些它一无所知的事情,结果我们却依赖于这些信息。这是生成虚假信息、假新闻或假图像的一种方式。


当然还有伪装,它能如此出色地伪装成人类,甚至可以非常完美地伪装成特定的人。


所以,我们需要关注的领域范围相当清晰,并且有很多人正在努力解决这些问题。 其中一些与 AI 安全相关的问题,需要深入研究和工程设计。


有些时候,它想做正确的事情,只是执行得不对,结果伤害了别人。


比如,自动驾驶汽车想要好好地、正确地行驶,但不知怎么的,传感器坏了,或者它没有检测到某个东西,或者它做了一个过于激进的转弯之类的。它做得不好,它做错了。


所以,需要进行大量的工程工作,以确保 AI 安全得到保障,确保产品功能正常运行。


还有最后一点,如果 AI 想要做好事,但系统却失败了会怎么样?


我的意思是,AI 想要阻止某事发生,但当它想做的时候,机器却坏了。


这与飞机上的飞行计算机没有区别,系统内部有三重冗余。然后有两名飞行员,还有空中交通管制,还有其他飞行员在观察这些飞行员。所以,AI 安全系统必须作为一个社区来构建,确保这些 AI 首先,能够正常工作,功能正常。当它们不能正常工作时,不会使人们陷入危险。并且周围有足够的安全和保障系统,以确保我们保持 AI 的安全。


所以,这个讨论范围非常广泛,我们需要将各个部分拆开,作为工程师来构建。


2、提升能效是我们的首要任务


主持人: 如今,我们所处的时代令人振奋,因为我们不再受限于传统 CPU 和串行处理的技术瓶颈。我们不仅开创了一种全新的计算模式,也开启了持续进步的通道。并行处理的物理特性与以往 CPU 的改进方式截然不同。


我非常好奇,您认为当前世界在科学和技术领域面临的主要挑战是什么?


黄仁勋:  嗯,究其根本,所有问题的核心都归结于在既定的能量限制下,我们能完成多少工作。


这实际上是一个物理限制,信息传输和比特翻转的物理定律决定了所需能量的下限,从而限制了我们所能实现的工作量。


同时,我们所拥有的能量也限制了我们的能力。虽然如此,我们远未触及阻碍我们前进的根本性障碍。


因此,我们正致力于研发更高效、更节能的计算机。比如,这款小型计算机,它的升级版价值 25 万美元(DIGITS)。我们交付的第一个版本只是一个原型机。


2016 年,我向 Open AI 交付了首个正式版本 DGX 1,售价为 25 万美元。它的能耗是当前版本的 1 万倍,而当前版本的性能却是它的 6 倍。



我们的确身处一个全新的时代。


仅仅在 2016 年至今的八年时间里,我们在计算方面的能源效率就提升了 1 万倍。


试想一下,如果汽车或电灯泡的能源效率也能提升 1 万倍,那么一个原本 100 瓦的灯泡,现在只需 1 万分之一的能耗就能产生同样的亮度。


因此,我们一直在努力提高计算,特别是 AI 计算的能源效率,这至关重要,因为我们希望创建更智能的系统,并利用更强大的计算能力来增强智能。


因此,优化计算能效始终是我们的首要任务。


3、Transformer 可能是算法演变过程中的垫脚石


主持人: Transformer 是一种非常流行的、相对较新的 AI 架构,它被广泛应用于各种工具中。它之所以受欢迎,是因为它的结构有助于“关注”关键信息,从而产生更优异的结果。



虽然可以制造专门针对特定 AI 模型的芯片,但这会降低芯片的灵活性。因此,一个争议点在于:我们是否应该将赌注“固化在芯片中”,设计出高度定制化的硬件?还是应该保持硬件的通用性?


我想请教您,您是如何做出这些决策的?您是如何权衡是选择一辆可以自由行驶的汽车,还是选择优化一列只能往返于 A 地和 B 地之间的火车? 在进行高风险的投资时,您是如何看待这个问题的?


黄仁勋: 是的,这个问题又回到了你最初的提问,也就是我们的核心信念是什么。


英伟达的核心信念,其焦点在于——Transformer 是研究人员能够发现的最后一种 AI 算法或架构,还是认为 Transformer 只是一个跳板,未来将会演化出与现在截然不同的新架构?我们坚信后者。


理由很简单,我们只需要回顾历史,反思一下,在计算机算法、软件、工程和创新的发展历程中,是否曾有一种理念能够长期保持不变?答案是否定的。


这正是计算机的迷人之处,它能在今天实现十年前人们无法想象的事情。


因此,我们坚信创新的多样性和发明的丰富性,我们希望构建一个开放的架构,让发明家、创新者、软件工程师和人工智能研究人员都能在这里自由探索,并提出令人惊叹的设想。


Transformer 的一个基本特征是其“注意力机制”,这个机制让 Transformer 能够理解每一个词与其他所有词之间的含义和关联。


举例来说,如果有 10 个词,Transformer 必须分析这 10 个词之间的相互关系。但如果词的数量增加到 10 万,或者上下文扩展到需要阅读 PDF 文档,甚至是大量的 PDF 文档,并且上下文窗口达到百万级别的 token,那么要处理所有词之间的关系就变得不可能了。



因此,解决这个难题的方法是引入各种新的概念,比如 Flash Attention、Hierarchical Attention 或者我最近看到的 Wave Attention


自从 Transformer 出现以来,人们创造了许多不同的注意力机制,这非常了不起。


我认为这种创新会持续下去,我们对此充满信心。


计算机科学的探索不会停止,人工智能研究人员也不会放弃,我们更是如此。

拥有一个能够支持研究、创新和新想法的灵活计算机,从根本上来说至关重要。


4、芯片制造


主持人:英伟达专注于设计芯片,但其中会需要一些其他的公司负责组装芯片,有些公司负责硬件,使其能够在纳米尺度上工作。


在这种背景下,英伟达如何在物理限制框架下做可行的角度来设计?在推动技术边界的过程中,贵公司主要集中在哪些方面的技术突破?


黄仁勋:  我们的做法是,即使我们与台积电等公司合作生产芯片,我们依然认为自己需要具备与台积电同等水平的专业知识。因此,公司内部有许多在半导体物理学方面拥有深厚造诣的专家,帮助我们深刻理解半导体的能力极限,并与这些专家紧密合作,共同探索技术边界,始终致力于突破这些限制。


在系统工程和冷却技术方面,我们也采取了类似策略。我们发现管道系统对液冷技术至关重要,风扇系统则是空气冷却技术的核心。并且,我们正在设计空气动力学性能优良的风扇,以在产生最小噪音的同时实现最大空气流通量。为此,公司聘请了空气动力学工程师。虽然我们不直接生产这些组件,但我们深入设计并了解其制造过程,通过这种方式来不断尝试突破技术的极限。


5、黄仁勋对未来的押注


主持人:  您是一位敢于对未来进行大胆押注的人,而且事实证明,您之前的那些押注都是正确的。我们讨论了 GPU、CUDA,以及您在 AI 领域的投资,包括自动驾驶。


黄仁勋:  是的,我们相信在自动驾驶、机器人技术方面也会取得同样的成功。


主持人:  这就引出了我的问题:您目前正在进行哪些新的押注?


黄仁勋:  我们最近在 CES 上公布了一个激动人心的新项目——Omniverse 与 Cosmos 的融合。这一融合创造了一个全新的生成式世界构建系统,一个多重宇宙生成系统。


我认为,这个系统对机器人技术和物理系统的未来发展至关重要。尽管我们在机器人领域,特别是在人形机器人方面的工作才刚刚起步,包括开发工具、训练系统和人类演示系统等,但我相信,未来五年内,人形机器人将迎来飞速发展。


此外,我们还在数字生物学领域开展深入研究。我们的目标是像理解物理世界的语言一样,解码分子和细胞的语言。如果我们能够做到这一点,并具备预测能力,那么实现人类的数字孪生将成为可能。我对这一领域的未来充满期待。



我非常喜欢在气候科学领域的工作,这些研究令人兴奋。比如,我们能够从天气预报中理解并预测高分辨率的区域气候,甚至可以掌握头顶一公里范围内的天气模式。如果我们能以极高的准确度来预测这些变化,其影响将非常深远。



我们很幸运创造了这样一个工具,它就像一台“时间机器”(指具备前瞻性)。在刚才我们讨论的所有领域,都需要时间机器,我们努力预测未来,以及我们尝试设计的一切,都是为了能够为最佳的未来版本进行优化,才有机会让未来成为最好的版本。这也是众多科学家们想要预测未来的原因。


6、人们应该如何为未来作出准备


主持人:可能很多人知道 NVIDIA 是一家非常重要的公司,但并不完全理解它为何重要。现在人们希望能够更好地理解过去几十年里我们在计算领域经历的巨大变革,以及目前所身处和面对的激动人心时刻,我们似乎正站在众多变革的边缘。


如果这些人想对未来多一些了解和展望,您会建议他们如何为自己所处的这个时刻做好准备或进行思考,尤其是考虑到这些工具将如何实际影响他们?


黄仁勋: 假设一些工作,原本需要一周完成,但是我们现在可以大大缩短,甚至压缩到几乎瞬间,这意味着一部分繁琐的劳动几乎要消失了,这产生的影响类似于高速公路的出现。回顾上一次工业革命,州际高速公路的建设让郊区迅速发展,货物运输变得便捷,加油站、快餐店和汽车旅馆也随之涌现,新的经济形式和能力因此得以诞生。


举个例子,如果我身边随时有一个程序员,能够根据我的需求编写代码,或者只需要我提供一个简单的想法和草图,就能帮我设计产品原型,这将如何改变我们的生活和机遇?在未来十年内,智能技术,虽然不会在所有领域,但在某些领域,将有可能达到超越人类的水平。


但是我们也不必担忧被超越或者是被替代的问题。我身边有许多“超强人类”的存在,从我的角度来看,他们在各自领域都是世界顶尖,他们做的事情远超我。我被成千上万这样的高手包围,但从未觉得自己不重要,反而这给了我力量和信心,让我更有勇气去挑战更大的目标。如果每个人都被在特定领域非常出色的超级人工智能包围,你会感觉到它赋予你力量和自信。


我相信可能很多人已经在使用 ChatGPT 等 AI 工具了,对于这些产品的更新,我感到更有力量和信心去学习新事物。这样感觉很像身边总有一个私人导师,在帮助我对于任何知识领域,消除理解的障碍。


如果我给大家一个建议,就是立即为自己找一个“AI导师”。它可以教你任何想学的东西,帮你编程、写作、分析、思考、推理,所有这些都会让你感到更有力量。我认为,这就是我们的未来:我们将不再因为拥有超能力而成为超人,而是因为我们拥有了超级AI。


7、这一代人最重要的事情是用好AI


主持人: 您认为对于观众来说,我还没有问到的最重要的事情是什么?


黄仁勋: 我会建议的最重要的事情之一是:如果我今天是一名学生,最重要的事情就是学习人工智能。我应该学习如何与 ChatGPT、Gemini Pro 和 Grok 等 AI 工具互动。学习如何与 AI 互动,就像成为一个擅长提问的人。你需要掌握一些专业知识和技巧,才能有效地提示 AI,让它成为你的助手。


无论你将来从事哪个科学领域或行业,都应该问自己:如何利用 AI 来提升工作效率? 如果想成为律师,如何利用 AI 成为更优秀的律师? 如果想成为医生,如何利用 AI 成为更出色的医生? 如果想成为化学家或生物学家,如何利用 AI 来提高自己的专业能力? 这个问题应该时刻萦绕在每个人的心中。


就像我们这一代人是第一代必须思考如何利用计算机提升工作效率的人一样。我的上一代人没有电脑,而我们这一代人是第一个必须学习如何利用电脑来更好地工作的人。


我记得在 1984 年,那时办公室里还没有电脑。后来,电脑开始普及,我们必须思考如何利用电脑来提高工作效率。下一代人无需再问这个问题,但他们必须问下一个问题:


如何利用 AI 来更好地完成我的工作? 我认为这应该成为一切的出发点和终点,这是一个令人兴奋、也略带恐惧,但非常值得探讨的问题。


我认为这将非常有趣。AI 显然是一个人们才刚刚开始了解的概念,但它让你的电脑变得更加容易使用。 提示 ChatGPT 提出任何你想问的问题,比你自己去做研究要容易得多。我们降低了理解的门槛、知识的门槛,也降低了智能的门槛,每个人都应该去尝试一下。


如果你把一台电脑放在一个从未使用过电脑的人面前,他们不可能在一天之内学会使用它,必须有人教你。 然而,如果你不知道如何使用 ChatGPT,你只需要输入 “我不知道如何使用 ChatGPT,请告诉我”,它就会给出一些使用示例。


这就是 AI 最令人惊叹的地方:它会一路帮助你,让你一路变得更加强大。


8、墓志铭:希望如何被记住


主持人:我还有一个问题。这不是我计划问你的,但在来这里的路上,我有点害怕飞机,而且今天的飞行有点颠簸。我坐在那里,飞机在晃动,我想着他们会在我的葬礼上说什么。


黄仁勋: 她问了很好的问题,这会是墓志铭上所写的内容。


主持人: 在提到我爱我的丈夫、我的朋友和我的家人之后,我希望他们会谈论我的乐观。我希望他们会认识到我在这里试图做的事情。你描绘了未来如此多的愿景,我非常好奇,你希望人们谈论你所尝试做的事情的主题是什么?


黄仁勋:我认为我们很幸运,因为我们坚持了很久以前的核心信念,使得英伟达今天成为了世界上最重要、最具影响力的科技公司之一,并且可能永远如此。


我们非常重视这一责任,努力确保我们创造的技术能够被大型公司以及各领域的研究人员和开发者使用,不论其规模大小、是否盈利、是否出名。我们深知这项工作的深远影响,以及它对众多人的潜在影响,因此我们希望尽可能地普及这种能力。


我希望当下一代回顾过去时,他们会意识到:


他们是通过我们创造的游戏技术认识我们的;


数字生物学和生命科学领域已经发生了彻底的改变,我们对材料科学的理解也被完全颠覆;


机器人正在帮助我们完成危险和繁琐的工作;


未来,我们可以像在家庭影院中一样享受自动驾驶汽车;

如果他们回顾过去,会发现有一家公司几乎处于所有这些变革的中心,而且这家公司恰好是他们从小一起玩游戏的公司。我希望这就是下一代人所了解的——这一切的起点,都源于电子游戏。







荐阅读