本文转自微信公众号“中国企业家俱乐部”,作者:中国企业家俱乐部。
近日,美国播客Invest Like the Best访谈了a16z的联合创始人 Marc Andreessen。在访谈过程中,Marc与主播深入探讨了AI给技术领域带来的重大变革,着重讨论了DeepSeek的开源人工智能技术、宇树科技以及中国机器人产业的发展现状,并分析了它们未来可能产生的影响。以下是相关对谈内容整理,希望对您有所帮助。
01
.
从DeepSeek谈起
Patrick:Marc,我认为我们必须从最核心的问题开始。你能否谈谈你对 DeepSeek 的 R1 的看法?
Marc:美国仍然是人工智能领域公认的科学和技术领导者。DeepSeek 中的大多数想法都源自过去 20 年,甚至令人惊讶的是 80 年前在美国或欧洲进行的工作。神经网络的最初研究早在 20 世纪 40 年代的美国和欧洲研究型大学中就已展开。
因此,从知识发展的角度来说,美国仍然遥遥领先。
但 DeepSeek 对这些知识完成了非常出色的运用。他们还做了一件了不起的事情,那就是以开源的形式将其提供给全世界。这实际上相当令人惊叹,因为这种现象发生了一种逆转。你有像 OpenAI 这样的美国公司,它们基本上完全封闭。
埃隆·马斯克对 OpenAI 的部分诉讼内容是要求他们将公司名称从 OpenAI 改为 Closed AI。OpenAI 最初的设想是所有内容都会开源,但如今一切都已封闭。其他大型 AI 实验室,如 Anthropic,也完全封闭。事实上,它们甚至已经停止发布研究论文,将所有东西都视为专有财产。
而 DeepSeek 团队出于他们自己的原因,实际上实现了真正开源的承诺。他们发布了他们的 LLM(称为 V3)和他们的推理器(称为 R1)的代码,并且发布了详细的技术论文,说明了他们是如何构建它的,这基本上为任何想要进行类似工作的其他人提供了路线图。
所以它已经公开了。外界有一种虚假的论调,认为如果你使用 DeepSeek,你就会把所有数据给中国人。如果你在 DeepSeek 网站上使用该服务,这是真的。但你可以下载代码,并自行运行它。但我举个例子:Perplexity 是一家美国公司,你可以在 Perplexity 上使用 DeepSeek R1,完全托管在美国。微软和亚马逊现在都有 DeepSeek 的云版本,你可以在他们的云平台上运行它,显然这两家公司都是美国公司,使用的是美国的数据中心。
这非常重要。你现在可以下载这个系统,并且实际上可以在家里或公司里价值 6000 美元的硬件上运行它。它的能力与 OpenAI 和 Anthropic 等公司的最前沿系统相当。
这些公司投入了大量资金来构建他们的系统。如今,你可以用 6000 美元买到它,并且拥有完全的控制权。如果你自己运行它,你拥有完全的控制权。你可以完全透明地了解它在做什么,你可以修改它,你可以对它进行各种操作。
它还有一个非常出色的特性,称为蒸馏。你可以将需要 6000 美元硬件的大模型进行压缩,创建更小版本的模型。网上已经有人创建了更小版本的模型,并且进行了优化,以便你可以在 MacBook 或 iPhone 上运行它们。这些版本虽然没有完整版本那么智能,但仍然相当聪明。你可以创建定制的、针对特定领域的、经过蒸馏的版本,它们在特定领域表现出色。
这是在使大模型推理以及 R1 模型在编程、科学方面推理变得更加普及方面的一个巨大进步。六个月前,这些还非常深奥、极其昂贵且专有。如今,它变得对每个人来说都是免费且永远可用的。
每一个大型科技公司、互联网公司、每一个初创公司,我们本周就有几十家甚至几百家初创公司,要么正在基于 DeepSeek 进行重建,要么将其整合到他们的产品中,要么研究他们使用的技术,并用它来改进现有的 AI 系统。
Meta 团队的马克·扎克伯格最近谈到,Meta 团队正在拆解 DeepSeek,完全合法地借鉴这些想法,因为它是开源的,并确保下一个版本的 Llama 在推理能力上至少与 DeepSeek 相当,或者更好。这确实推动了世界的发展。
我们可以从中学到的两个主要观点是:AI 将无处不在。有很多 AI 风控人士、安全人士、监管者、官员、政府、欧盟、英国人等等……所有这些人都希望限制和控制 AI,而这基本上保证了这一切都不会发生,我认为这很好。它非常符合互联网的自由传统。然后,这实现了推理能力的 30 倍成本降低。
也许最后要指出的是,这表明推理将奏效。推理将在人类活动的任何领域奏效,只要你可以生成答案,这些答案可以在事后由技术专家检查是否正确。
我们将拥有能够进行人类和超人类水平推理的 AI,这将在真正重要的领域发挥作用:编码、数学、物理、化学、生物学、经济学、金融、法律和医学。
这基本上保证了五年内地球上每一个人都会拥有一位超人类水平的 AI 律师、AI 医生,他们随时待命,这只是手机上的一个标准功能。这将使世界变得更加美好、健康和奇妙。
Patrick:但这也是这是最不稳定的,两个月内模型就会过时。每个技术层级都在发生大量创新。但仅从当下这个时点来看,进入这个新范式,如果你正在撰写关于所有利益相关者的赢家和输家的专栏,无论是新的应用开发者、现有的软件开发者、像英伟达这样的基础设施提供商,开源与闭源模型公司。你认为谁是 R1 发布后的赢家和输家?
Marc:如果在今天拍一张「快照」,那么从零和游戏的角度来看,在一个时间点上的赢家和输家来说,赢家是所有的用户,所有的消费者,每一个个人,以及每一个使用 AI 的企业。
有一些初创公司,比如做 AI 法律服务的公司,上周他们使用 AI 的成本还是现在的 30 倍。
例如,对于一家正在构建 AI 律师的公司来说,如果其关键输入的成本下降了 30 倍,这就像是开车时汽油成本下降了 30 倍。突然之间,你可以用同样的一美元开 30 倍远的距离,或者你可以利用额外的支出能力去购买更多的东西。所有这些公司要么将极大地扩展它们在所有这些领域使用 AI 的能力,要么它们将能够以更便宜或免费的方式提供服务。所以对于用户、世界来说,这是一个在固定规模的盘子基础上的绝佳结果。
输家是那些拥有专有模型的公司,比如 OpenAI、Anthropic 等等。你会注意到,OpenAI 和 Anthropic 在过去一周都发出了相当强硬但像是被挑衅后的信息,解释为什么这并不是他们的终结。
在商业和政治中有一句老话,当你在解释的时候,你就输了。
然后另一个是英伟达公司。关于这一点有很多评论,但英伟达制造的是人们使用的标准 AI 芯片。也有一些其他选择,但英伟达是大多数人使用的。他们芯片的利润率高达 90%,公司的股票价格也反映了这一点。(英伟达)是世界上最有价值的公司之一。DeepSeek 团队在他们的论文中所做的其中一件事是,他们想出了如何使用更便宜的芯片,实际上仍然使用英伟达的芯片,但他们使用得更加高效。
30 倍的成本降低的一部分是你只需要更少的芯片。顺便说一下,中国正在构建自己的芯片供应链,一些公司也开始使用中国衍生的芯片,这当然对英伟达来说是一个更根本的威胁。所以这是在某个时间点的快照。
但问题是,你的问题暗示了另一种看待它的方式,那就是随着时间的推移,随着时间的推移,你想要看到的是弹性效应。
萨蒂亚·纳德拉用了这个叫做杰文斯悖论的短语。
想象一下汽油。如果汽油的价格大幅下降,那么突然之间人们会开更多的车。这在交通规划中经常出现。所以你会有一个像奥斯汀这样的城市,它交通拥堵,有人会突发奇想,在现有高速公路旁边再建一条新高速公路。而在短短两年内,新高速公路也会被堵满,也许甚至更难从一个地方到达另一个地方。原因在于关键投入品价格的降低可以诱导需求。
如果 AI 突然变得便宜 30 倍,人们可能会使用它 30 倍,或者顺便说一下,他们可能会使用它 100 倍甚至 1000 倍。这种经济术语叫做弹性。
所以
价格下降等于需求的爆炸性增长
。我认为这里有一个非常合理的场景,那就是在另一边,随着使用量的爆炸性增长,DeepSeek 会做得很好。顺便说一下,OpenAI、Anthropic 也会做得很好,英伟达也会做得很好,中国的芯片制造商也会做得很好。
然后你会看到一种潮汐效应,整个行业会爆炸性增长。我们真的才刚刚开始人们弄清楚如何使用这些技术。推理只是在过去四个月才开始奏效。OpenAI 几个月前才发布了他们的 o1 推理模型。这就像把火种从山上取下来,然后把它交给全人类。而大多数人类还没有使用火,但他们会用的。
然后,坦率地说,这也是一个旧观念,即创造性,也就是说,好吧,如果你是 OpenAI 或者其他类似的公司,你上周所做的已经不够好了。但话说回来,这就是世界的方式。你必须变得更好。这些事情都是竞赛。你必须进化。所以这也是一种非常强大的催化剂,促使许多现有公司真正提高他们的水平,变得更加激进。
Patrick:……,如果一家中国公司使用在美国开发的模型,这些模型投入了大量资金,然后导致了这种为世界带来丰富的技术,这是一件很难理解的事情。我很想听听你从这两个角度的反应。
Marc:是的,所以这里有一些真正的问题。这种论点存在一种讽刺意味,你确实会听到这种论点。当然,讽刺之处在于 OpenAI 并没有发明 Transformer。大型语言模型的核心算法叫做 Transformer。
它不是在 OpenAI 发明的,而是在谷歌发明的。谷歌发明了它,并且发表了相关论文,然后顺便说一下,他们没有将其产品化。他们继续对其进行研究,但没有将其产品化,因为出于「安全」考虑,他们认为这可能是不安全的。因此,他们让它在货架上放了五年,然后 OpenAI 的团队明白了这一点,将其捡起来并继续推进。
Anthropic 是 OpenAI 的分支。Anthropic 也没有发明 Transformer。因此,无论是这两家公司,还是每一个其他正在研究大型语言模型的美国实验室,每一个其他开源项目,都是建立在他们自己没有创造和开发的东西之上。
顺便说一下,谷歌在 2017 年发明了 Transformer,但 Transformer 本身是基于神经网络的概念。神经网络的想法可以追溯到 1943 年。所以,82 年前实际上是原始的神经网络论文发表的时间,而 Transformer 是在 70 年的研究和发展基础上建立起来的,其中大部分是由联邦政府和欧洲政府在研究型大学中资助的。
因此,这是一个非常长的知识思想和发展的谱系,进入所有这些系统的大部分想法都不是目前构建这些系统的公司所开发的。没有一家公司坐在这里,包括我们自己的公司,没有任何特殊的道德主张,认为我们是从头开始构建的,我们应该完全控制。这根本不是事实。
所以,我会说,像这样的论点是出于当下的挫败感。顺便说一下,这些论点也是毫无意义的,因为中国已经这么做了,它已经出来了,事情已经发生了。现在有一个关于版权的争论。如果你和这个领域的专家交谈,很多人一直在试图理解为什么 DeepSeek 如此出色。其中一个理论,这是一个未经证实的理论,但专家们相信的一个理论是中国公司可能使用了美国公司没有使用的数据进行训练。
特别令人惊讶的是,DeepSeek 在创意写作方面非常出色。DeepSeek 可能是目前世界上英语创意写作方面最好的 AI。这有点奇怪,因为中国的官方语言是中文。虽然有一些非常优秀的中国英语小说家,但一般来说,你可能会认为最好的创意写作应该来自西方。而 DeepSeek 目前可能是最好的,这令人震惊。
因此,其中一个理论是 DeepSeek 可能进行了训练。例如,有一些网站的名字叫 Libgen,这些基本上是巨大的互联网存储库,里面全是盗版书。我自己当然不会使用 Libgen,但我有一个朋友经常使用它。它就像 Kindle 商店的超集。它有每本数字书,以 PDF 格式存在,你可以免费下载。它就像电影版的海盗湾。
美国实验室可能不会觉得自己可以简单地从 Libgen 下载所有书籍并进行训练,但也许中国实验室觉得自己可以。因此,可能存在这种差异优势。话虽如此,这里还有一个悬而未决的版权之争。人们需要小心对待这个问题,因为这里有一个悬而未决的版权之争,一些出版公司基本上希望阻止像 OpenAI、Anthropic 和 DeepSeek 这样的生成式 AI 公司能够使用他们的内容。
有一个论点说,这些材料是受版权保护的,不能随意使用。还有另一个论点,基本上说 AI 对书籍进行训练,你并没有复制书籍,你是在阅读书籍。AI 阅读书籍是合法的。
你和我被允许阅读书籍,顺便说一下。我们可以从图书馆借阅书籍。我们可以捡起朋友的书。这些行为都是合法的。我们被允许阅读书籍,我们被允许从书籍中学习,然后我们可以继续我们的日常生活,谈论我们在书中学到的想法。另一个论点是,训练 AI 更像是人类阅读书籍,而不是偷窃。
然后还有实际现实,即如果……他们的 AI 可以接受所有书籍的训练,而如果美国公司最终被法律禁止对书籍进行训练,那么美国可能会在 AI 领域输掉比赛。
从实际角度来看,这可能是一个致命一击,就像他们赢了而我们输了。可能有一些整个争论的纠结。DeepSeek 没有透露他们训练所使用的数据。因此,当你下载 DeepSeek 时,你得不到训练数据,你得到的是所谓的权重。因此,你得到的是经过训练材料训练后的神经网络。但从那里面很难甚至不可能去查看并推导出训练数据。
顺便说一下,Anthropic 和 OpenAI 也没有透露他们训练所使用的数据。然后在该领域存在激烈的猜测,关于 OpenAI 训练数据中有什么和没有什么。他们认为这是一个商业秘密。他们不会公开这些内容。因此,中国 DeepSeek 可能与这些公司不同,也可能没有。他们可能在训练方法上与中国公司不同。我们不知道。
我们不知道 OpenAI 和 Anthropic 的算法到底是什么,因为它们没有开源。我们不知道它们比公开的 DeepSeek 算法好多少或差多少。