专栏名称: 六合商业研选
六合咨询立足新经济,挖掘明日之星,发现价值,传播价值;国际化视野、多角度观察、深度思考、体系化研究,持续提升研究广度与深度,全面覆盖一级、新三板、二级(A股+美股+港股);深度剖析优质企业商业模式与投资价值,前瞻性洞察行业本质与发展趋势。
目录
51好读  ›  专栏  ›  六合商业研选

【长期主义】第282期智能说:OpenAI Sam Altman最新专访,a16z创始人对谈AI与创业

六合商业研选  · 公众号  ·  · 2024-05-25 06:30

正文


2024 5 15 日, OpenAI 发布最新大语言模型 GPT-4o 1 天, OpenAI CEO Sam Altman 接受知名播客节目主持人 Logan Bartlett 专访,向全球观众揭开 GPT-4o 发布会背后精彩故事,并对 AI 未来进行预测。

2024 5 9 日, a16z Youtube 发布联合创始人 Marc Andreessen Ben Horowitz 对话视频,探讨面对大型科技公司拥有算力与数据规模优势,小型 AI 初创公司如何与之竞争,揭示数据作为可出售资产被高估的原因, AI 热潮与 21 世纪初互联网浪潮的异同之处。

本期长期主义,选择 Logan Bartlett 专访 Sam Altman Marc Andreessen 对话 Ben Horowitz 纪要 腾讯科技发布,六合商业研选精校,分享给大家, Enjoy

正文:

全文 28,507

预计阅读 51 分钟

OpenAI Sam Altman 最新专访: GPT-4o 让我爱不释手 下代大模型可能不叫 GPT-5

时间: 2024 5 16

来源:腾讯科技

字数: 10,083

OpenAI 近日发布最新大语言模型 GPT-4o ,再次引领了 AI 领域的又一创新浪潮。在此重要时刻, OpenAI CEO Sam Altman 接受知名播客节目主持人 Logan Bartlett 专访,向全球观众揭开发布会背后精彩故事,并提供对 AI 未来预测。

Sam Altman Logan Bartlett 对话全文

领导 OpenAI 让我再难保持透明

Logan Bartlett 过去 4~5 年,作为 OpenAI 领导者,你的生活经历哪些最不寻常的变化?哪些转变对你来说最为明显?

Sam Altman 许多事情都发生变化,最令人惊异的是,我再也无法在公众面前保持透明。如果之前我稍微预想过这一点,我可能会说,这比想象中更为奇特,当时我没有多想。这就像一种非常特殊的隔离状态,让我有些无所适从。

Logan Bartlett 你深信 AI OpenAI 的力量,在经营这样一家公司时,你有没有预想过它可能带来的连锁反应?

Sam Altman 我并未预料到这些,我没有想到会牵涉到这么多其他的事情,比如公司会成长为真正具有影响力的企业。我更加没有预见到,我甚至在自己城市里都无法自由外出用餐,这让我感到有些奇怪与不可思议。

发布多模态 AI :技术的一大飞跃

Logan Bartlett 本周早些时候,你们成功发布多模态大模型 GPT-4o ,它实现文本、语音、视觉之间无缝交互,你能谈谈为何这一突破如此重要?

Sam Altman 这是计算机使用方式的一次革命性飞跃。长久以来,我们都有通过语音控制计算机的愿景,如 Siri 等早期产品。

对我而言,它们的使用体验从未真正达到流畅的境界。 GPT-4o 在使用感受上,与前代产品截然不同。

它的表现非常,这源于多方面因素的完美结合:功能丰富性、融入其他模型的迅捷性、语调的流畅,以及它所能实现的多样化操作,比如你可以轻松对它说,说得更快一点或者选择另一种声音。这种流畅性与灵活性,无论我们如何称呼它,都让我对新模型爱不释手。

Logan Bartlett 请分享一下,你目前更偏好的一些用例场景。

Sam Altman 我才使用一周时间,有一个用例让我颇为惊喜。当我全神贯注工作时,我可以简单将手机置于桌面之上,无需频繁切换窗口或打断我工作流程,这手机仿佛成为我与信息之间的另一个桥梁。

举个例子,当我处理某个任务时,我过去常常需要停下来,去其他标签页搜索资料或点击其他链接。

现在,我可以继续手头工作,直接提问并立即获得响应,不必转移视线离开我当前在电脑上处理的内容,这种无缝衔接的体验,令人称奇。

Logan Bartlett 这一切背后是技术架构演进,特别是算力的飞跃?

Sam Altman 技术角度看,这基于我们过去几年在多个领域积累。我们一直在深入探索音频模型、视觉模型,努力将它们融合。

我们也在探索用更高效方法,训练我们模型。并不是说我们突然之间,拥有革命性新功能,而是将众多技术元素巧妙结合在一起。

Logan Bartlett 考虑到延迟问题,你认为是否需要在设备上,开发专门模型来确保流畅的交互?

Sam Altman 对视频来说,网络延迟是需要关注的问题。我一直对 AR 眼镜或其他设备,能够实时与世界交流、感知事物变化的前景充满期待,网络延迟可能成为这一愿景的绊脚石。

实际应用中,两三百毫秒延迟,已经足够迅速,很多时候甚至能超越人类反应速度。

Logan Bartlett 你最近提到 GPT-4o ,可能不是下一个大型版本的命名,比如 GPT-5 。这似乎意味着,你们在模型开发上,采用更为灵活与迭代的方法,我们是否应该这样看待未来的发展方向?

Sam Altman 未来发布的大模型,不会是一个标志性的大版本,如 GPT-5 ,目前我们还无法确定。

我认为,我从中学习到的一点是, AI 与传统的发布模式不总是完美契合。科技公司通常遵循既定的产品发布模式,我们现在可能需要采取不同的策略。

我们可以沿用 GPT-5 这样的命名,并以新的方式发布,或者可以考虑使用其他名称。我认为,我们还在摸索如何为这些产品命名与建立品牌。

GPT-1 GPT-4 的命名方式,对我来说是合乎逻辑的, GPT-4 已经取得显著进步。我们也在思考,是否会有一个类似虚拟大脑的基础模型,在某些情况下可能展现出更深入的思考能力。

或者,我们可能探索不同的模型,用户可能并不关心这些模型之间的差异,我认为我们还在探索如何将这些产品推向市场。

Logan Bartlett 这是否意味着,为了模型取得渐进式进步,我们对算力的需求可能会低于历史水平?

Sam Altman 我认为,我们总是渴望利用尽可能多算力。现在我们正在见证惊人的效率提升,这是至关重要的。

最近发布的亮点之一是语音模式,也许更核心的是,我们能够以如此高的效率运行它,以至我们可以向全球用户提供这一服务,它的性能达到世界顶尖模型水准。

对于希望免费体验 ChatGPT 的用户,你会发现, GPT-4o 与之前 GPT-4 GPT-4 Turbo 相比,某些使用场景下效率方面有显著提升,我认为在这方面,我们还有很大提升潜力。

语言将成为人与 AI 主要交流方式

Logan Bartlett 你曾提到 ChatGPT 本身并没有真正改变世界,它可能只是改变人们对世界的期望。

Sam Altman 我完全认同这一观点。如果以任何经济指标来衡量,你很难找到确切的证据证明 ChatGPT 提高生产力或产生其他直接经济效益。

可能在客户服务或某些特定领域有一些体现,如果观察全球 GDP 走势,你能在 ChatGPT 发布时明显检测到它的影响吗?恐怕不能。

Logan Bartlett 你认为是否有一个时间点,我们可以确定 GDP 增长,是由 ChatGPT 推动的?

Sam Altman 我不确定我们能否将这一增长,直接归因于某个特定模型。我认为,如果我们回顾几十年后历史数据,我们会看到一系列模型如何逐步推动整个领域发展, ChatGPT 只是其中一部分。

Logan Bartlett 你认为接下来 12 个月里,哪些应用或领域将展现出最有前途的发展?

Sam Altman 我个人工作背景,我对编程领域有关偏爱,我坚信这是至关重要的领域。

Logan Bartlett 你曾详细讨论深度专业化模型与通用模型区别,前者针对特定数据训练并用于特定目的,后者能够进行真正的推理。

Sam Altman 我敢打赌,未来是通用模型大放异彩的时代。

Logan Bartlett 在你看来,什么才是最为重要的?

Sam Altman 对于仅仅局限于一个数据集、和与之紧密相关的狭窄领域的模型来说,如果它们能够拥有泛化推理的能力,无论面对何种新的数据类型,只需输入相应数据,模型便能够迅速适应并运行。

这样的能力,并不是通过堆砌一堆专业化模型所能获得的。

我认为最重要的,是要弄清楚真正的推理能力,这样我们便可以将其应用于各种场景与任务中。

Logan Bartlett 设想 AI 在通信与创造力方面的前景时,你认为在未来 2 年内,人类与 AI 之间的主要交流方式将是什么?

Sam Altman 语言是非常有效的交流方式,我对于这样一个想法很感兴趣:我们可以设计人类与 AI 都能共同使用的机制,让它们以相同方式互动。

相比其他形式的机器人,我对人形机器人更感兴趣。当前这个世界,在很大程度上是为人类设计的,我不希望追求某些所谓的效率,而让这个世界重新配置。

我倾向于这样的观点,我们使用人类习惯的语言与 AI 交流,他们之间甚至可能采用同样的方式进行交流。我无法预知未来,我认为这是一个值得探索的有趣方向。

未来 AI 系统将变得便宜又好用

Logan Bartlett 你曾提到模型可能会随着时间推移,逐渐商品化,在这之前,是否应该首先将模型个性化到每个个体?

Sam Altman 这一点我不确定,我认为这是值得考虑的方向。

Logan Bartlett 除个性化外,你认为商业用户界面与易用性,是否会在最终赢得用户青睐方面发挥重要作用?

Sam Altman 这些因素一直都是至关重要的。某些情况下,市场或网络效应也会成为关键因素。我们希望智能主体之间能够进行有效交流,应用商店里有不同公司提供各种服务。我认为,商业规则通常都会适用。每当新技术出现时,人们总是说这些规则不再适用,这样的观点往往不准确。

在我看来,开源模型在性能上正逐步接近基准标准,传统价值创造的方式依然扮演不可或缺的角色。对开源模型崛起,我持乐观态度。正如众多技术流派所展示的那样,开源有独特的地位,托管模型亦然,这种多元化的格局非常棒。

Logan Bartlett 关于具体实施细节,我并不打算深入探讨。

不少权威媒体已广泛报道投资 FAB 半导体制造设施与 AI 基础设施的消息。台积电、英伟达等公司正在积极增产,以满足市场对 AI 基础设施的激增需求。

你最近曾提及,全球对 AI 基础设施的需求,远超过目前台积电、英伟达等公司供应能力,你是基于哪些观察或数据得出这一结论的?

Sam Altman 首先,我确信我们能够找到途径,大幅降低现有 AI 系统的成本。

其次,随着成本降低, AI 系统的需求,势必将激增。

第三,通过构建更大、更先进系统,我们将进一步刺激需求的增长。

我们共同期待的是智能极其丰富、便宜的世界,人们可以利用智能技术完成各种各样任务。你甚至无需思考,比如我是否想要它帮我阅读,回复所有电子邮件,或者我是否想要它帮我治疗癌症。你会选择治疗癌症,理想情况是它能够同时出色完成这两项任务。我关注的是,确保我们拥有足够资源,让每个人都能享受到智能技术带来的益处。

Logan Bartlett 我不要求你对个人努力做出评价,如果你愿意分享,我想请教你对于 Humane Limitless 等公司推出的不同物理设备助手有何看法?你认为它们有哪些不足之处,或者为何它们普及程度尚未达到预期的用户需求?

Sam Altman 我认为这仅是个开始。作为多种计算设备的早期使用者,我有着丰富体验。我曾拥有一台紧凑的 TC1000 ,那是我大学 1 年级时的爱物,虽不如现在 iPad 先进,方向是正确的。

后来,我拥有一部 Treo ,大学时代,我算是不太追求时尚的孩子,但我的 Palm Treo 在当时绝对是炫酷的存在,它与后来 iPhone 相去甚远,我们都见证科技飞跃。这些设备都预示着极具潜力的未来,只是需要时间打磨与技术迭代。

Logan Bartlett 你最近曾提及,许多以 GPT-4 为基础建立业务的公司,将不可避免会被未来 GPT 迭代所淘汰。你能进一步详细解释这一观点吗?你认为在 GPT 浪潮中,哪些具备 AI 特性的企业能够生存下来?

Sam Altman 我发现一个适用的框架是,构建业务时,你是在做两种选择:要么赌下一个模型表现平平,要么赌下一个模型会取得显著进步,并从中受益。

如果你投入大量精力,让某个用例高效运作,这个用例当前已超出 GPT-4 能力范围,一旦 GPT-5 或后续版本出现并超越这一切,你可能会对你先前努力感到不值。

如果你有一个全面、可行的产品,人们会寻求使用它,你并没有过度投入去让这一产品成为唯一,当 GPT-5 或其他更先进模型出现时,你的产品将随之变得更好。

我的观点是,大多数时候,你并非在建立纯粹的 AI 业务,而是在构建一个业务, AI 只是你采用的一种技术。

在应用商店早期阶段,有很多产品填补了某些明显空缺,随后苹果解决了这个问题,我们现在已经不再关注应用商店里手电筒应用,它们功能已被集成到操作系统中,这将是未来 AI 业务可能发展方向。

至于 Uber ,因智能手机普及而兴起,它们建立非常稳固、长期可行的业务模式,我认为这正是我们应该追求的方向。

Logan Bartlett 我能想象出很多应用你们技术理念的企业,它们在某种程度上都符合这一框架。

你能否给出具体的例子或新型概念,它符合我们之前讨论的模式?例如, Uber 这样的公司,它不必是真实存在的企业,即使是假设性的公司、一个玩具概念,或者只是你认为以这种方式实现的某个想法也可以。

Sam Altman 这个方面,我倾向押注新兴的初创企业。举个例子,当人们想要构建 AI 医生或 AI 诊断系统时,他们会说,我不想在这个领域创业,你知道有梅奥诊所 Mayo Clinic 或其他医院会这样做,但我实际上更看好在这个领域尝试新方法的初创公司。

没有 AGI OpenAI 估值能达到万亿美元?

Logan Bartlett 对于有志主动应对此类颠覆性变革的创业者,你有何建议?

Sam Altman 我要说的是,坚信智能服务会逐年进步、成本下降是必需的,这还不足以确保你的成功。大公司需要时间来达到这一点,你可以借此优势超越它们,但同样意识到这一点的其他创业公司也会这么做,你仍需深入探索业务的长期可持续性。

如今,我们面临的是前所未有的开放环境,充满令人兴奋的新机遇,请不要忽视在创造价值过程中辛勤工作。

Logan Bartlett 鉴于 AI 飞速发展,你能否预测未来 5 年内,可能涌现或成为主流的新职位类型?这些职位,可能是当前鲜为人知或尚未存在的。

Sam Altman 这是新颖、引人深思的问题,我之前并未被问及过。人们总是关注哪些职业将会消失,新的职业类别同样令人着迷。

我尝试思考的是,例如有 1 亿或 5 千万人可能会涉足新领域。这可能涉及全新的艺术形式、娱乐方式,以及更加注重人与人之间联系。

我不知道这些职位具体名称,无法确定我们是否能在 5 年内达到这样规模,我坚信,人们将会珍视像面对面这样独特的人类交流体验。

我不清楚我们将如何定义这样的岗位,我可以预见,这将成为我们未来发展中全新、极其重要的领域。

Logan Bartlett 最近 OpenAI 融资过程中,估值达到约 900 亿美元。在你看来,有哪些关键性事件或里程碑, OpenAI 尚未达到 AGI 水平,也能推动估值达到万亿美元?

Sam Altman 我认为,只要我们能够继续以当前速度提升技术,明确如何持续利用它构建出色产品,确保收入稳步增长,就像目前情况一样,我坚信我们会取得巨大成功。关于具体数字,我无法预测,我对我们未来充满信心。

Logan Bartlett 当前商业模式,可能指的是 ChatGPT 等订阅模式,是否是你认为 OpenAI 能达到万亿美元估值的关键因素?

Sam Altman 这种订阅模式,对我们而言效果非常显著,超出我的预期。我并未预料到它会如此成功,事实证明,它运作得相当出色。

Logan Bartlett 在你看来, AGI 无论这个概念如何定义实现后,商业模式会否发生变化?

Sam Altman 那将是另一番景象。

Logan Bartlett 关于 OpenAI 现有结构,我们可能已经注意到一些改进,我认为我们无需再对此深入讨论,你已经充分阐述了这一点。

你提到会在前进过程中进行调整,在你看来,合适的结构应该是怎样的?

Sam Altman 我认为我们即将准备好探讨这个问题,我们一直在进行各种讨论与头脑风暴。我希望在 2024 年,我们能够正式讨论这个问题。

Logan Bartlett 关于 AI 的普遍看法,有一个特别有趣的话题,是你的货币化模型观点。我们听你提及,首先是取代体力劳动,然后是白领工作,最后是创意工作,这在某些方面被现实所颠覆。

还有没有其他与直觉相悖的事情?例如,我原本认为会是这样,事实截然相反。

Sam Altman 这对我来说是巨大的意外。除了你提到的那一点,还有其他一些事情,比如我没想到 AI 会如此擅长法律工作,会这么早就展现出这样的能力。我一直认为法律工作,是非常精确与复杂的。

Logan Bartlett 关于 AI 与你对 AGI 这个词持保留态度,你能详细解释一下吗?

Sam Altman 我知道 AGI 不再是明确的时间点。当你创办一家公司时,你会有很多天真的想法,特别是在这样快速发展的领域。

OpenAI 成立之初,我曾天真认为,我们将从没有 AGI 的时代开始,然后实现 AGI ,这将是真正的飞跃。

我仍然认为有可能出现真正的飞跃,总的来说,我认为它更像是连续的指数曲线,重要的是每年取得的进步速度。

你与我可能在某个月或某 1 年,达到 AGI 的具体时刻上不会达成一致。我们可以想出其他我们会认同的测试方法,这要比听起来要难。

GPT-4 肯定没有达到我认为的 AGI 阈值,我不认为我们下一个大模型会达到这样水平。我觉得,我们可能只是缺少某些不太起眼的想法,以及更大一点的规模,就能达到某个让人惊艳的程度。

Logan Bartlett 是否存在一个更现代的图灵测试,可以衡量 AI 是否达到某个特定的阈值?

Sam Altman 我认为,当某个系统能够做得比所有 OpenAI 研究人员加起来还要好时,哪怕只是超过其中一位 OpenAI 研究人员,这都将是非常重要的里程碑,感觉它可能会,甚至应该被视为突破性进展。

这样的进展,是否即将到来,还不太确定,我不会完全排除这种可能性。

Logan Bartlett 在你看来,实现 AGI 所面临最大挑战是什么?你似乎认为当前扩展定律在未来几年内仍将持续有效。

Sam Altman 我坚信,实现 AGI 的最大障碍在于新的研究突破。自从我从互联网软件领域转向 AI ,我深刻体会到研究并不总是遵循预设的时间表。这通常意味着它可能需要更长时间,有时候,进展速度也会远超任何人预期。

Logan Bartlett 能否详细解释一下,为什么研究的进展,不像工程那样呈现出线性趋势?

Sam Altman 当谈及研究进展的非线性特征时,我想借由历史案例来阐述,我可能会在一些具体数字上有所出入。

以中子为例,它在 20 世纪初被在理论上提及,并在 20 年代首次被探测到。原子弹研究始于 30 年代,并在 40 年代成功实现。从对中子一无所知,到能够制造原子弹,颠覆我们对物理学认知,这一进程展现惊人速度。

还有其他例子,如不纯粹的科学领域。莱特兄弟预测飞行将在 50 年后实现,他们在 1908 年成功进行首次飞行。类似这样的例子,在科学与工程的历史中不胜枚举。也有很多我们预测中的进展从未实现,或者实现速度远低于我们预期。有时候,进展能够异常迅速。

Logan Bartlett 关于可解释性,我们目前在这一领域处于怎样位置?它对 AI 的长期发展,有多关键?

Sam Altman 可解释性涉及多个层面,包括我是否理解网络在机械层面上每一层运作方式,或者我是否能够通过查看输出来指出存在的逻辑错误。

我对 OpenAI 以及其他机构在可解释性方面的研究,充满期待。我认为,作为一个更广泛的领域,可解释性具有巨大潜力与令人兴奋的前景。

对当前 AI 模型实施过度监管是个错误

Logan Bartlett 随着人们对 AGI 的期待日益高涨,关于 OpenAI 等组织单方面利用其并做出决策的担忧也在增加。这促使一些政府机构介入,希望由选举产生的领导者来做出这些决策,而非完全依赖 OpenAI 等公司。

Sam Altman 我认为,对于当前 AI 模型实施过度监管将是错误。当这些模型开始给世界带来重大灾难性风险时,某种程度的监管显得尤为重要。

目前,如何设定这些风险的阈值,以及如何有效测试它们,需要我们仔细权衡。如果过度担忧潜在风险,而限制这项技术巨大优势,让希望在自家地下室训练模型的人望而却步,将是巨大的损失。

话说回来,如果我们用国际核武器规则作为参照,我认为对 AI 进行某种形式监管是合理的。

Logan Bartlett 关于常规监管措施,你认为政府机构没有意识到 AI 内在的潜在风险吗?

Sam Altman 我认为,他们并没有真正深入研究过 AGI 。这些人中,有些曾经强烈反对 AI 监管,认为那是无稽之谈,不是所有人都是如此,我理解他们的立场。

我理解他们担忧,监管对技术行业有过负面影响,比如看看欧洲技术行业现状。我认为,我们正逐渐接近临界点,超过这个点,情况可能会大不相同。

Logan Bartlett 你认为开源模型本身,在某些方面是否存在固有的危险性?

Sam Altman 目前来说,并没有。我可以想象,未来可能会有这样的模型出现。

Logan Bartlett 我记得你曾提到,安全在某种程度上被当作一种错误的框架,它更多关注我们明确接受什么。

Sam Altman 确实如此。以航空公司为例,安全并非非黑即白的概念。

人们选择乘坐飞机,是他们认为相对安全,他们知道偶尔会有飞机失事。如何定义航空公司是否安全,是值得讨论的问题,不同的人会有不同的看法。航空业已经变得极其安全,安全并不意味着绝对没有人在飞机上丧生。

医学领域,我们也非常重视副作用,有些人会对药物产生不良反应。

安全还有隐性的一面,比如社交媒体可能带来的负面影响。

Logan Bartlett 安全方面,有没有特定的情境或因素,会让你改变当前全力推动 AI 研究的策略?

Sam Altman 我们有一个称之为准备框架的概念,它正是针对这一点。在特定的类别与层面上,我们行动策略会有所不同,以应对潜在风险与挑战。

Logan Bartlett 考虑到众多快速涌现的应用场景,我认为我们当前面临的主要瓶颈是 AI 基础设施的不足。假设有研究人员对现有神经架构 Transformer 进行某种突破性改进,使得所需的数据量与硬件大幅减少,甚至接近人脑水平,你认为这是否会加速技术飞跃?

Sam Altman 这种可能性存在,这种改进并不一定需要完全颠覆现有架构。我不认为这是最直接的路径,我也不会完全排除它。重要的是,我们要在可能发生的各种情况中,考虑到这一点。

我认为,即使技术发展在加速,这个过程也会是渐进的。我不认为我们会在一夜之间,从相对先进的 AI ,一跃成为真正的超级智能。即便技术突破发生在 1 年或几年内,这在某种程度上来说仍然是快速的。

即使我们拥有真正强大的 AGI ,它在短期内对社会的影响也是有限的。我猜测,大多数情况下,它不会在 1 年或 2 年内产生足够大的影响,但在 10 年内,世界绝对会发生巨大的变化。在这方面,社会的惯性,实际上可能是积极的因素。

感叹人的适应能力强,退休后希望享受田园生活

Logan Bartlett 我想你有注意到,大家对你不太愿意回答的问题持有怀疑态度。比如关于马斯克、股权与董事会结构的问题,这些都是你经常被问到的。这些问题中,你最不喜欢回答的是哪一个?

Sam Altman 我并没有讨厌回答其中任何一个问题,关于这些问题,我没有新的内容要分享。

Logan Bartlett 我猜我不会特别追问关于股权的问题,你已经以足够多的方式回答了它,人们似乎仍然对拥有足够的资金是有益的这个答案,持保留态度。

Sam Altman 即使我真的赚了 1 万亿美元,并全部捐出,也可能仍然无法满足某些人的期望或传统观念。有些人甚至尝试过以某种方式去这样做。

Logan Bartlett 你追求 AGI 的动机是什么?抛开股权不谈,我相信大多数人都会觉得,即使他们追求的是更高的使命,得到相应的报酬也会是一种安慰。你每天来工作的动力是什么?你从哪里获得最大的满足感?

Sam Altman 我总是告诉人们,我愿意在生活的其他方面做出许多牺牲与妥协,目前我接触到的这项事业是我认为最激动人心、最重要、最美好的。

这是充满变革的时代,我深知它不会永远持续下去。你知道,总有一天我会选择退休,享受田园生活,我会怀念现在的一切,但也会笑着说:日子真是既漫长、又充满压力,同样也是无比酷炫。我简直不敢相信这会发生在我身上,这太神奇了。

Logan Bartlett 是否有一个特定的瞬间,让你感到仿佛置身于超现实的场景之中?比如之前我们提到的名声带来的困扰,比如无法自由在你所在的城市中活动。

Sam Altman 每天都会有一些事情让我惊叹。之后,随着各种事情发生,比如 2023 11 月被董事会罢免,我收到来自世界上一些重要人物,如总统、国家总理等 10~20 条短信,这并不是让我感到奇怪的部分。让我感到真正奇怪的是,当这一切发生时,我像是在正常回应他们,发送谢谢之类的信息,感觉一切都非常。

我们度过了那 4 天半疯狂而紧张的时光,我几乎没有睡觉,也没有怎么吃东西,我的精神却出奇的好,头脑清晰,极度专注。这就像你的身体,长时间处于某种奇异的肾上腺素充能状态。

这一切发生在感恩节前的那个星期,真是疯狂的体验。到了星期二晚上 2023 11 21 日,所有的事情都解决了。

那个星期三,我开车去纳帕,在一家小餐馆停下来,那里的食物非常美味。

那是让人印象深刻的时刻,我深深体会到,人类对几乎任何事情的适应能力,都远超我们想象。你可以很快将任何事情当作新常态,无论是好是坏。

过去几年里,我多次从这样经历中学习到这一点。我认为,这恰恰展现人类的一些非凡之处,这对我们来说是一件好事。

未来 AI 助手应与人类本体分离

Logan Bartlett 这些心理层面的影响频繁出现,令我颇为惊讶。在你看来,随着人类与大模型开始承担更多过去仅由人类完成的任务,哪些特质或能力,仍将是人类所独有的?

Sam Altman 我认为多年以后,人类依旧会深深关心其他人类。我刚在网上浏览了一些内容,大家都在说每个人都会爱上 ChatGPT 之类的话。

我敢打赌,这种情况不会发生。我认为我们长期关心其他人类,以各种不同方式,这一点将永远存在。我们对他人的关心,几乎可以说是一种固有的执着。

你可能听说过许多关于我的阴谋论,你可能并没有听到很多关于 AI 的阴谋论。如果你听到了,我可能不会太在意。我认为,我们不会把观看机器人踢足球,当作主要的娱乐爱好。

Logan Bartlett 作为 OpenAI 创始人,你为公司设定许多商业运作的规则或框架,你同样打破不少规则。这个行业中,你雇佣的员工类型,是否与其他消费者互联网公司、 B2B 软件公司、或其他类型的公司有所不同?

Sam Altman 研究人员与产品工程师,大多数情况下存在显著差异,高管们同样具有独特性。

Logan Bartlett OpenAI 是否引入不同类型高管?或者你在招聘高管时,是否特别注重某些特质?

Sam Altman 我通常不倾向于从外部聘请高管,我认为,如果公司总是仅从内部提拔高管,这可能是个错误,这可能会导致公司文化单一化,我认为公司需要引入一些新的高级人才来注入活力。

但在这里,我们主要还是依赖本土人才,考虑到我们所做事情的独特性,这实际上是件好事。

Logan Bartlett OpenAI 发展历程中,你是否做出过某个在当时感觉至关重要的决定?你是如何做出这个决定的?

Sam Altman 这很难只指向一个单独的决定,我们可以提及的是,我们决定采用迭代部署策略,我们不会秘密开发 AGI ,然后一次性将其推向世界。这是当时许多公司与人们的普遍观点与计划,我认为这个决定非常关键,在当时看来非常重要。

Logan Bartlett 对于押注语言模型的背后故事,我实际上一直感到好奇,这一决策是如何产生的?

Sam Altman 当时,我们团队正专注多个项目,包括机器人开发与视频游戏。在这个多元化背景下,一个相对较小、充满热情的团队,开始投身语言建模的研究。 Ilya Sutskever OpenAI 前首席科学家对此方向深信不疑,他坚信语言模型的发展潜力。

于是,我们着手进行 GPT-1 GPT-2 研发,并深入研究缩放定律,进而升级到 GPT-3 。正是基于这些经验与研究,我们做出大胆决策,决定将重心放在这一方向上。现在回想起来,这些选择似乎显而易见,但在当时,它们是经过深思熟虑的决策。

Logan Bartlett 当你谈到使用个人 AI 时,你提到两者间的区别。能否请你进一步详细解释?我认为这对你关于未来 AI 用例的思考具有深远影响。

Sam Altman 当我在未来 5 年内收到你短信时,我希望能够清楚知道,这是你直接发给我的,还是由你 AI 助手代为转发。

我认为,保持这种明确的界限是有价值的,而不是让一切变得模糊不清,仿佛 AI 只是我们身体或思维的延伸。我希望能够清楚分辨出,我是在与 Sam 本人交谈,还是与 Sam AI 助手交流。我认为,这样的区分是必要的,也是我希望在未来能够实现的体验。

Logan Bartlett 在规划 AGI 及其后续发展时,你提到第一个 AGI 仅仅是智能连续体上的一个起点,我们之前已经讨论过这一点。你认为从哪里开始, AGI 的进步很可能会加速?你有没有停下来过,深入思考或想象过未来的具体样子?或者它是否太过抽象,以至无法具体描绘?

Sam Altman 我并不觉得它太过抽象,我也不会将它想象成《星球大战》中未来城市那样大场景。我想象过这样的画面:当一个人能够独当一面,完成原本需要数百、乃至数千人协调配合,才能完成的任务时,或者当我们真的能够揭示所有科学奥秘时,那会是多么酷的一件事。

a16z 创始人对谈 AI 与创业,信息量爆炸

时间: 2024 5 18

来源:腾讯科技

字数: 18,343

a16z 日前在 Youtube 发布联合创始人 Marc Andreessen Ben Horowitz 的对话视频,探讨面对大型科技公司拥有算力与数据规模优势,小型 AI 初创公司如何与之竞争;揭示数据作为可出售资产被高估的原因; AI 热潮与 21 世纪初互联网浪潮的异同之处。

2009 年, Marc Andreessen Ben Horowitz 联合创办风险投资公司 Marc Andreessen·Ben Horowitz 基金。这家风投公司名称第 1 个字母 A 与最后 1 个字母 Z 之间有 16 个字母,简称 a16z 。还有一种说法称,只要对参投对象满意,这家风投公司会参与初创公司从 A 轮到 Z 轮的所有融资。

对话全文:

巨头阴影下的机会: AI 初创公司的生存之道

Marc Andreessen 今天我们将讨论非常热门的话题 AI ,我们将集中讨论截至到 2024 4 月的 AI 产业现状。

我们希望这将对任何在初创公司工作的人,或在大型公司工作的人,都有所帮助。我们一如既往在 X 平台征集话题,收到许多精彩的提问,我们准备了一系列听众问答,我们直接进入正题。

首先三个问题,都聚焦同一主题:

1 AI 初创公司如何与大公司竞争,面对即将到来的 AI 时代,初创公司创始人目前应该专注构建什么?

2 、小型 AI 初创公司,如何与拥有巨大算力与数据规模优势的老牌科技企业竞争?

3 、对于依赖 OpenAI 等公司技术的初创公司,哪些公司能够从基础模型未来的指数级改进中受益,哪些公司可能失败?

我先从第 1 个问题开始,再深入讨论。

OpenAI CEO Sam Altman 最近在一次采访中,提出一些我非常认同的观点。他的观点大致是,作为初创公司创始人,应当预料到大型 AI 公司推出的基础模型会大幅改进,应就此提前制定出应对策略。

如果当前基础模型性能提升 100 倍,初创公司创始人会有什么反应?他们应当对此感到兴奋,这对自己的公司构成利好;还是应当感到担忧,这可能会带来一系列的问题?你对此有何看法?

Ben Horowitz 我基本认同 Sam Altman 观点,也有一些细节需要注意。

他的角度看,他可能在劝阻人们不要自己构建基础模型,我不完全同意这一点。

许多正在构建基础模型的初创公司,做得非常好。出现这种情况的原因有很多,首先是模型架构的差异,这决定模型智能程度、响应速度,在特定领域的性能。

这不仅适用文本模型,也适用图像模型。不同类型的图像,对提示词的反应各不相同。例如,如果你向 2 款模型提出相同问题,它们会根据用例以非常不同的方式作出反应。

其次,模型蒸馏 distillation ,能够把大模型知识迁移到更小、更高效模型中,在保持性能的同时,降低算力与内存需求技术的出现。

OpenAI 可以开发全球最大、最智能的模型,初创公司可以推出蒸馏版本模型,用更低成本实现非常高智能。

鉴于此,大公司模型会变得更好,如果初创公司构建的模型在某些方面有所不同,或者专注不同领域,即使大公司模型越来越出色,不一定会影响初创公司。

如果初创公司选择正面硬刚大型科技公司,可能会遇到真正问题,后者银行账户储备巨额现金。

如果初创公司从事工作足够独特,或者专注不同领域,情况会完全不同。举例来说,日前推出开源模型 DBRX 的初创公司 Databricks ,这家公司也开发了一款基础模型,它采用非常特定的方式,把这款基础模型与自己领先的数据平台结合在一起使用。

即便是 OpenAI 模型变得更好,也不足以对专注于特定领域的 AI 模型构成真正威胁。 AI 语音克隆初创公司 ElevenLabs 的语音模型,已经嵌入到每个人的 AI 堆栈中。所有人都把该公司的语音模型,作为 AI 堆栈的一部分使用。

ElevenLabs 的语音模型,拥有开发者接口。这家初创公司,专注自己从事的事情。一些初创公司表面上看起来是在与 OpenAI 、谷歌或微软竞争,但并没有真正竞争,我认为此类公司前景广阔。

AI 智能存在极限值,训练数据质量至关重要

Marc Andreessen 我们更深入探讨上帝模型 God models ,是否会出色 100 倍的问题。你认为大模型,所谓的上帝模型,真的会变得更好 100 倍吗?

Ben Horowitz 我倾向认为,大语言模型性能确实有可能提升 100 倍。以我们目前对大语言模型的了解,它们已经非常先进,真正区别可能只有深入研究它们的专业人士才能察觉。

如果我们谈论的是性能提升 100 倍,按理说,我们应当能够看到某些模型在性能上与其他模型明显拉开差距。对在日常生活中使用,如提问与获取信息大语言模型的普通用户而言,这种提升可能不会明显。

Marc Andreessen 我们期望的提升,可能包括知识的广度与能力的提高。我认为在某些方面,如模型对不同问题的响应速度与知识面,确实有可能实现显著的进步。

输出的精细度与质量,也将是提升的关键。这包括减少错误信息,即减少幻觉,确保回答具有事实依据。

Ben Horowitz 我赞同这些方面的表现,将会大幅提升的观点, AI 技术正朝着这个方向迅速发展。

我们目前面临的挑战是模型的对齐问题,模型越来越智能,但它们不总是能够准确表达所知信息。这种对齐问题,在某种程度上,限制了模型的智能表现。

另一个问题是,我们是否需要突破性进展,从当前的 AI ,我称之为人工人类智能 artificial human intelligence ,过渡到更高级 AGI

人工人类智能,指的是 AI 在模仿人类认知与语言使用方面,已经达到令人惊叹的水平,它能够执行许多人类能够完成的任务。如果要达到更广泛的智能水平,我们可能需要某种形式的技术突破。

如果我们目前技术已经接近极限,在某些方面它可能不会实现 100 倍提升。与人类相比,它们已经相当不错。如此, AI 在知识掌握、减少幻觉,在多个维度上的表现上,仍有望实现巨大飞跃。

Marc Andreessen 业界流传着一张图表,我记不太清它的具体坐标轴,但它大致展示了不同 AI 模型性能提升的情况。

一些测试中, AI 模型的得分仅略高于普通人。并不令人意外, AI 的训练完全基于人类数据。

有人反驳说,这些测试是否太过简单?是否需要更复杂的测试,就像 SAT 考试一样,来真正衡量 AI 的能力。

如果在 SAT 考试当中,许多学生在数学与语言部分都得到 800 分的满分,这是否意味着评分标准过于局限?我们是否需要一种能够真正测试出爱因斯坦级别智慧的测试?

现有的测试方法有其价值,但我们可以设想一种能够准确区分超高智商人群的 SAT 考试,一种能够真正衡量 AI 超越人类水平推理能力的测试。

Ben Horowitz 事实确实如此, AI 可能需要这样的测试。还有一个经常被人们提出的问题,也是我们内部一直在讨论的问题,我们是否需要采取更具挑衅性、更乐观、或者说更具科幻色彩的预测。

当用来自互联网的数据,训练语言模型时,互联网数据集的本质是什么?它是一切的平均水平,它是人类活动的一种代表。

人口中智力分布的特点,大多数内容处于中等水平,被用于训练模型的数据集平均而言代表了普通人类。

使用此类数据,我们只能训练出非常普通的模型。互联网上大部分内容,都由普通人创造,整体而言内容是普通的,生成的答案也是普通的。根据定义,互联网中的答案平均而言是普通的。

如果用默认的提示词,询问模型一些常规问题,如地球是否绕着太阳转?我们会得到普通的答案,这已经足够了。这里有一个关键点:平均数据可能来自普通人,但数据集也包含所有聪明人所写与所想的一切,所有这些内容都在数据集中。

这引出了如何通过特定的提示来引导 AI ,让它能够使用数据集中超级天才的内容进行训练。如果以不同方式构建提示词,可以引导 AI 沿着数据集中不同路径前进,从而得到不同类型的答案。

举例来说,如果要求 AI 编写一段执行某项任务的代码,比如排序一个列表或渲染一个图像,它会给出普通的代码。

但如果要求它编写安全代码,它会生成更少安全漏洞的优质代码,这非常有趣。这是它访问了一个不同的训练数据集,即安全代码的数据集。

再比如,如果要求 AI 以电玩游戏程序员 John Carmack 的风格,编写图像生成程序,你会得到好得多的结果,它能够接触到数据集中来自 John Carmack 编写的代码,他可是世界顶级的图形程序员。

可以想象,在许多不同领域中,通过精心设计的提示词,我们可以解锁 AI 潜在的超级天才能力,从而得到默认答案之外更优秀的答案。

Marc Andreessen 我赞同这个观点。我认为 AI 的智能,可能存在潜在的极限。我们之前讨论过,世界非常复杂,智能就是如何能够更好理解、描述、代表这个世界。

当前的 AI 迭代中,由人类构建结构,再把构建出的结构输入到 AI AI 擅长预测人类如何构建世界,而不是世界实际是怎样的。后者可能更为复杂,也许在计算中不可简化。

我们是否会遇到一个极限, AI 可以非常聪明,它的极限是与最聪明的人类一样聪明,而不是比最聪明的人类更聪明。

还有一个相关问题, AI 能否想象出全新的事物,比如新的物理定律等。能够做到这一点的人类,可能只有三十亿分之一,这是一种非常罕见的智能类型。

AI 仍然极其有用,但如果它们是人工人类,而不是所谓的超级人类,它们扮演的角色会有所不同。

Ben Horowitz 就拿 AI 性能可以提升百倍的超级乐观情况来说,愤世嫉俗的人会说, Sam Altman 宣称 AI 会优秀百倍,这恰恰是它们不会变得更好。 Sam Altman 这么说,基本上是出于恐吓的目的,阻止其他人参与竞争。

Marc Andreessen 我认为,无论 AI 是否会优秀百倍, Sam Altman 都会宣称这一天终将会到来。对于不了解 Sam Altman 的人而言,他是一位非常睿智的人。但毫无疑问,他是一位好胜心强的天才。作出任何决定之前,必须考虑到这一点。

Ben Horowitz 如果 AI 性能提升有限, Sam Altman 可能会说它们会变得更好;如果它们确实有望大幅提升,他同样也会从这个角度进行宣扬。毕竟,为什么不?

现在,让我们来探讨一个乐观的论点, AI 性能可能会提升百倍、甚至千倍,长期保持上升趋势。

我将要提出的每个观点,都可能存在争议,但在 AI 领域里,许多睿智的人,都支持我的观点。

首先,神经网络内部正在出现泛化学习,这一点通过内省技术 introspection techniques 得到证实。

此类技术,使我们能够观察神经网络内部的神经回路,是如何在训练过程中演变的,神经网络正在发展出通用的计算功能。

例如,最近有人通过在大量国际象棋游戏上训练神经网络,网络内部构建了一个棋盘模型,能够走出创新性的棋步。

所谓的过度训练,即对同一模型使用相同数据,进行更长时间训练,被证明是有效的。特别是, Meta 与其他一些公司,最近一直在讨论过度训练是如何工作的,基本上继续对同一个模型进行训练,对相同的数据进行更长时间训练,投入更多计算周期。一些领域的专家甚至认为,这种方法效果非常好,不担心增加训练会导致收益回报递减。

Marc Andreessen Meta 最近发布的大语言模型 Llama 中,使用的主要技术就是过度训练。有专家告诉我们,目前我们可能不需要更多数据来提升这些模型性能,我们需要的是更多计算周期。通过大幅度增加训练次数, AI 性能有望得到显著提升。

Ben Horowitz 监督学习 supervised learning 在数据标注方面,对 AI 的提升作用不容小觑,它为这些模型带来巨大性能飞跃。

Marc Andreessen 我们目前听到许多关于 AI 自我完善循环的传闻与报道,这些循环正在积极进行中。

该领域的许多前沿实践者认为,某种形式的自我完善循环已开始奏效。这涉及到让 AI 执行所谓的思维链 chain of thoughts ,让它逐步解决问题,直到它能够熟练掌握这一过程。

通过在这些答案上,对 AI 进行再训练,可以在推理能力的各个周期中实现类似叉车式升级,即用户为获得新技术所带来的好处,必须用新设备取代旧硬件的情况。

许多专家认为,这种自我完善的方法,现在已开始发挥作用。还有关于合成数据的讨论,对此仍有激烈辩论,有相当一部分人对此持乐观态度。

大语言模型可能在编写代码方面表现出色,它们在验证代码方面可能更出色,相对于编写代码,大语言模型更擅长验证代码,这将是巨大的进步。这同时意味着 AI 可能需要学会验证它们自己生成的代码,它们确实具备这样的能力。

我们对 AI 系统有一种拟人化的偏见,这可能会误导我们,我们倾向将模型视为它。我们会产生疑惑,它怎么可能在验证代码方面比编写代码更出色。

AI 不是单纯的它,它是一个巨大的潜在空间,一个庞大的神经网络。在这个网络中,编写代码与验证代码,可能是由完全不同的部分组成,这两者之间没有必然的一致性要求。

如果 AI 在其中一方面表现得更好,它擅长的部分,有可能使其不擅长的部分也变得越来越好,这就是自我完善的潜力。

还有许多其他因素,也在推动 AI 的发展。例如,目前芯片的极度短缺,限制许多 AI 系统的潜力,随着时间推移,这种限制将逐渐解除。

还有数据标注的问题,目前 AI 系统中已积累海量数据,全球还有更多数据等待挖掘。从理论上讲,一些领先的 AI 公司,正在投入资金生成新数据;即使是开源数据集的质量,也在稳步提升。我们可以预见到,数据质量与数量的显著改进。

大量资金正在涌入 AI 领域,为此类技术的发展提供强有力的支持。

同时,系统工程的工作,也在同步进行,许多最初由科学家构建的系统,现在有了世界级工程师的加入。他们正在对这些系统进行精细调整,使其运行得更加高效。

Ben Horowitz 也许这并不是一个简单的选择,这不仅使推理过程变得更加高效,也提高训练过程的效率。

Marc Andreessen 我们还有其它改进的领域。

例如,微软最近发布小语言模型,有报道称它在性能上能与更大的模型一决高下。

微软所做的关键工作之一,是优化了训练集。具体来说,他们去除了训练集中所有重复副本,专注使用一小部分高质量数据进行训练,不是依赖大多数人所使用的大量低质量数据。

把所有这些因素叠加在一起,我们得到大约 8~10 个不同的改进方向组合,这些方向既有实践性的,也有理论性的,它们都在同步进行中。在我看来,很难想象这些因素的组合,不会带来从当前水平起步的显著进步。

Ben Horowitz 我完全赞同,这肯定会发生。

就像回到 Sam Altman 的问题,或他的提议,如果你创办一家 AI 初创公司,认为自己技术在 2 年内才能达到 GPT-4 水平,你会考虑不应该再继续,那将是糟糕的决定。

Marc Andreessen 这涉及到许多创业者担心的问题。他们试图解决的问题是,我知道如何利用聊天,知道如何构建 SaaS 应用,也知道利用大语言模型来制作出色的营销材料。

假设这是一个非常简单的事情,我为此构建了整个系统。会不会在 6 个月后,大模型仅通过简单的提示词,就能更好制作营销材料,使我看似复杂的系统,变得无关紧要,大模型直接做到了。

可以这样想,很多当前 AI 应用公司,都被称为 GPT 包装者,在 ChatGPT 周围有一层薄薄的包装,意味着 ChatGPT 可以将它们商品化或取代它们。

反方观点,有点类似称所有旧的软件应用程序,都是数据库包装者。

事实证明,围绕数据库的包装,就像大多数现代软件一样,很多这样的软件,最终都非常有价值,围绕核心引擎有很多构建的东西。当企业考虑构建应用程序时,该如何思考?

Ben Horowitz 这是非常棘手的问题,存在着正确性差距。

比如,为什么我们有微软推出的 AI 助手 Copilot ,而不是 AI 驾驶员;目前没有 AI 飞行员,只有 AI 副驾驶。

这归结为,我们无法信任 AI 系统在绘制图像、编写程序,甚至在没有编造引用的情况下,撰写法庭简报时是正确的。

所有这些事情,都需要一个人,没有人的参与,相当危险。我认为,从应用程序层面来讲,为了使它真正有用,需要把副驾驶变成飞行员。

我们能做到这一点吗?这是一个有趣、困难的问题。

还有一个问题是,在模型层面更好完成,还是在顶部的某一层完成。通过做一些事,比如使用代码验证提炼出正确的答案,还是说这只是模型能够做到的事情,我认为这是悬而未决的问题。

当进入一个领域,可能还有围绕事物的包装。我认为有一个模型不擅长的领域,就是流程。

在数据库世界里,就像数据库类比一样,有一部分任务,是在律师事务所写简报,但还有 50 个其他任务与事情,需要整合到公司的工作方式中,比如流程、编排等。

也许有很多这样的事情,比如如果在制作视频,有很多工具,比如谁将写歌词,哪个 AI 系统写歌词,哪个制作音乐,所有这些如何结合在一起,如何对它们进行整合等。所有这些事情,往往需要真正理解最终客户等。

这通常是应用程序与过去平台不同的地方,它们具有关于客户如何使用它的真正知识,这与平台设计的目的无关。把这些从平台中提取出来,对于企业或个人而言,非常的困难。

我认为这些事情可能会奏效,特别是如果流程非常复杂,这是有趣的事情。

Marc Andreessen 我经常建议创始人,从定价策略的角度思考问题。也就是说,可以从最终的商业价值出发,反向推导。换而言之,首先确定你的技术,能为客户带来多少价值,基于此价值,来设定价格。

技术专家通常会首先考虑自己的技术能力,再决定如何把它商业化,思考如何定价。他们会在成本与自己认为合理的加价之间,寻找平衡点。

如果他们拥有市场垄断地位,可能会设置更高的加价,这是一种以技术供应为导向的定价模式。

还存在一种截然不同的定价策略,基于价值的定价模式,这种模式关注的是产品或服务,对客户的商业价值,不是单纯的成本加成。

举例来说,如果我们谈论的是价值 100 万美元的商业机会,是否能够以此商业机会的 10% 定价,也就是 10 万美元作为价格。

这种定价策略的逻辑在于,如果产品或服务对客户来说值 100 万美元,他们可能会愿意支付 10% 的费用来获取它。

Ben Horowitz 在我们的投资组合中,就有一家专注于讨债等服务的 AI 初创公司。想象一下,如果能够通过一个副驾驶式的解决方案,用更少人力追回更多债务,这个解决方案的价值,远远超过购买 OpenAI 许可证的成本。

OpenAI 许可证本身,并不能直接帮助追讨债务,这家初创公司的解决方案,能够显著提高讨债者的效率。关键在于,如何弥合产品价值与客户支付意愿之间的差距。

有一个非常重要的观点:检验你的商业想法是否优秀的一个重要标准是,你能够为其收取多少费用。你是按照为客户带来的价值来定价,还是仅仅根据客户需要投入的工作量来定价。在我看来,这才是真正的试金石,用以衡量你所创造的价值深度与重要性。

Marc Andreessen 从技术投资者角度看,存在一些难以准确评估的企业类型。这些企业,提供了针对商业问题的具体解决方案,这些问题对客户来说价值巨大,他们愿意支付相当价值的一部分作为费用。

这种模式意味着,即使企业在技术上差异化不是非常明显,它们仍然可以非常赚钱。由于这些业务的盈利能力,它们有能力深入思考技术如何融入业务,它们还能做些什么。例如, Salesforce.com 的成功故事就是如此。

Ben Horowitz 还有一种观点认为,随着所有模型的性能都在迅速提升,有开源模型如 Llama Mistral 等优秀模型可供使用,真正的价值创造点,将在于工具的编排与整合,你可以简单插入当时最佳的模型。

模型本身将在市场上相互竞争,最终可能会商品化,成本最低的模型将会胜出。有人认为,最佳策略是将强大的 AI 技术带给人们。

投机热潮背后的真相: AI 投资的现实与幻想

Marc Andreessen 有人询问:为什么风险投资公司,在明知 AIGC 初创公司近期不会盈利的情况下,仍然对此类公司进行巨额投资?

还有人问:如果 AI 降低创办初创公司成本,技术投资的结构将如何变化?

基本上讲,这两个问题是完全对立的。

如果从左眼模糊看,你会看到投资基础模型公司的资本,正在以惊人的速度增长。此类初创公司,正在筹集数亿、数十亿,甚至数万亿美元,这让人不禁惊叹这些公司的资本规模。

如果从右眼模糊看,你会发现,现在构建软件变得容易得多,拥有一家软件公司,或让一小群程序员编写复杂软件,变得容易得多,他们得到 AI 助手与自动化软件开发能力的支持。

创办一家 AI 应用初创公司的成本,可能会大幅下降,可能起步资金只需要创办 Salesforce.com 成本的 1/10 1/100 1/1000

我们如何看待这种二元性,即从任何一种角度,都可以看到成本要么大幅飙升,要么趋近于 0

Ben Horowitz 我们确实对这两种类型的初创公司,都有投资。我认为,历史上最快实现盈利的公司,是营收增速远远超出成本支出的 AI 公司。

我们的投资组合中,这些 AI 初创公司的营收增速相当快,增速已经超过成本增速。

开发基础模型,募集到数亿、甚至数十亿美元的初创公司,它们也在不断快速产生营收,所有这些公司的员工人数都很少。

我会说,甚至是像 OpenAI 这样初创公司,从员工人数相对于其营收的角度看,他们并不是家大公司。

如果你看看它们营收水平,他们达到这个水平的速度,员工人数相当少。此类初创公司的总支出巨大,它们都投入到模型创建中。

这是一个有趣的事情,我不确定该如何完全理解它,我认为,只要不是在构建基础模型,它将使初创公司运营更高效,并可能更快实现盈利。

Marc Andreessen 有一种非常乐观的反论点,建立新软件公司成本的下降,可能只是一种幻觉。这背后的原因是经济学中的一个现象,称为吉芬悖论 Jevons Paradox

吉芬悖论发生在技术进步,提高了资源使用效率,从而减少了任何单一用途所需的资源量,但资源成本的下降,又刺激需求增加,这种需求的增长弹性,足以使资源的总体使用量增加而非减少。

我们可以看到这种现象的案例,例如在高速公路上,它加剧交通拥堵。原因基本上是,有了更多道路,可以容纳更多人居住在这里;企业可以扩大规模,结果车辆比以往任何时候都多,交通状况变得更加糟糕。

或者可以想到工业革命期间,煤炭消耗的经典例子。随着煤炭价格下降,人们使用煤炭量比以往任何时候都多。人们获得更多动力,结果是使用更多煤炭。

这里悖论是,开发任何特定软件的成本下降,对此的反应,是对软件能力的需求激增,看起来像软件公司的起始价格将会下降,但将发生的情况是,由于软件能够实现的功能大大增加,产品质量将会大幅提升,产品路线图将会非常激动人心,客户将会非常满意,他们希望获得更多,结果将是开发成本上升。

以好莱坞为例, CGI 计算机生成图像,理论上应该降低制作电影的成本,却增加了,观众的期望上升了。

现在看好莱坞电影,满满当当 CGI 特效。电影的制作成本,比以往任何时候都要高。至少在好莱坞,结果是电影在视觉上更加精致,无论它们是否更好是另一个问题,它们在视觉上更加精致,更具吸引力,令人惊叹。

软件方面,终端用户能够获得更好软件,这让他们想要得到更多软件,进而导致软件开发成本上升。

Ben Horowitz 思考一下旅行这样的简单案例。

通过 Expedia 预订旅行是复杂的,用户需要点击不同界面,很可能会出错。

AI 版本的预订系统将是:送我去巴黎,让我住在我最喜欢的酒店,以最好的价格为我安排最好的航空公司机票,让这次旅行对我来说非常特别。

你也可以让 AI 提供的服务,变得更加复杂。比如说:我们知道这个人喜欢巧克力,我们将从瑞士通过联邦快递把世界上最好的巧克力送到巴黎这家酒店等。

可以说, AI 提供的服务,可以达到我们今天甚至无法想象的水平。目前还做不到这些,仅仅是软件工具,还不是它们将要成为的样子。

Marc Andreessen 我完全赞同你的观点。

设想一个场景:我傍晚 6 点抵达波士顿,期望与一群极具魅力的人士共享晚宴。

Ben Horowitz 这样的安排,在当下是任何旅行社都无法提供的,你也未必希望旅行社介入。

Marc Andreessen 你会逐渐意识到,这种个性化的体验,需要与我的个人 AI 紧密结合。

创意的无限可能,人类创造新事物的能力,一直是被低估的,这种能力似乎是无穷无尽的。

20 世纪上半叶杰出经济学家约翰 · 梅纳德 · 凯恩斯 John Maynard Keynes 曾预言,随着自动化普及,人们将不再需要每周工作 40 小时。凯恩斯认为,一旦基本的生活需求,如食物与住所得到满足,人们无需再为生存而工作。

但随着时间推移,人们需求也在不断增加,从冰箱、汽车、电视,到享受假期,需求似乎永无止境。

未来我们还会需要什么,我无法预知,可以肯定的是,总有人能够预见,并创造出新的需求,这些需求很快就会变得极具吸引力。

Ben Horowitz 凯恩斯在著作《我们后代的经济前景》中,提出了这一观点。

同样,卡尔 · 马克思 Karl Marx 也曾表达过类似看法。他认为在社会主义乌托邦实现后,社会将能够调节总体生产,让个人能够自由从事各种活动。

马克思曾描述:早上打猎,下午钓鱼,晚上养牛,晚餐后指点江山。这种生活图景,描绘了一种理想的生活状态。

如果我必须列出四件我不愿意从事的活动,它们将是打猎、钓鱼、养牛、指点江山。

凯恩斯与马克思的共同点在于,他们都对人们想要做什么,持有一种非常有限的看法。

人们渴望拥有使命感,希望拥有事业心,追求目标,成为有用的人,在生活中发挥积极作用。

这一发现,某种程度上是令人惊讶的。我一直认为,软件的需求基本上是完全弹性的,可能无限增长。随着软件成本持续降低,需求也会随之增长。

软件领域,总有新事项可以完成,总有新的自动化、优化、改进空间。一旦当前约束条件消失,人们就会想象出新的可能性。

AI 为例,目前一些公司正在开发具有高级功能的 AI 安全摄像头系统。过去,能够处理与存储来自不同摄像头的视频流,并提供回放界面的软件,就已经被认为是技术上的一大进步。

现代的 AI 安全摄像头,已经能够对环境中发生的事情进行实际的语义理解。它们能够识别特定的人,根据他们行为与表情,判断是否存在异常情况。

例如,系统可以识别出有人携带枪支,是他有打猎的习惯;其他人通常不会携带枪支,突然携带枪支并表现出愤怒表情,系统会判断出可能存在危险。这种具有语义理解的安全系统,显然比传统的安全系统要复杂得多,制造成本可能更高。

Ben Horowitz 设想一下,医疗保健领域,我们能够做到每天早上醒来时,进行一次全面的自我诊断,了解自己的健康状况。

例如,我们可以询问:我今天感觉如何?我所有生理指标都在什么水平?我应该如何解读这些数据?

医学诊断领域, AI 特别擅长处理高维度数据问题。当能够获取连续的血糖读数、偶尔进行血液测序等数据时,我们就能获得对个人健康状况深入洞察,追求更健康的生活是每个人的愿景。

目前,我们日常健康监测手段,如体重称重或心率监测,与未来可能实现的高级健康监测相比,显得十分原始。

数据资产的真正价值: AI 模型潜力与局限

Marc Andreessen 关于数据的讨论,有人提出问题:随着 AI 模型发展,它们允许我们以极小成本复制现有应用程序功能,这使得专有数据似乎成为最宝贵的资产。

在你看来,这将如何影响专有数据的价值?这种新兴环境下,企业应该集中精力构建哪些其他类型的资产?

还有人提问:在 AI 新时代中,企业如何保护敏感数据、商业机密、专有数据个人隐私?

为了引出讨论,我将从一个可能引起争议的观点开始,数据是新石油。这种观点认为,数据是训练 AI 、推动其运作的关键输入。

数据成为全新、限制性、极具价值的资源。 AI 训练过程中,这一点体现得尤为明显。许多公司在探索如何利用 AI 时,常会强调他们拥有的专有数据。

例如,医院、保险公司或其他类型的企业,可能会声称,他们拥有大量专有数据,可以利用这些数据与 AI 结合,创造出其他人无法轻易获得的成果。

我要提出的观点是,几乎所有情况下,这种看法并不成立,这只是一种模仿现象。

互联网上更广泛环境中可用的数据量是如此庞大,以至可能没有个人的具体医疗信息,我已经能够从互联网上获取到众多人在多种不同情况下的医疗信息,这些海量数据足以压倒性超越所谓的个人数据价值。

对社交媒体平台 X ,专有数据在某些方面可能略有用处,并不会带来显著的影响,在大多数情况下也不会成为一个关键的竞争点。

支持我这种观点的证据是,至今我们并未看到一个丰富或成熟的数据市场,不存在大型的数据交易市场。

相反,我们看到的是一些规模较小的数据处理市场,如数据经纪人,他们向客户出售大量互联网用户信息,但这些业务的规模相对较小。

如果数据真的具有巨大价值,它就会有明确的市场价格,我们会看到它在市场上的交易。我们并没有看到这种情况,这在某种程度上证明数据的价值,并不像人们想象的高。

Ben Horowitz 我赞同这种观点。原始数据,未经任何处理的数据集,价值往往被过分夸大,我完全同意这一点。

我能够想象到一些例外,例如某些特殊人群基因数据库,它们可能难以获取,在某些研究领域具有独特价值,这些数据不是随便可以在网络上找到的。

我可以设想,这些数据是高度结构化、通用,不易被广泛获取。

对于大多数公司所持有的数据,情况并非如此。这些数据要么是广泛可获取,要么是特定性、非通用的。

如此,一些企业已成功利用数据来提升业务成果。以 Meta 为例,利用数据取得显著成效,通过将数据输入自己 AI 系统,以惊人的方式优化产品。

我相信,几乎每家公司都能够通过利用自身数据来增强市场竞争力。认为公司只要收集一些数据,就能像出售石油一样将其变现,或者认为这些数据就是新的石油资源,这种想法不切实际。

有趣的是,许多我们认为最有价值的数据,比如企业自己的代码库,即企业编写的软件,很多都存放在 GitHub 上。

据我所知,我们合作过的任何一家企业中,没有哪家企业正在基于自己代码建立独立的编程模型,或者这是否是一个好主意,这可能是不必要的,已经有大量代码存在,系统已经在这些代码上进行充分训练,这并不是一个显著的优势。

我认为,只有非常特定类型的数据,才具有真正的价值。

Marc Andreessen 让我们把这一观点,转化为具体的行动指南。

假设我管理一家大型公司,如保险公司、银行、医院集团,或者是像百事可乐这样消费品公司,我该如何验证我拥有有价值的专有数据资产,我应该集中精力利用它,而不是将所有努力都投入到尝试优化使用该数据上,或者完全转向使用互联网数据来构建解决方案?

Ben Horowitz 以保险业务为例,如果你身处该行业,你的所有精算数据都是有趣、相关的,我不确定是否有人公开发布过他们实际的精算数据。我不确定你如何能够仅凭互联网上数据来训练模型,这是一个值得探讨的好问题。

Marc Andreessen 让我提出一个挑战性的假设:假设我是一家保险公司,拥有 1,000 万人的记录,包括他们精算表、生病、去世的时间等信息,这听起来很不错。

互联网上已经有大量关于大规模人群的一般精算数据,政府会收集这些数据,进行处理,发布报告,还有众多第三方与学术研究的数据。

你的大型数据集,是否为你提供了任何额外的精算信息,这些信息在互联网上的更大数据集中尚未提供?你的保险客户在精算上,是否真的与普通人群有所不同?这些问题,值得每一位数据管理者深思。

Ben Horowitz 我认同这样的观点:保险业务中,当客户申请保险时,公司通常会要求进行血液测试等健康检查,以获取客户健康状况信息。这些信息,包括客户是否吸烟等生活习惯,对保险公司来说,这些都是重要的数据。

在一般的数据库中,可以知道谁去世,往往不清楚这些人之前具体健康状况与生活习惯,保险公司真正寻求的是,对于具有特定档案与实验室结果的人群,他们的预期寿命是多长,这也正是数据价值所在。

有趣的是,像 Coinbase 这样的公司,防止非法入侵方面,拥有极其宝贵的资产。他们在这方面投入大量工作,肯定积累了大量关于各种入侵尝试的数据。这些数据可能非常特定于试图非法进入加密货币交易所的人群,这些数据对 Coinbase 来说可能非常有用。

我不认为他们能够将这些数据出售给任何人,我认为,如果每家公司都能将数据输入到一个智能系统中,都会有助于他们业务。我认为,几乎没有公司拥有可以简单出售的数据。

还有一个中间问题需要考虑,哪些数据是你愿意让微软、谷歌或 OpenAI 等公司获取的。

我认为,企业正在努力解决的,不是我们是否应该出售我们数据,而是我们是否应该训练自己模型以最大化价值,或者我们是否应该将数据输入到大型模型中。

如果我们将数据输入到大型模型中,所有竞争对手是否都会获得我们刚刚输入的信息?我们能否信任大公司不会利用我们数据?如果企业竞争力依赖于此,可能不应该这么做。

Marc Andreessen 至少有报道指出,某些大公司正在使用他们本不应该使用的各类数据来训练他们模型。

Ben Horowitz 我认为这些报道很可能是真实的。或者,他们应该开放数据。我们之前已经讨论过这个问题,声称没有窃取人们数据,或以未经授权的方式获取数据的公司,拒绝透露他们的数据来源。

为什么不告诉我们,你的数据来自哪里?事实上,他们试图关闭所有开放性,没有开源、没有开放权重、没有开放数据、没有任何开放的东西,试图让政府这样做。如果你不是窃贼,那你为什么要这么做?

Marc Andreessen 确实如此。举保险领域的事例,使用遗传数据,进行保险目的是非法的。

美国有一项《 2008 年遗传信息非歧视法案》的法律,基本上禁止美国健康保险公司使用遗传数据进行健康评估。由于基因组学正在变得非常先进,这些数据如果真的用于预测人们何时生病与去世,可能是最准确的数据之一,而他们被禁止使用这些数据。

Ben Horowitz 我认为这是一个有趣的例子,它反映良好意图在政策制定上的奇怪误用,这可能导致的死亡人数比 FDA 等所有健康政策所拯救的人数还要多。

AI 领域,获取关于所有人生病原因、他们遗传信息等数据,是最宝贵的资源,这就像是新石油。如果能够将这些信息匹配起来,我们将永远不会不知道为什么生病,能够使每个人都更健康。

为了阻止保险公司对更有可能去世的人进行过高收费,我们封锁了所有这些数据。更好办法是,对更有可能需要的人,我们大规模补贴医疗保健,就像我们通常对个人所做的那样,解决这个问题,而不是封锁所有数据。

Marc Andreessen 关于保险,有一个有趣的问题是,如果你拥有关于个体结果的完全预测性信息,保险的整个概念是否仍然有效,保险的全部理论是风险共担。

你不知道具体案例将会发生什么,这意味着你建立这些统计模型,进行风险共担,根据发生的具体情况有可变的赔付。

如果你拥有所有这些预测性的基因组数据,确切知道每个案例将会发生什么,风险共担突然就不再有意义。你只会说,这个人将会花费 X ,那个人将会花费 Y

Ben Horowitz 现行的健康保险体系,本质上似乎并不合理。保险的概念,源自农业保险,农民们共同出资建立一个基金,以让个别人农作物歉收时,能够得到补偿。这种机制,旨在应对灾难性、不太可能发生的事件。

现实中,每个人都需要就医,人们健康状况各异,健康保险通过一个增加成本、官僚程序、大型公司的复杂系统来运作。

如果我们目标是为人们健康买单,为什么不直接为医疗保健服务买单?若要阻止人们过度就医,提高自付额,似乎是一个更直接的方法。

Marc Andreessen 从正义与公平角度出发,如果预知某人医疗费用将高于他人,是否应由我为其支付更多?如果我们可以准确预测个人的医疗成本,或者拥有一个高效的预测模型,社会成员共同分担医疗费用的意愿,可能会显著下降。

Ben Horowitz 遗传上的因素,是个人无法控制的,个人的行为却可能显著增加患病的风险。我们或许可以通过激励措施,来鼓励人们保持健康,不仅是支付医疗费用以延长生命。

在我看来,美国当前的医疗保险系统,设计极度不合理,存在许多可以改进的地方。与其他一些国家相比,美国体系显得十分荒谬。

从互联网泡沫到 AI 繁荣:历史会重演吗

Marc Andreessen 当前 AI 发展,与互联网 1.0 时代之间,最显著的共同点是什么。对此,我提出一个理论。

由于我在互联网早期的角色,你在网景公司的经历,我们经常面对这样的问题。互联网的兴起,是技术史上一个重要事件,至今仍被许多人铭记。

人们倾向于通过类比来进行推理,认为 AI 兴起,必然与互联网繁荣相似,创办 AI 公司也许类似创办互联网公司。

我们收到许多类似问题,它们都是关于类比的。我个人认为,这种类比,在很大程度上并不适用。某些方面它确实有效,但在大多数情况下并不适用。原因在于,互联网是一个网络系统, AI 是基于计算机的技术。

Ben Horowitz 的确如此。

Marc Andreessen 为了增进理解,我们可以将当前的讨论,与个人电脑的兴起或更恰当地说,与微处理器的发展类比,我的类比可以追溯到大型机时代。

互联网的显著成就在于它作为一个网络,将众多现有计算机连接在一起,人们为了与互联网相连而设计了各种新型计算机。

关键点在于,互联网本质是一个连接的网络。这一点至关重要,互联网行业的动态、竞争格局、初创企业的活动,大多与构建网络或开发网络应用程序有关。

互联网时代的初创企业,深受网络效应的影响,当你将大量人群连接起来时,所产生的正反馈循环,例如梅特卡夫定律所描述的网络价值,随着用户数量增加而增长。

AI 领域存在网络效应,但更类似微处理器或芯片,即作为一台计算机。它是一个系统,数据输入、处理、输出,产生结果。这是一种新型计算机,概率计算机,一种基于神经网络的计算机。它并不总是给出精确结果,有时甚至可能与你争辩,拒绝回答你的问题。

Ben Horowitz 这种新型计算机,本质上与传统计算机截然不同,它能够以更压缩的形式构建复杂事物。它拥有新的、不同的、有价值的能力,它能理解语言与图像,完成以往确定性计算机无法解决的任务。

我认为,从计算机行业早期或微处理器的早期阶段,汲取的类比与教训,比互联网早期的经验更为贴切。

这并不意味着技术发展过程中,不会出现繁荣与萧条的循环,人们对技术的期望,往往会经历从过度兴奋到过度悲观的转变。

我们可能会看到芯片与能源等方面过度投资,我认为,网络的本质与计算机的发展路径,在演变方式上有着根本的不同,采用曲线也将有所不同。

Marc Andreessen 这引出我对行业未来发展方向的思考。我们面临的一个关键问题是:这个行业将如何发展?是会出现几个大型模型,还是会有大量不同规模的模型?

计算机行业的历史,特别是最初 IBM 大型机时代,为我们提供了洞见。这些大型计算机庞大、昂贵,数量有限。当时普遍观点是,世界上只需要几台计算机。

IBM 创始人托马斯 · 沃森 Thomas Watson 甚至认为,全世界可能只需要 5 台计算机。这种观点,是基于政府与几家大型保险公司的需求。随着计算机产业经历 50 年发展,我们看到计算机技术多样化与普及。

Ben Horowitz 还有谁会需要做多的数学运算呢?

Marc Andreessen 究竟是谁需要跟踪庞大的数字?又有谁需要高水平的算力?这种需求,在当前看来似乎并不相关。

早期的计算机不仅体积庞大,价格昂贵,这使得它们成为只有少数人能够负担得起的奢侈品。

除了购买成本,需要考虑到维护这些计算机所需的人力成本。在那个时代,计算机的体积之大,以至需要专门为它们建造一整栋建筑。

你会看到穿着白色实验室外套的工作人员,他们负责照看这些计算机,必须保持极高的清洁度,否则计算机可能停止工作。

这种情景,催生了 AI 上帝模型,即大型基础模型的概念,上帝大型机的想法,即只有少数几台这样的设备存在。

如果你看过老科幻电影,通常会有这样的设定:存在一台大型超级计算机,它要么在执行正确的任务,要么在做错事,如果它在做错事,电影的情节通常就是围绕如何修复或击败它展开。

这种单一、自上而下的概念,在最的几十年里一直持续存在。

随着计算机开始变得更小,我们进入小型计算机时代,这是下一个阶段。小型计算机成本,从 5,000 万美元降到 50 万美元,但对于普通人来说,仍然是一笔巨大的开支。

只有中等规模公司,能够购买小型计算机,普通家庭无法承担。

随后,个人电脑出现,进一步降低成本,大约在 2,500 美元左右。

智能手机的出现,进一步将成本降低到大约 500 美元。






请到「今天看啥」查看全文