专栏名称: 范阳
Being more human, less perfect.
目录
相关文章推荐
警民直通车上海  ·  难道这是现代版的掩耳盗铃吗? ·  2 天前  
8099999街头巷尾  ·  微信牵手DeepSeek?有人趁虚而入,这种 ... ·  3 天前  
8099999街头巷尾  ·  微信牵手DeepSeek?有人趁虚而入,这种 ... ·  3 天前  
短剧新圈  ·  龚宇炮轰红果背后,是长视频平台的焦虑 ·  3 天前  
短剧新圈  ·  龚宇炮轰红果背后,是长视频平台的焦虑 ·  3 天前  
51好读  ›  专栏  ›  范阳

机器人技术的 FOMO,规模法则与技术预测。

范阳  · 公众号  ·  · 2024-06-21 19:59

正文

当下正在分别快速发展的几个领域在不久的未来又必定走向融合:

  1. 人工智能
  2. 下一代计算机 / 人机交互界面 / 脑机界面
  3. 机器人技术
  4. 个人移动设备
  5. 无人机技术
  6. 混合现实



最近看到 Science 公司的创始人 Max Hodak 也有类似的 “模糊” 观察。
今天分享的这篇文章还是来自前沿科技投资基金 Compound 的创始合伙人 Michael Dempsey的个人博客,他是一位出色的技术研究型年轻风险投资人。
这篇文章的主题是讨论最近一段时间很多投资和资源涌入AI + 机器人技术 ,我觉得他重要的观点是:
1. “ 我现在坚信,初创公司在未来 10-15 年的时间跨度内,应该做最大胆的( 并且最大化能够捕捉市场价值的 )事情,同时在实现这些宏伟目标的过程中,通过达到小里程碑成就不断积累经验。我与市场主流的潜在分歧在于,很多人认为,与其按照你相信的未来顺序进行排列组合,不如直接从零到一一步到位发展成一款通用的、完全自动化的、人形机器人,而中间的小事情根本不重要。”
2. “当下往往被共识和资本所主导,导致估值膨胀、竞争过度和回报减少。相反,公司和投资优势的未来可能在于理解技术进步和市场动态的微妙复杂相互作用,并预见更深层次的、不那么显而易见的第二和第三阶效应。”
希望这篇文章对你有启发。周末愉快。


机器人技术的 FOMO、 规模法则 与技术预测。
ROBOTICS FOMO, SCALING LAWS,
& TECHNOLOGY FORECASTING
作者:Michael Dempsey
编辑:范阳
写作时间:2024年6月20日

在科技领域中, 理解某些一阶拐点的二阶效应一直是一种获得不错盈利的投资策略 ( fairly profitable investment strategy in technology has always been understanding second-order effects of certain first-order inflection points )。简单来说,如果 X 可能发生,那么 Y 就可能会发生。因此,如果我们认为 Y 发生的可能性或规模比整个市场预期的更高,我们应该对 Y 进行押注 ( we should speculate on Y )。
这是一种关于技术进步、衍生理解和运用想象力的思维方式( A thinking of technology progression, derivative understanding, and imagination )。
但在过去几年里,发生了一些事情,这些事情可能压缩了这种策略的回报,并且也改变了这些次级效应和由此产生的新兴类别如何资本化,以及初创公司如何建立优势的动态。
通过人工智能的视角,以及对机器人技术的关注和共识的上升,能够很好地观察到这种变化。


“清晰看待现在” 的谬误与预测未来的超额收益
THE FALLACY OF SEEING THE PRESENT CLEARLY & ALPHA OF PREDICTING THE FUTURE

最近在 Lesswrong 网站上有一篇文章探讨了高阶预测( higher order forecasts )的概念,并将其从基本事实一直细化到三阶预测,为思考如何解析技术市场变化和初创企业投资提供了一个不错的框架。
有关高阶预测:
https://www.lesswrong.com/posts/8BAZmmqhD98YBrfsC/higher-order-forecasts
在我的整个投资职业生涯中,我一直在思考如何围绕识别和押注未来拐点的想法来建立一家投资公司,并利用这些学习成果,通过对变化所产生的连锁效应进行细致而准确的分析来捕捉价值。我们的基金( Compound )构建了我们所相信的未来的集合,并利用资本和时间帮助杰出的创始人加速实现那些预测的未来。
我们在内部建立了许多框架和流程,围绕更高层次的技术发展以及更细粒度的行业和社会发展进行预测。有时,我们会开展面向公众的研究,例如《 A Crypto Future 》系列,在其中我们逐年推理加密货币作为一个行业如何变化以及世界如何围绕加密货币变化。
尽管我对这种方法深信不疑,但一直以来,许多其他风投公司都在大声质疑 “预测未来” 这种投资方式的正确性,许多人引用了风投界最被曲解的名言之一,由传奇人物 Matt Cohler 所说的:“ 作为投资者,我们的工作是清晰地看到现在,而不是预测未来 ( Our job as investors is to see the present very clearly, not to predict the future )。”
我曾经就上面这句话也就是说 它是一种产生超额收益的策略,我 激烈辩论过这一观点在早期风险投资当中的细微差别( I have loudly debated the nuance of this statement as an alpha generating strategy at the early stage ),只有在拥有超过 1 亿美元管理的风险投资公司不在少数,而且这些公司都相互了解、相互合作( 就像过去的世界一样 )的情况下,我才会对这一说法深信不疑。


我认为,今天 “清晰地看清当下” ( to see the present clearly )意味着在没有任何持久产品市场契合度的情况下,以 75-200 倍 ARR 的估值支付,与其他 4-6 份条款清单( term sheet )一起签署,或者意味着你会悄悄地投入一笔小额支票,这对基金表现不会有实质性影响。这种做法可能适用于构建单一的贝塔捕捉基金( a single beta-catching fund ),但我不认为在这种动态中能够构建一个持续产生阿尔法收益( a consistently alpha-generating firm )的公司。
范阳注:在投资领域,beta 代表通过跟随市场发展或行业上升趋势而获得的确定回报,而 alpha 则代表通过独特的投资策略和见解而获得的超额回报。
由于这种压缩回报的市场动态( return-compressing dynamic ),许多投资者拼命地试图了解下一步会发生什么,同时放弃了看起来略显过时的东西 ( frantically looking to understand what is slightly next while abandoning what feels slightly over )。这部分是因为简单邻近性的预测很容易让合伙人达成一致,也容易向有限合伙人( LPs )推销,并且很容易快速产生信心( the forecasting of simplistic adjacencies is easy to rally a partnership around, easy to sell LPs on, and easy to gain conviction on quickly ),因为你会觉得自己比那些只押注于特定领域中公认的领先公司的 “一阶思维者” 要聪明一些。
然而,既然这篇文章关注的是早期投资阶段,这通常意味着,为了使这种策略成为正确的策略,早期的公认领导者必须保持领先地位。这在竞争激烈和拥挤( 共识 )的领域中是一个悬而未决的问题,因为今天私募市场的资本规模,往往需要很多年才能看到复合的护城河效应( This is an open question in highly competitive and crowded consensus areas where because of the scale of capital in private markets today, it often takes many years to see compounding breakaway moats)。
这种投资风格也有成熟的框架,风险投资家们喜欢用这些框架来进行模式匹配。比如, 在技术 “淘金热” 中 “卖铲子”,或者将重资产行业转型为轻资产行业,同时捕捉与重资产行业相同的价值。 理论上,投资者通过隔离变量并尽量减少对各个相互关联的未来的正确预测的要求( isolating variables and minimizing the need to be correct on various sequentially tied together futures ),尽管这非常困难。
然后,还有激励机制,这在理论上是一种极其盈利的投资策略。
投资者总是领先资本市场一步,他们将前一阶段视为投资的 “已知宇宙”,并在 1-4 年内捕捉到估值上升,同时在 3-5 年内募集新基金,周而复始。无论是获得成功,讲述新的故事( 比如 “我知道第三只基金失败了,但第四只基金中的这家公司表现得非常好” ),还是收取一大笔费用,使有限合伙人( LPs )基础的杠杆降低 / 换手率高( un-levering/churn of their LP base  ),这样他们在 20 年的时间跨度内从每年赚取数千万美元减少到数百万美元。
当然,这种策略会奏效直到不再奏效,但到那时,唯一可能处于更糟糕境地的是投资者的声誉( 以及可能是 LPs 的机会成本 )。

人工智能与市场预测
AI AND FORECASTING

随着人工智能的不断进步,我们已经看到许多基础事实和一阶效应进入市场,导致了大量的 “信念” ( conviction )产生。


随着这一现象的出现,一种共识智慧在市场的两边( 开发者和投资者 )迅速传播开来。这始于人们直接将模型参数大小与质量关联起来,这促使许多人深入探讨,并逐步理解了最显著的规模扩展定律( Scaling Laws )的概念。 从 2022 年到 2024 年,规模扩展定律( Scaling Laws )成为投资者间的常见术语,现在人们开始将这一概念视为全球性真理,并将其应用到其他相邻领域,比如机器人技术。
这导致了我在风险投资中见过的最快的 “第二阶预测” 所产生的最快的谢林点( Schelling point )。
范阳注:Schelling point( 谢林点 )是指在博弈论中的一个概念,由诺贝尔经济学奖得主托马斯·谢林提出。它指的是在缺乏明确沟通或协调的情况下,参与者可能会自发地选择的一个点或策略,因为他们认为其他参与者也会选择这一点或策略,从而达到一致行动的结果。
这一切是如何发生的呢?
再次运用之前的预测框架,并将其应用于人工智能,有助于理解在机器人技术领域发生了什么,以及驱使投资者盲目乐观的明确押注。
重要的是要记住,预测具有各种程度的共识性,以下列出了投资者和创始人在人工智能进展方面做出的明示和暗示的押注( both the implicit and explicit bets ),展示了最显然和最具共识的预测形式。

0阶预测( 基础事实 )
0 ORDER-FORECASTS (GROUND TRUTH)

GPT-4 是一款性能非常强大的大语言模型( LLM ),而且多模态功能也正在发挥作用。
为了提升大语言模型的性能,需要算力和数据( 我们可以讨论规模扩展定律是否适用等问题,但暂且将其视为基础事实 )。
在确立这些基础事实后,我们可以看一些不同的预测以及人们对这些预测的看法所带来的行为变化。

一阶预测
1ST-ORDER FORECASTS

有人能够取代 OpenAI 成为领先的前沿模型开发者的可能性有多大?
这导致很多人将资金投入到 OpenAI 和其他新实验室,如 Anthropic、Mistral 等,尽管每个实验室的投资理念略有不同。人们在各种商品化曲线上、作为人工智能实验室核心知识产权的 "秘密 "的转让( 而非实际技术)、主权模型的采纳等方面进行了押注( People were betting on everything across commoditization curves, the transfer of “secrets” being the core IP in AI labs,not the actual technology, an uptake of sovereign models )。
哪些人会是人工智能模型性能提升中最明显的直接受益者?

这导致人们看好科技巨头( hyperscalers ),其中一些需要更长时间才能让人们对其建立足够的信心。Meta 显然是受益者,因为他们拥有能够从广泛的人工智能中提高效率产生现金流的产品,他们受益于模型的商品化,并积累了大规模的算力。
Alphabet 受益较慢,因为人们过分关注了他们在人工智能领域领先地位的丧失,尽管他们在过去十多年中是最有能力的人工智能组织。
Microsoft 是最明显的交易对象,既具有分销能力,又有理论上对 OpenAI 的控制( 尽管苹果的新闻可能对此产生了一些怀疑 )。
与此同时,从叙事角度来看,苹果进展缓慢,看起来已经完成, 然后所有人似乎都记起苹果在本地计算渗透力 / 分销方面( local compute penetration/distribution )的强大优势 ,由于苹果人工智能与 OpenAI 的一些演示,股价上涨了超过 3000 亿美元的幅度。
现在,随着 Adobe 等公司的盈利增长( 股价也因此大幅上涨 ), 投资者开始关注价值创造从超大规模科技巨头转向更垂直的公司 ( investors are starting to look at a rotation of value creation from hyperscalers to more vertically-focused companies )。随着人们开始逐渐理解企业在人工智能积累优势方面的一点点成果后,开始平静下来,最初对广泛毁灭的担忧也在减少。
现有的人工智能模型可以在哪些行业中表现出色( What industries can existing AI models serve well)?
这可能是风险投资家和创始人们最重要的一阶预测(first-order forecast )。这导致了我会委婉地称之为对人工智能生态系统中低垂的果实的激进资金投入,以及大量公司瞄准法律、研究、会计、营销等高级劳动用例的市场动态。
谁在制造 GPU,并且供需失衡会持续存在吗?
这导致人们都急于看好英伟达( Nvidia ),以及类似超微电脑( SuperMicro,SMCI )等周边公司,同时猜测谁在逆势而动,并将市值从老牌企业转移到新兴公司( 稍后会详细说明 )。

二阶预测
2ND-ORDER FORECASTS

随着我们逐步理解这些一阶影响的衍生物,我们开始关注其二阶影响。这也是我写下这篇看似多重人格的文章的原因。
未来是否需要构建新类型的基础设施和开发工具来支持人工智能应用层的公司 ( Will new types of infrastructure and dev tools need to be built to enable the AI application layer companies)?
回到我们之前关于 “淘金热卖铲子” 的观点,这是风险投资中最常见的衍生物,也是最容易观察到的投资策略框架。在 ChatGPT 推出几个月后,我们看到了一些公司的涌现,它们注意到了 GPT-3/3.5 的不足,并试图用窄楔子将其粘合起来,希望进一步扩展到更多的横向开发者平台,或创建“人工智能专用”( AI specific )的新型工具。
然后世界上发生了思维链、提示词工程等概念的兴起,并最终发展到计算优化、数据集评估等领域。这些工具在模型提升性能的同时,逐渐融入到了原生模型的用户界面 / 应用程序接口调用中,这体现了 “现在看的很清楚” ( seeing the present very clearly )的思维,似乎对未来看到的不多。
诚然,如果以外科手术般精准的方式或大体量投资的方式进行,这是一种非常有利可图的投资方式,因为新平台往往需要新的基础架构和开发工具范式。然而,通常情况下, 在这些时刻的早期行动者并不总是处于有利地位,除非他们能够建立起非常庞大的开发者群体,并且能够迅速根据市场调整方向 ( the early movers in these types of moments are not advantaged unless they build a very large critical mass of developers and can pivot quickly )。然而,这通常并不像预期的那样容易实现,尤其是对于那些资金充裕的团队。
在人工智能领域,早期的平台( 如 Databricks )公司展示出了非常强大的能力,他们通过并购,如 MosaicML 和 LilacML 等有趣的工具,成功地整合到他们的平台中。
或许还可以讨论的另一个话题是,这些时刻是否需要高度攻击性的收购( 相对于防御性收购 )。Mosaic 和 Tabular 的收购都是风险投资规模的退出结果(venture-scale outcomes),但正如我们稍后将讨论的那样,经过第一轮高估值并购后,通常也会受到收购者股价的增值驱动( acquirers stock price appreciation ),许多公司可能会在某一新兴领域的企业估值上过度调整,并最终只能接受理性的并购价格现实,就像我们在移动、云计算、自动驾驶等领域的早期并购浪潮中所看到的情况一样。

这个预测让很多人开始思考, 在当前市值约为 3.2 万亿美元的情况下,是否应该持有或抛售英伟达( NVDA ),以及是否支持专注于解决模型瓶颈或在 AI 特定问题上具有更高性能 / 效率的新型计算方法 ( back novel compute approaches focused on solving bottlenecks or having higher performance/efficiency for AI-specific problems )。
有趣的是,在先前的人工智能周期中,有很多资金投入到这个投资观点中,因为许多人认为深度学习将需要定制的计算,而英伟达在市场份额方面并不会占据绝大多数( many believed deep learning would need custom compute that Nvidia wasn’t going to own the vast majority of market share wise )。
投资者损失了很多钱,可以说,“ 通用 GPU 不能提供 AI 性能” 的观点并没有起作用,而是演变成了 “专用计算可以增强 AI 性能” ( specialized compute can amplify AI performance )或 “世界只是需要更多的计算资源”。这些投资中隐含的下注,即 “没有” 起作用的一部分,可能是因为今天我们看到的 AI 性能和投资规模要比预期的 2023 年这个时间节点要更长一些才能达到生产规模。几乎可以说,零利率政策和人工智能没有在完全同一时间发生,否则可能每个计算制造商都会在增长轮次上筹集数亿美元,而不是陷入困境。
这个预测还让不同资产类别的投资者开始推测数据中心现在是过度建设还是建设不足( speculating on overbuilding or under-building of data centers ),以及围绕 “算力作为新石油” ( Compute As The New Oil )以及计算集群扩展等各种其他物理性 “淘金铲子” 风格的投资。对冲基金、私募股权投资公司、房地产公司以及各国政府的朋友们,直到 12 个月前还从未关心过我对这个问题的看法( 或许是与人工智能有关的任何问题)?
性能表现在其他类别中是否会遵循规模扩展定律( Will scaling laws hold for performance in other categories )?
这可能是 2024 年对风险投资( 以及世界 )来说最重要的预测问题,也可以说是导致了各种 “X 领域的基础模型” 公司出现的原因。
如果 AI 架构选择的问题得到 “解决” 并固定下来( AGI 使用 Transformer 架构 + 根据具体使用场景可能使用其他 System 2 来实现 ASI ) ,那么我们可以认为,提高所有类型的 AI 模型性能就意味着遵循规模扩展定律,并为特定数量的模态或使用用例增加数据和计算资源。


这最终引导我们把目光投向机器人领域并提出一个问题:
规模扩展定律是否适用于机器人的性能的提升( Will scaling laws hold for performance in robotics)?

如果你对这个问题的回答是 “是”,那么你就进入了一个三阶预测( a third-order forecast ),即 “ 机器人将成为规模扩展定律适用的最有价值的类别吗 ( will robotics be the most valuable category where scaling laws will hold )?” 同时还会涉及其他问题,例如数据可用性、合成数据生成及其质量,甚至可能深入到能源和万亿美元级计算集群的讨论中。
如果你对这个问题的回答是 “否”,那么你可能是人工智能领域中少数对机器人不特别看好的人士之一。
人们可以辩论机器人形式( 类人 vs 非类人),但几乎在所有其他用例中,趋势线是一致的,很难反对这一点。话虽如此,我们并不是来讨论这个说法的真伪,相反,我推荐你阅读一篇关于这个话题的精彩文章。
这篇文章的链接:
https://nishanthjkumar.com/Will-Scaling-Solve-Robotics-Perspectives-from-CoRL-2023/

机器人技术与信念
ON ROBOTICS AND CONVICTION



2024 年风险投资的现实是,基金在某种程度上受到激励,去发现绝对上升空间的领域以及那些能够吸纳符合每轮出售公司 10-30% 股份模式的资本规模的领域。
机器人被选为满足第二阶效应( 即成为巨大机会 )和这种资本投入框架的最佳候选者 ( Robotics has been chosen as a prime candidate that satisfies the second-order effect of being a massive opportunity,as well as this framework of putting dollars to work )。更好的是,多年来这个领域幸存下来的初创公司数量非常少。
回到我之前的观点,当一个拐点出现时,处理第二阶和第三阶效应需要时间,无论是从市场教育的角度( 如何首先对这些未来持有高度信念?)还是从公司创建角度( 一部分创始人需要时间来获得信心,认为他们能够创建一个有意义地颠覆或超越他们通常在那里工作的现有公司的公司 )。
然而,有时这些拐点会在紧密联系的、高度社交化的行业中引起巨大反响,从而大大加快公司创建的速度。
在资本和人才这两个方面,这种情况的发生主要有两个原因。

拐点后的人才分散
TALENT DISPERSION POST INFLECTION POINTS


人才聚集 / 分散( Talent agglomeration / dispersion )是因为人性使然,因此在新兴领域中,专业人才的流动往往比人们预想的要更加协调一致。
当人才开始分散时,通常是发生某种事件之后。在初创公司中,这种情况可能发生在一小部分人因行业的 “寒武纪大爆发” 而赚取大量财富之后。这些人很少被视为行业中的 “精英” 或 “元老”,而是一些从现有公司外部崛起的非正统群体( some orthogonal group that rose from outside of the incumbents ),因为大型科技公司擅长积累纸面上的精英人才。
在自动驾驶领域,我们看到 Cruise 的收购加速了人才的分散,人才们离开了像特斯拉、510 Systems / Waymo,甚至最终离开了 Cruise 本身,这一切在收购后第一轮股权悬崖期到来时发生了( once the first equity cliff was reached post-acquisition )。
自动驾驶的 “人才分散” 现象催生了各种公司,这些公司具有不同程度的新颖性或真实技术优势,但都持有一个方向的观点:
a) 现有市场上的公司容易被颠覆,因为如果 Cruise 能做到,那么其他初创公司也能做到,或者
b) 围绕自动驾驶汽车( 配送机器人、自动驾驶卡车等 )或其他工具( 模拟器、行人理解等 )将会出现整个新的经济体。我在 2016 年写过关于这一市场动态的文章,并提出了 3 种可能的未来,包括:
从不部署 — 这也是为什么大多数在大型汽车公司工作的优秀工程师至少会考虑创业,筹集 50 万到 100 万美元的种子前轮融资,并完美地利用炒作周期。我并不责怪他们。
你读到了一篇疯狂的文章,称自动驾驶汽车的收购价格为每位工程师值 1000万美元,于是你算了一下这对你和你的团队来说能赚多少钱。你筹集了种子前轮融资,打造了一个足够吸引人的产品,然后再筹集更多正式的种子轮融资,将其扩展到不同类型的生产车辆、驾驶场景、地点类型等。接着,你祈祷永远不用真正进入市场,因为前两种选择听起来像地狱。所以,你找到了一家不错的 OEM 厂商、一支更大且资金更充足的团队,或者一个一级供应商,以早期收购的形式,为接下来几年将产品推向市场所需的研发费用买单。
你的风险投资人可能会有点生气,但谁在乎呢,因为每个风险投资人也都在告诉自己,这些自动驾驶汽车的投资由于这些确定性的情况而具有下行保护。直到情况不再如此。”
在 2014 年 DeepMind 被收购之后,我们可以说看到了这一过程的萌芽期。不久之后,新 AI 实验室纷纷涌现,直到 2017 年左右的 AI 寒冬降临,最终大部分实验室被淘汰,除了那个奇怪的非营利 / 有限盈利 / 开源 / 闭源混在一起的OpenAI,它始于 2015 年底。从那时起,经过了缓慢的积累,直到 2019 年 GPT-2 的出现和 2020 年 GPT-3 的问世,导致大量人才从主要 AI 实验室流失,因为他们看到了商业化的可能性,更重要的是,有人愿意为独立实体所需的大量计算资源买单。资本已经到位。

Wayve 的研究和其关于具身智能的基础模型的表现增强了人们对端到端方法在自动驾驶以及其他具身智能应用中的信心。
在机器人技术领域,我们现在看到类似的启动情况,像 DeepMind/Google AI 和 Wayve 这样的顶尖实验室展示了具身智能方面的突破,指向了将这种技术转移到其他领域的可能性,导致主要企业( 如 DeepMind/Google 和特斯拉等 )开始失去人才。
为了支持这一切发生,资本再次到位。

资本加速和部署
CAPITAL ACCELERATION & DEPLOYMENT


资本加速进入新市场和新兴领域的原理与上述类似。
当投资者确信他们可以赚钱的时候,这往往会让大多数人措手不及,对这一主题的投资和认知也并不足( A moment happens that gives conviction to investors that they can feasibly make money, often catching most off-guard and underexposed to the theme )。随着 GPs/LPs 开始询问何时会有更多资金用于修正这种投资和认知不足的位置,这种情况会逐渐加剧。
自然而然地,投资者开始在 “精英”人才聚集的地方进行搜索,通常是大型行业实验室和学术界( 我之前曾深入探讨过这种市场动态 )。随着初创企业的产业化,这一阶段发生了两件事情,这些事情得到了资本的支持。

玩转风险投资游戏
Playing Venture Games






请到「今天看啥」查看全文