Bessemer Venture Partners(BVP)曾宣称由 LLM 驱动的人工智能将成为常态,并将几乎影响每一个云技术的发展蓝图。
回望过去,这番言论实际上是当年的一个保守估计,过去 12 个月(或者说“AI 年”)发生的技术变革远超想象。
BVP 在 2023 年投入了
10 亿美元资金
来支持 AI。一年后,BVP 已经在多个 AI 初创公司上进行了新投资,并见证了几乎所有投资的公司的发展路线图中都采用了 LLM。如今,很难找到一家不涉及 AI 的云计算公司。
本篇文章来自 BVP 的 2024 云计算研究报告,主要
深入探讨了塑造 AI 云计算经济未来的五大强劲趋势,并对到 2030 年 AI 云计算的发展进行预测。
希望对你有所帮助,enjoy~
本文来自:https://www.bvp.com/atlas/state-of-the-cloud-2024
2024 年 AI 云计算的五大趋势
趋势一:AI 基础模型为大型科技公司的竞争奠定基础
回顾过去从浏览器和搜索到移动和云计算的变迁,每一次技术变革都催生了对控制基础层的竞争,AI 时代也不例外。基础模型是新型“石油”,将为下游的 AI 应用和工具提供动力。
2023 年,基础模型公司在 AI 领域的风投中占据了最大份额,占总 AI 投资金额的 60% 以上。OpenAI、Anthropic、Mistral、Cohere 等公司共筹集了 230 亿美元,总市值达到 1,240 亿美元,突显了它们在全球 AI 生态系统中的关键作用。值得注意的是,这一资本的涌入主要是由企业风投推动的,2023 年企业风投占私营
GenAI
融资的 90%,2022 年为 40%(数据来自摩根士丹利)。
微软、谷歌、亚马逊、NVIDIA 和甲骨文等大科技公司现在在基础模型公司中拥有重要股份,因为这些投资与增强这些科技巨头的 AI 能力的发展战略相一致,推动了其核心云计算和计算服务的消费。此外,大型科技公司还在进行构建自己的内部基础模型,如谷歌的 Gemini 和 Meta AI 的 Llama。
随着大量资金流入这一基础层,竞争以前所未有的速度加剧,推动了生态系统内的巨大创新。以下是 2023 年的一些关键趋势:
-
基础模型迅速改进:
通用 LLMs 正在不断变得越来越好,无论是在基础性能(如准确性和延迟)方面,还是在多模态功能等前沿领域。GPT-4o 的新版本展示了从上传文件中查看和理解视频和音频的能力,以及生成短视频的能力。但同时模型改进的惊人速度也使得这些模型的半衰期似乎以月计算。
-
开源与闭源之战加剧:
开源与闭源的辩论在 2024 年仍然是一个热门话题,尤其是随着 Llama 3 的最近发布,开源领导者密切关注闭源模型的表现。围绕监管影响的问题引发了新的讨论:闭源玩家是否应该将旧模型开源作为新的商业化策略的一部分?这是否可能是历史上第一次开源领导者成为这一市场的赢家?
-
小模型运动崛起:
2023 年见证了小模型运动的兴起,HuggingFace 的 CEO 和联合创始人 Clem Delangue 宣称 2024 将是小语言模型(SLMs)的一年。与更大的模型相比,例如今年发布的 Mistral 8x22b,展示了在性能方面更大模型并不总是更好的,小模型具有明显的成本和延迟优势。
-
新颖架构和专用基础模型的出现:
2023 年还见证了超越 Transformer 的新模型架构的兴起,如状态空间模型和几何深度学习,推动了基础模型的前沿发展。这些模型可以减少计算密集度,能够处理更长的上下文,或展示结构化推理。同时如用于代码生成、生物学、视频、图像、语音、机器人、音乐、物理、脑电波等
团队训练特定用途模型在 2023 年呈现爆炸性增长
,这为模型层增加了另一个多样性向量。
尽管大量资金已经投入到这一领域,目前尚未有明确的赢家。
预测:
AI 模型之战在可预见的未来将继续保持白热化,因为这是一个决定未来几年哪些大科技公司将在云计算和计算市场中称霸的关键过程。
预计在这场模型层争夺战中,有三种可能情况出现,决定谁将捕获最多的价值:
现实一:模型层变得商品化
数以亿计的风险投资和大型科技公司的资金是否会因支持 AI 领头羊的竞赛而浪费?最资本充足的模型并不意味着它们会成为赢家,因为开源模型持续挑战着市场领先者。
AI 模型商品化的未来并不一定意味着模型的价值会降低。作为商品的 AI 模型类似于计算能力或石油——它们终将有一天成为全球商业运营不可或缺的资产。在这种情况下,AI 生态系统的最终价值将由计算和云服务提供商、市场和应用程序捕获,而不是模型本身。
然而,正如我们在石油市场中所见,
在 AI 模型商品化的世界中
仍可能催生一两家销售这些“商品”的极具价值的公司。
现实二:AI 模型巨头瓜分市场
类似于云计算大战,未来一些由大型科技公司战略支持或企业风投大力支持的新兴模型公司将拥有基础模型生态系统,成为行业巨头。这些赢家中的每一个都将找到与技术差异化相结合的独特优势,无论是通过分销、价格/成本效益、监管影响等。尽管仍然会有许多不同的玩家(尤其是开源),但价值将集中在少数几个顶级模型玩家手中。决定未来 AI 巨头的不仅是卓越的技术,还有他们已经建立的分销网络。
现实三:AI 模型市场多样且流行
正如薯片有无数种口味,未来的 AI 模型经济可能会类似于杂货店的零食货架。因为有足够多的差异化用例,许多专注不同领域的模型公司都可以
蓬勃发展
(如多模态、性能、延迟、成本、安全性等)。此外,如果地缘政治因素进入 AI 模型领域,地理和法规也可能在这里发挥作用,混合的法规和主权关注将支持这一层的多样性扩展。
预测:
BVP 合作伙伴中的少数派预测闭源模型将驱动大部分 LLM 计算周期,而 AI 模型巨头最终将瓜分经济蛋糕。
预计云计算巨头将利用其对计算资源、芯片和资本的访问权限来影响这场战斗朝自己有利的方向发展。目前领头羊们已经在赛道上做好了准备,如微软的 OpenAI、AWS 的 Anthropic、谷歌的 Gemini,以及作为 Linux 等效开源替代方案的 Meta 的 Llama,包括作为欧洲领导者的 Mistral。
趋势二:AI 将所有人变成 10X 开发者
现代工程师历来既是建造者也是学习者,一边完成日常工作,一边不断努力跟上新语言、框架、基础设施等的步伐。AI 的震荡为这份工作增加了更高的要求,因为开发者面临着一整套全新的工具链和最佳实践。在 AI 时代,
工程师
每一年都要掌握相当于过去十年的需要掌握的知识量。
但 AI 也在为这种新出现的复杂性提供解决方案。2023 年见证了 Copilot 工具的广泛采用,而在 2024 年的前几个月里,代理工具的初步突破预示着简单编码任务乃至更多任务的端到端自动化可能比预期更快到来。
预测:
开发者的角色将因 AI 而发生根本性转变,这一变化或许比任何其他职业更为剧烈。到本世纪末,每个人都能掌握开发能力,软件开发速度将大幅度提高,并将降低科技初创企业创始人的平均年龄。
推动 AI 开发者经济快速发展的三大主要领域:
1. C
opilot 行
业一直是创新和竞争的温床,2023 年这一行业的 GenAI 技术和工具筹集到了 39 亿美元风险投资
。
GitHub 现有的 Copilot 产品由 OpenAI 的 GPT-4 和 Codex 模型提供支持,已安装超过 1,400 万次。Tabnine、Magic.dev、Augment、Poolside、Cursor AI、OpenDevin、Cognition 的 Devin 和 Supermaven 等一大批资金充足、规模不断扩大的初创竞争对手正在与开发人员一起构建和迭代。
一些公司,如 Magic.dev、Poolside、Augment 和 Supermaven,正在预先训练自己的大型 AI 模型,重点关注模型属性,如上下文、延迟等。其他公司,如 Cursor,则对模型持中立态度,专注于开发者体验、界面和工作流程。Magic.dev、Augment、Poolside 和 Devin 在过去几年中各自筹集了超过 1.5 亿美元的资金。
2.
C
opilot
s
嵌入智能搜索和生成功能将在未来几年产生巨大价值。
Devin、SWE-agent 和 OpenDevin 展示了端到端智能工具的潜力,这些工具可以与开发者环境(如文件编辑器、bash shell)和互联网交互以完成编码任务。这些智能演示的基础是代码语言推理、智能轨迹规划(方法包括提示、行为克隆/微调、强化学习)以及各种智能计算机接口(ACI)改进的快速进展,即跨浏览器和操作系统的抽象和基础设施,支持无缝的智能工具查询和自我修正。
3. 代码语言推理仍将是 AI 活动的中心,受益于模型层创新(如 GPT-4、Claude 3 Opus)和新颖的推理/智能范式(如 Cognition 的 Devin、SWE-agent、OpenDevin)。
模型层的改进将流向代码编辑和完成质量,最终为开发者和软件组织带来价值。除了代码推理,推动延迟、上下文大小边界以及扩展语言领域/预训练集的系统也将为开发者带来超额价值。
AI 正在推动创新和变革,并加快软件组织的开发人员速度、生产力和杠杆作用。具有前瞻性的软件组织正在定期调查新兴工具和供应商的前景,迅速确定和采用高价值的开发者软件的优先级,并且开发者愿意为具有明显影响的工具支付高昂的费用。
对于自身是开发者的创业人来说,这是一个令人兴奋的时刻:不仅在 Copilots 上,而且在基础设施、开发工具、质量保证、IT 配置和供应、安全操作监控、渗透测试等方面都存在着大量的机会
。
Copilots 可能是目前最显而易见的机会,因此它们也可能是竞争最激烈的领域。在更具体的开发者领域工具存在着爆炸式增长:从安全领域的 SecOps 到 SRE,再到 QA 和渗透测试。这些工具使用 LLM 来降低复杂性并自动化高度耗时、痛苦的工程任务,从而释放工程资源以用于更高阶的任务。将 AI 集成到 DevOps 流程中将增强 CI/CD 管道、自动化测试和部署策略,从而实现更快、更可靠的软件交付。
代码重构
是 AI 对于开发者工作流程和生态系统影响的另一个很好的例子。许多现代工程团队仅花费一小部分 FTE 时间来编写全新的代码。尤其是在大型组织中,大部分软件工程师的时间都花在软件工程角色中乏味的部分:维护、保护和测试代码。许多这些任务,如代码重构,需要对技术栈有深刻的了解,通常是由高级工程师来进行的。
AI 显然有潜力解决这些挑战。像 Gitar、Grit 和 ModelCode 这样的初创公司利用代码生成模型、静态分析和 AST 解析器来解释代码结构,并在不同语言、包库和框架之间迁移代码。其中有些专注于现代 Web 框架,有些处理脆弱的遗留工程堆栈(如 COBALT、PEARL 等),而熟练的工程师随着时间的推移会变得过时。许多与核心软件工程功能相关的工作流程也高度耗时、重复,非常适合自动化。
预测:
到 2030 年,大多数企业软件开发人员将更像软件审阅者,开发成本将下降,随着经验丰富的开发人员效率的提高,他们的工资将上涨。
AI 将影响所有就业市场的范围和所需技能,但对开发人员的影响可能最大。AI 增强不仅会极大地提高这一职业的生产力,还会扩大开发人员领域的边界。
到 2029 年底,开发能力将成为全球大多数人都能掌握的技能。
趋势三:多模态模型和 AI Agent 将改变人与软件的关系
多模态模型和 AI Agent 的兴起正引领 AI 创新的下一波创新浪潮,并极大地扩展了 AI 的潜在应用范围,使其应用范围远超早期基于文本的模型。
AI 创业者
有机会在语音、图像和视频等新模态以及代理工作流程中进行创新。
这些新模态赋予 AI 类似于人类的视觉、听觉和语言能力,使其能够在依赖这些感官的大量人类工作中发挥作用。
在接下来的 12 个月中,预计语音 AI 应用将实现爆发式增长。从长远来看,代理优先产品有望改变企业的运营方式,因为它们有更多的工作可以委托 AI 进行处理。
预测:
语音 AI 应用将在未来五年内释放 100 亿美元的新软件 TAM。
最近的进展是不可否认的:
语音
第一波语音 AI 公司主要利用在自动语音识别(ASR)方面发展,如 Abridge(医患对话笔记转录工具)和 Rillavoice(销售对话转录工具)。
现在新一波语音 AI 公司正在开发能够处理繁琐和重复工作流的对话语音产品,使销售、招聘、客户成功和行政等领域的人员能够专注于更高价值的工作,如 Ada,它将其基于聊天的客户支持产品扩展为包含对话语音。
这些发展的基础是最新的语音架构。我们看到从级联架构(ASR 将音频转录为文本,传递给 LLM,然后将文本反馈到文本转语音模型)向语音原生架构的转变。正如 GPT-4o 等新模型所展示的那样,它可以处理和推理原始音频数据,而无需转录为文本并以原生音频做出响应。
这种转变将使对话语音产品延迟更低和非文本信息理解能力更强。
AI 语音应用在许多行业中正在兴起,包括汽车经销商、零售、餐饮和家庭服务。由于大部分的呼入销售电话发生在工作时间之外,AI 可以弥补这部分的空白。销售中的 AI 语音应用往往有非常高的 ROI,因为 AI 本质上是在为这些企业拾取丢失的收入。
目前看来未来将会提供越来越自然和对话式的界面,能够提供接近人类水平的表现。预计将看到语音 AI 堆栈中的公司爆炸式增长,其中许多公司将经历真正的突破性增长。在这个过程中,消费者对与语音 AI 互动的期望将会发生变化,因为现代对话语音应用开始为用户提供更自然的体验,让他们更快地解决问题。
图像/视频
计算机视觉模型已经存在多年,但新一代多模态 LLM 能够结合对图像和文本数据(以及其他模态)的理解,这种结合对许多任务极为有用。
最初的一波基于企业的图像应用主要集中在数据提取上。例如 Raft 采集货运文件,提取关键信息以填充客户的 ERP 并自动化发票核对工作流程。随着底层模型的不断改进,我们相信将会看到一系列垂直领域特定的图像和视频处理应用出现,这些应用也将能够采取越来越多的数据来驱动其应用。
工程和设计领域的应用程序利用视觉模型和图像生成模型来帮助推理图形数据(如示意图)或生成建筑设计的效果图。例如, Flux.ai 的 AI Copilot 可帮助电气工程师在其设计软件中生成印刷电路板组件,该组件基于采集组件的 PDF 规格表。
自主 AI Agent
AI 领域中有趣的新兴主题之一是 AI Agent 的发展,它能够完全自主地处理复杂的多步骤任务。虽然大多数 AI Agent 的运行可靠性还不足以在复杂的用例中自主运行,但其代理工作流的进展非常迅速,可以看到未来发展的可能性。每一个新演示都比上一个更好,Cognition AI 的 Devin(AI 软件工程师)暗示了随着 AI 规划和推理能力将不断扩展。
越来越多的应用程序开始在高度受限的用例中实施 AI Agent,以限制多步骤流程中复合错误的影响。例如,企业利用 Leena AI 等解决方案,提供 AI Agent 来支持员工完成与 IT、人力资源和财务相关的任务,帮助团队摆脱繁琐的工作并改善员工体验。
此外,具有更强推理能力的新模型正在出现,这些模型可以进一步增强代理执行更复杂工作流的能力。还有大量研究专注于新的架构方法,通过各种方法(包括思路链推理、自我反思、工具使用、规划和多代理协作)来改进代理实现。
2023 年,基于文本用例的 AI 应用呈现爆炸性增长。预测在 2024 年,多模态模型将在能力和用例方面开辟新前沿,AI 在应用层的使用范围将更加广泛。这将引发新一波应用浪潮,为特定垂直领域内的大型企业和小型企业带来接近人类的能力,甚至将为消费者应用释放更大潜力。
趋势四:垂直 AI 显示出超越传统 SaaS 的潜力,带来新应用和商业模式
事实证明,垂直 SaaS 是第一次云革命期间改变行业的沉睡巨人。如今,美国排名前 20 的垂直 SaaS 上市公司总市值约为 3,000 亿美元,其中超过一半的公司在过去十年内进行了 IPO。
现在,LLM 的兴起引发了下一波垂直 SaaS 的浪潮,新的 LLM 公司正在创建,这些瞄准新的功能,有时甚至是传统垂直 SaaS 无法触及的行业。值得注意的是,垂直 AI 应用程序瞄准的是主导众多垂直行业和大型经济部门的高成本重复性语言任务。
美国劳工统计局指出,商业和专业服务行业占美国 GDP 的 13%,仅这个行业就以重复性语言任务为主,规模约为软件行业的 10 倍。
垂直 AI 将在这些领域争夺显著的市场份额,并将在人力不足的领域推动更多的活动。例如,EvenUp 自动化了第三方法律服务以及内部律师助理的工作流程。此外,EvenUp 还开辟了以前由于人力成本过高或不一致而无法应用的任务领域。这种多维度的扩展对整个经济各个领域的垂直 AI 具有重要意义。
预测:
随着垂直人工智能进入服务经济并释放新的商业模式,垂直人工智能的市值将至少是传统垂直 SaaS 的 10 倍。
垂直 AI 经济的三种新商业模式包括 Copilots、Autopilots 和 AI 驱动的服务。
垂直 AI 还通过几种不同的商业模式交付,从而增加了将 AI 能力与特定行业需求匹配的几率。
Copilots
通过利用 LLMs 来自动化任务,从而加速员工的工作效率。例如,Sixfold 通过增强保险承保人分析数据和理解风险的能力来提升他们的工作效率。在 Copilot 模式中,AI 应用与人类用户并肩工作,帮助用户取得更好的成果。
Agents
与 Copilots 帮助员工完成工作不同,Agents 完全自动化工作流程并替代用户。Agents 通常专注于垂直公司内部的特定功能,如外呼销售或接听来电。例如, Slang AI 处理餐厅的来电,以进行预订和预约、回答问题等。
AI 驱动的服务
在近些年兴起,这些服务通常外包给第三方提供商,如会计、法律服务、医疗账单等。由于这些业务高度依赖人力,利润较低、难以扩展、难以区分,且比技术业务价值更低。通过使用软件自动化工作,这些 AI 驱动的服务公司向市场提供更便宜、更好、更快的服务,并从现有的服务型企业中抢占市场份额。例如,SmarterDx 使用 AI 代表医疗系统和医院审核住院索赔,然后将账单和相应的临床文件发送给付款人。
早期信号:垂直 AI 商业模式的实力
根据对于垂直 AI 公司的早期数据,利用垂直 AI 投资组合的分析探寻这一新型应用类别的实力。
大多数垂直 AI 参与者提供的功能并不与传统 SaaS 竞争。这些应用程序的实用性通常是对传统 SaaS 产品的补充,因此不需要复制和取代现有产品。
另外,这些垂直 AI 公司已经占据了传统核心垂直 SaaS 系统约 80% 的 ACV。
而这些垂直 AI 公司才刚刚起步,明显有潜力扩大 ACV。数据表明,垂直 AI 能够通过取代服务支出来释放垂直终端市场中的大量支出,并提供可能是传统 SaaS 多倍的 TAM。
垂直 AI 公司在具有意义的规模(年经常性收入 $400 万以上)下的效率和增长情况很可观。这些公司以年同比增长约 400% 的速度快速增长,平均毛利率约为 65%,BVP 效率比率(净新 CARR / 净 Burn Rate)约为 1.1 倍。预计这些公司随着时间的推移会不断提高利润率,有望成为市场上持久的独立上市公司。
平均而言,垂直 AI 公司目前仅将约 10% 的收入或约 25% 的总销售成本用于模型成本。
因此,这些基于 LLM 构建的垂直应用程序已经产生了大约 6 倍于基础模型费用的利润。
随着模型成本的迅速下降,这些初创公司的利润率只会变得更好。
总体而言,虽然预计在模型层面会产生巨大的价值,但这些数据告诉我们,与过去的基础设施创新一样,大部分企业价值还是在应用层。
垂直领域的老牌软件公司并未完全忽视这一趋势。像 Thomson Reuters(以 6.5 亿美元收购 CaseText)和 Docusign(以 1.65 亿美元收购 Lexion)等公司已经进行了一些高调的垂直 AI 收购。
但目前仍处于垂直 AI 领域马拉松的起跑线上。随着 EvenUp、Abridge、Rilla 和 Axion 等早期初创公司快速发展,预计新的经久不衰的垂直 AI 上市公司将在短短几年内诞生。
基于已经看到的规模增长速度,预计在未来两到三年内至少会出现五家拥有 1 亿美元以上 ARR 的垂直 AI 企业。
预测:
第一家垂直 AI 公司将在未来三年内进行 IPO。
趋势五:AI 让消费者云重获新生
众所周知,消费者云在过去的十年里发展缓慢。本文将消费者云定义为直接向个人消费者提供基于云的存储、计算和数字应用的公司,有时也包括同时面向企业和“专业消费者”的产品。
分析了过去八年的 Cloud 100 数据来说明速度有多慢,这是由 Bessemer、Forbes 和 Salesforce Ventures 每年自 2016 年起发布的顶级 100 家私有云公司的权威排名。自九年前 Cloud 100 数据首次发布以来,榜单中只有 4% 的公司提供消费者服务,有时还伴随着更为突出的 B2B 服务(如 2016 年的 Zoom 和 2023 年的 OpenAI)。
消费者云独角兽历来都是在重大技术变革之后诞生的。然而,自 15 年前 iPhone 推出以及随后社交媒体平台的发展以来,我们还没有看到面向消费者的技术出现相关的震动。
随着 LLM 快速发展的多模态能力使我们能够以前所未有的方式扩展和增强我们的文本、视觉和听觉感官,在每一个传统消费者云类别中都出现了颠覆的进展。
衡量 AI 消费能力的一个指标是这些应用程序占用人们时间和注意力的程度。例如,ChatGPT 现在已经与 Reddit 等注意力经济领域的领导者不相上下,而其他通用 AI 助手(如 Claude 和 Gemini)也迅速受到关注。
除了上述的通用助手,还有一些在垂直领域推动创新的消费者 AI 公司。这些公司包括用于搜索的 Perplexity、用于陪伴的 Character.ai、用于图像创意的 Midjourney、用于音乐生成的 Suno 和 Udio,以及用于视频生成的 Luma、Viggle 和 Pika。这些公司展示了 LLM 原生应用吸引并留住忠实用户群的潜力,在某些情况下,甚至可以取代现代的主流企业。
随着 AI 改变消费者参与和利用技术的方式,
预计在未来五年内会有多家消费者云公司 IPO。
预测:
随着合成媒体、新型消费者应用和对话 AI 代理的崛起,预计到 2030 年,主导注意力经济的前三大业务将基于 AI 生成的内容或产品。
在功能特定的消费者 AI 应用(如内容生成和编辑、教育)领域,早期活动也十分活跃,这可以从每月的网站和应用访问量中看出。这些信号表明了消费者希望 AI 改善生活的早期迹象,然而目前还没有超过 10 个类别特定的消费者 AI 原生应用展示出明显的产品深度。对于有进取心的企业家来说,在未来的几个月和几年里,仍然有明显的机会建立可持续发展的云公司,以满足许多未满足的消费者需求。