预测新一年趋势是拾象投研团队的传统:厘清关键问题、找到研究主线才能在动态变化的世界里增强确定性。
2024 年, LLM 竞赛关键词是大基建:LLM 竞赛格局基本确定,下半年,随着 Sonnet 3.5 惊艳的 coding 能力、 o1 模型以及 RL 新范式的接连出现,LLM 不再是单一的基建竞赛,Coding 和 Agent 成为最大的主题。
2025 年,LLM 会在哪些方面上获得突破?从研究和投资配置的角度,最值得 bet 的关键方向有哪些?作为拾象投研团队 「2025 AI Best Ideas」 特别策划,我们既预测趋势,也提出关键问题与解题思路,希望能为市场和投资者带来启发。
在拾象 2025 AI best ideas 发布之外,我们还计划在下周组织一场 「2025 AI Best Ideas」 线上讨论会,围绕 2025 AI potential winners & losers、最值得关注的关键 AI 趋势碰撞思考与灵感。如果您有兴趣参与我们的线上闭门讨论,请点击链接参与报名(备注:因活动名额有限,我们会结合问卷回答进行定向邀请参与)
微软转投 Anthropic,
模型和云的格局彻底改变
微软和 OpenAI 的关系紧张已不是秘密,也许是 OpenAI 的公司架构,以及和微软的结盟方式太不同寻常,让多方利益制衡而紧绷的弦终会有断的一天。作为对照,Anthropic 和 Amazon 的关系就更开放、健康。Anthropic 也已和三大云中的两朵云(AWS、GCP)都达成了合作。
2025 年 OpenAI 会变成盈利组织,微软也很有可能会投资 Anthropic,这将彻底改变模型和云的格局——Anthropic 会与 Azure 合作,OpenAI 也因为终结了和微软的独家关系,而与其他云合作。最终所有模型会在所有云上,所有云也会支持和投资所有模型。
当然这个格局变化还充满不确定,但至少,Anthropic 会在这次震荡中获益。
Google 手握几张王牌逆转颓势,成为“最领先的追随者”
Google 在 LLM 训练进展上一直落后于 OpenAI 和 Anthropic,从 transformer 和 RL 的提出者变成了一个 AI 追随者,但 Google 是“最领先的追随者”,等待 OAI 和 Anthropic 破风,再投入资源赶上。目前 Google 在模型、 Agent 进展上和前两名缩短了差距,Q4 发布的一系列 AI 产品也有很好的口碑。
另外,Google 手上有几张王牌:
• TPU 代表着无限算力资源,
• Andorid/Chrome 代表着最强的分发渠道,
• Deepmind 代表全球最高 AI 人才密度,
从现实进展上:
• RL 是 Google 的看家本领,并且 Agent 进展很快,今年 9 月发布的 Agent 白皮书里,Google 就提出了由模型(Language Model)、工具(Extensions, Functions, Data Stores)和编排层(Orchestration Layer)组成的 Agent 框架,
• Gemini flash 2.0 已经展现出超越 GPT-4o 的能力水平,
• Deep Research、 NotebookLM、Learn About 等一系列 to C AI 产品的发布,不仅充分展示了 Gemini 多模态的优势,也借助更多创新交互获取用户,
• 硬件平台储备:在 Meta 眼镜之后,Google 也有希望在今年发布 Google glass 2,成为新一代消费级平台的重要力量。
目前市场主要担心的是 Google 最关键的搜索被颠覆,从实际情况来看,Meta、Amazon、ChatGPT、Perplexity 都在抢 Google 的搜索市场,而 ChatGPT 和 Perpelxity 开始广告探索后同样会给 Google 带来影响。
下一代 Mega 7 已有雏形,OS 才是最高护城河,模型公司进入 Agent OS之争,Agent 是 LLM OS 上的 App
Satya 最近在公开采访中明确表示下一代 Mega 7 雏型已经出现,会围绕 OpenAI、Anthropic 等 LLM-players 中间产生。
今天主流模型厂商之间的竞争是 80s Windows/DOS 战争的重演,本质上是在围绕开发者心智份额、生态系统、专有标准和 API 的之间的竞争。微软的商业生态是在 Windows 根基之上建立的,OS 是微软安身立命之本,对于今天的模型厂商来说,拥有 OS 才是最高的护城河。
在所有模型厂商中 Anthropic 构建 OS 的决心要更明显、更强,从 computer use 到 MCP,持续尝试搭建数据和工具的连接层,MCP 就是这个时代的 TCP/IP。我们预计在 Agent 大爆发后,其他 LLM 供应商大概率也要推各自的协议。
Agent 是新软件,是 2025 年投资核心中的核心。Agent 整体会渐进式演进,Coding Agent 最先落地。
Andrej Karpathy 在 2017 年提出的 Software 2.0 设想就是今天的 Agents。软件的本质是对人类行为、workflow 的数字化映射和自动化,当模型/Agent 有了 tool use 的能力之后就可以实现从 1.0 rule-based 到动态编排软件 2.0。
Perplexity 是模型信息处理能力的集中体现,“下一个 Perplexity会”沿着 Agent、模型 tool use 能力这条线诞生,OpenAI 前 CTO Mira 的新公司将会是 2025 年绝对的明星 deal。
和 LLM 一样,Agents 的实现本身也是渐进式的,2024 年下半年在 AI Coding 的突破是我们从软件时代走向 agent 时代的关键,AI agent 也会最先在 coding agent 落地,而不是 day 1 就实现 general agent:因为 coding 环境足够清晰,商业价值和天花板都极高。
Task automation 成为关键词,long horizon task 成功率是衡量 Agent 能力的核心指标
今天 Agent 定义尚不明确,但我们认为从实际落地场景出发,应该关注 task automation 的成功率。
目前的 Agent 还只是初级 Agent,通过编排组合把重复性高,但又需要一定灵活性的任务自动化,如客服、售前、游戏测试等,这类 Agent 需要深入的业务理解和快速迭代的 engineer 能力,发展迅速。
能力更强的 Agent 一定不再是 LLM calling 的组合,而是更自主、更主动,能完成更多步骤的复杂任务。这类 Agent 需要强大的 reasoning 能力,long horizon task 处理能力,还要能深入理解 large context base,也是模型公司投入的重点。
Context layer 成为 Agent 的秘密武器:数据、推理、行动三元素重新组织的 context 是 Agent 落地基础设施。
而为了让 Agents 更好、更主动得完成多步骤复杂任务,简单的 RAG 已经无法满足需求,context 会成为这个场景下优先级最高的 infra 能力。如何获取企业 context,并更好得构建 context layer 的能力会成为 AI 应用或数据公司竞争的关键。
二级市场上, Palantir、Snowflake 都属于很明确的 context layer 相关受益者。一级市场上,头部公司围绕也已经围绕 context 需求进行积极投入,比如 Perplexity 最新收购的 Carbon 可以帮助 Perplexity 实现和 Google Docs、Slack、Notion 等生产力工具的数据连接。
Palantir 的 Ontology 层可以被视为一个企业的“数字分身(digital twin)”。每一个 ontology 对象都代表了一条明确了输入和输出的逻辑
训练靠后,推理向前,ASIC 叙事逐渐减弱,NV 的算力份额和领导者地位依然稳固,市值将达到 4 万亿
以 o1 为起点,由于模型推理能力的增强,以及软件公司用 LLM 开发新产品或进行自我改造的积极性提升,推理需求指数级增长让今年下半年以来 CSP ASIC 显著受益,CSP 离下游需要推理的客户群体更近,Amazon、Google、微软等大厂都在通过自有芯片研减少对 GPU 的依赖。
2025 年 Inference 作为硬件板块的核心命题不会改变,考虑到整个算力市场需求比预期要更大,CSP ASIC 叙事会在明年逐渐走弱,而 NVDA 依靠 GB200 在 TCO/性能仍会在算力市场维持自身的领导者地位,相比之下 AMD 丢失的市场份额可能会更明显。
Pre-training 、Post training、o3 融合一体化,large scale RL成为关键 bet
O 系列开始,inference time compute 的思路让 post training 的重要性提高了很多,可提升的空间和消耗的算力层面都可能比 pretrain 更重要。
在这个趋势下,post-training 和 pre-training 的界线会越来越模糊,post-training 会消耗更大的算力、解锁更多能力,pre-training 会渐进式地用 RL 来渐近找到更好的 data recipe。类似从 AlphaGo 到 AlphaZero 那样,模型能够逐渐离开一部分人类数据,用合成数据来得到更多数据分布外的高质量数据,解锁更高天花板的智能。
合成数据实现技术突破,规模化的合成数据能减缓数据撞墙焦虑
改写、编排现有的数据虽然能提升数据质量,但不能提供增量数据和新知识。如何规模化地获取合成数据是技术上重要的难点,也是我们期待的突破点。去年这个突破没有实现,我们预测今年能够取得进展,因为 pre train 的数据瓶颈今年愈发紧迫。
o3 验证了 reasoning scaling law,但商业化落地遇到瓶颈
o3 在 ARC-AGI 和 Frontier Math 涌现式的能力突破定义了真正优秀的推理能力,这让我们对 o 系列的成长上限有更强的信心:o3 带来了 reasoning scaling law,强推理能力正是解锁 agent 最必要的能力。2025 年,模型每 3 个月就会实现过去 1 年的能力进步。
但 o1 的商业化确定性和前几代模型相比要更低,因为强推理并不是大众用户的需求,只有少数用户对这样的高生产力、复杂推理问题有需求。因此现在 ChatGPT 产品中 o1 的使用率也不到 5%。同时 o1 query 的定价也很贵,所以需要 200 美金甚至 2000 美金/月的价格来支持更大的 inference time compute 需求。
Chatbot 竞争翻篇,
开始全新 AI产品形态竞争
Chatbot 的竞争在 2024 年结束了,2025 年 各模型公司要在全新的产品形态上竞赛。Chatbot 仍将是包容性最强,用户受众最广的前端交互,但 computer use、coding agent、artifacts 等更复杂,更跨软件,更能捕捉用户行为数据的交互会成为新的重点。
Memory 和 Online learning 问题在 25 年得到解决,LLM 更加主动和个性化
和推荐算法比,LLM 的缺陷是不能实时更新 weights,所以模型无法千人千面。Memory 是 AI labs 和 Agent 公司花了很多精力解决的问题,我们认为 Memory 会在 2025 年有不错的解决方案,onling learning 也能有一定突破,让 LLM 和 Agent 真的做到更主动,更懂用户。
多模态智能得到突破,visual reasoning 涌现,用户和 AI 交互可能性被拓宽,出现AI+IP 爆款
过去两年多模态智能能力发展不如语言,但 2025 年多模态智能会得到更多投入。视觉推理和 Scaling Law 的涌现现象成为重要研究方向。尤其是 Google、Meta、Tesla 等大企业,有海量视觉数据,有处理视觉数据的完整 infra,也有更明确的多模态应用场景,相比 AI labs 会更重视多模态的研究发展。
虽然我们在 2024 年的预测中提到类 Character.ai 赛道会收敛在今年得到验证,但 Character.ai 代表的底层需求不变。经典 IP 长盛不衰、Jellycat 的爆火本质上是“陪伴”。AI 时代的 Her 不是 chatbot,更有可能从经典 IP 嫁接而生:AI,尤其是多模态智能会让人类和已有 IP 的互动变得更真实、丝滑,例如迪士尼、任天堂等相关公司也会利用多模态推动新应用和经典 IP 唤新。
ChatGPT 和 Perplexity 跑通广告变现模式,广告超越订阅模式成为主流
因为面向生产力场景,LLM startups 一开始通过订阅模式尝试商业化,但订阅的增长曲线有限:ChatGPT 的 MAU 预计已经超过 5 亿,年收入约 40 亿美金,平均一个月活用户只有~8 美元/年收入,而 Google、Meta 每个月活用户 ARPU 都价值100美金起。订阅无法支撑 AI 超级应用,广告还是主流商业化方向。
从去年下半年开始 perplexity 和 OpenAI 都已经透露出试水广告,通过问答的形式直连商品、服务搜索,进一步有可能重组视频、电商、工作、酒旅、住房等供应链。
自动驾驶到达商业化拐点:Waymo 开始蚕食 Uber 市场份额,Waymo 可能会在 2025 年 IPO
Waymo 在 2024 年 8 月占 SF 网约车份额为 5%,到 11 月订单金额市占率快速上升超过20%,且出现一定网络效应,到 12月初 Waymo 在全美已经实现了17.5 万次/周的付费出行。随着监管放松 Waymo 的规模效应还会加速。
AI 领域 M&A 活跃:AI 应用、Coding 领域出现大的收购,中小 GPU 云会被整合
2025 年,AI 领域的投资并购会继续活跃,不过主题从大厂收购 foundation model 公司转变为中大型公司收购 AI native 应用,带来 M&A 的有 4 个角度的因素:
• 硬件领域,2025 年 NV B 系列正式投入使用后,GPU 云领域的成本和价格竞争会进一步加剧,很多中小 GPU 云会破产,对于头部公司而言是低价收购资产的好时机;
• SaaS 领域过去围绕 Vertial SaaS 的 buy-and-run 会在 vertical AI 上重演,尤其 Sales、HR、Legal、Healthcare 等垂直领域会出现 AI start-ups 被大公司收购的情况;
• AI 搜索、AI Coding、视频生成等领域作为 LLM 领域竞争的主线,大公司尤为重视,与此同时 Starups 估值增长过快,可能会先出现公司业务发展跟不上估值 hype,在这种情况下,big-techs 进行收并购可能带来 win-win ;
• 头部 Startups 为强化自身竞争力围绕技术栈、场景进行收购。
电力短缺持续,核电重启是明确趋势 ,有机会出现 10x 股公司
不仅美国本土,超大计算集群、再工业化带来的电力短缺还在持续,全球范围内电力需求到 2050 年会增加 1/3 到 3/4。核电的新建或重启是全球范围内确定性趋势,但供给端还没有做好相关准备,原料短缺、地缘政治的扰动等因素给整个产业链上的资产带来价值稀缺性。
AI for science 发展迅速,各个科学领域有自己的 foundation model
生命科学、材料、气象和工业仿真等各个科学领域已经涌现出各自的 foundation model。与 LLM 不同,AI4S 领域不存在数据墙问题,在实践中还可以通过第一性原理模拟生成无限的高质量合成数据,这一特性会让 AI4S 各个领域的 foundation model 涌现,且模型能力迭代速度极快。
AI 技术红利大部分流入大公司,
Mega 9 强者恒强
Mega 9 公司掌握着 AI 的关键资产:云、算力、分发渠道。任何企业、个人买单 AI 的价值,他们都有机会“收税”。随着 AI 在 2025 年真正走向 massive adoption ,这些公司可以持续躺在 AI 富矿上赚取收益。
美股 2025 Q1 业绩后因为 AI 进展缓慢大调整,但又会在年底前破新高
以 Agentforce 为代表的 SaaS 公司 AI 产品的表现推高了美股对于 AI 应用层的 hype,虽然企业侧投入和推广 AI 产品相较于 1 年前更加激进,但作为投资者需要对企业 AI 业务落地和盈利情况保持理性和警惕,一旦实际业绩兑现略低于市场对 AI 故事的预期,就会出现大的回调,我们预计 2025 H1 大概率会出现这一情况。到 2025H2,随着 LLM 能力提升,尤其是 agent 在 tool use 和长距离复杂任务上的进步,AI 会重新带来股价新高,重演 2024 H2 的情况。
One more thing:2023 年底我们提出了 16 条 LLM 猜想,其中有 9 个在 2024 年得到了印证,7 个还没有完全实现,以下是我们的复盘回顾:
Agent 最全 Playbook:场景、记忆和交互创新
LLM 竞赛 2025: 超越 Google 之路
Metronome:OpenAI、Anthropic背后的计费平台,会是AI时代的Stripe吗?
估值13亿美金,Clay 用 AI Agent 帮企业找客户
Bolt.new:AI Coding 领域的 Figma,2 个月实现近千万美元 ARR