2024 AI 年终盘点｜从技术到行业，留下三个悬而未决的问题

蓝鲸新闻 · 公众号 · · 2024-12-30 20:56

正文

蓝鲸新闻12月30日讯（记者朱俊熹） ChatGPT发布两年以来，AI浪潮继续奔涌。这一年，“卖铲人”英伟达依然是最大受益者，一度成为全球市值最高的公司。凭借Apple Intelligence的叙事，苹果年底市值逼近4万亿美元的历史性关口。行业领军者OpenAI也以千亿估值跃升为全球第三大独角兽。

无论国内外，科技公司或喊出“AII in AI”的口号，或在战略版图中继续扩大AI的地位。在公开活动、公司财报中，AI已成为不可或缺的主题。科技行业之外，更多的公司着手将其与自身业务结合。对个体来说，人们开始习惯在生活中随时打开AI对话助手，和人工智能交流各种天马行空的想法。

2024年，AI技术继续向前迈进，行业加速洗牌，同时也留下了一些悬而未决的问题。

Scaling Law遭遇瓶颈如何突破？

当回顾ChatGPT何以成功掀起AI热潮时，一个共识是受到了数据、算法、算力三架马车的驱动。 2020年，OpenAI研究团队提出，随着模型规模、训练数据集和计算资源的增加，模型性能也将持续提升。这就是指导模型预训练的关键法则Scaling Law，在过去几年间推动了大模型的飞跃。

但今年下半年以来，对Scaling Law是否撞墙、边际效益递减的争论愈演愈烈。 先是OpenAI迟迟未亮相的下一代大模型GPT-5被传训练受阻，即使投入了巨大成本，模型的进步却在放缓，未能实现从GPT-3.5到GPT-4的跃升程度。随后，谷歌、Anthropic等多家公司也被曝面临类似的困境，不得不延后旗舰模型的发布，寻求新的技术路线。

代替GPT-5，OpenAI在9月释出了推理模型o1，并在三个月后发布继任者o3模型。该系列模型采取不同于GPT序列的命名规则，也被普遍视为新范式的开始。推理模型将更多的计算资源投入到推理阶段而非预训练阶段，通过增加强化学习和思考时间，实现模型性能的提升。

在AI行业看来，推理模型有望成为预训练scaling放缓的解法。国内大模型独角兽月之暗面创始人杨植麟曾公开表示，o1模型的意义在于提升了AI的上限。当原先的Scaling Law因互联网优质数据的耗尽而遭遇瓶颈，它至少证明了通过强化学习和大语言模型的结合，能够实现进一步的scaling，“完全有可能是一个很重要的开端”。

由此，国内外大模型玩家也开启了转向推理范式、继续追赶OpenAI之路。截至2024年底，谷歌已推出首个推理模型Gemini 2.0 Flash Thinking。其首席科学家Jeff Dean称，该模型经过训练能够利用思维过程来增强推理能力，“当增加推理时间计算时，取得了令人鼓舞的结果！”

国内现已具备可媲美o1的推理模型，包括幻方量化旗下DeepSeek的R1-Lite预览版、阿里通义的QwQ模型。近期，月之暗面先后发布数学模型k0-math、升级版视觉思考模型k1，在数理化等特定能力上表现优于o1。另有字节跳动等厂商透露正在布局推理模型方面，预计明年将会迎来更多此类模型的面世。

尽管各家公司对推理模型这一进化方向展现出一定的共识，但其现有使用场景仍极其有限。 在回答用户提问时，推理模型需要花费更多的思考时间。 OpenAI研究人员在o1模型发布时就曾坦言，o1模型并不总是比GPT-4o好，对于许多不需要推理的任务，有时等待o1的回复不如直接快速获得GPT-4o的响应。

与传统的大语言模型相比，推理模型的开发成本更低，但使用时的推理成本大幅增加。OpenAI将部分成本转嫁到用户侧，完整版o1模型的访问权限被纳入新推出的付费套餐ChatGPT Pro中，定价则由基本套餐的20美元/月升至200美元/月。而o3模型虽然在基准测试中的得分远超o1，高计算模式下完成单个任务就需要承担数千美元的昂贵成本。

目前看来，对普通用户而言，推理模型的可用之处尚不明显。硅谷科技媒体The Information曾援引知情人士说法称，只有一小部分ChatGPT用户会定期使用o1-preview。这类模型似乎更有助于科研人员群体，这也是OpenAI重点瞄准的目标人群。

承载商业愿景的AI超级应用会到来吗？

相较于一年前市场的如火如荼，今年AI热潮已开始经历周期性的冷却。当科技巨头们继续鼓吹要大幅投入AI、追求长期回报的策略时，AI泡沫论的质疑也在蔓延。 更现实的问题是，承受着高昂的研发成本，大模型厂商们为了生存也要找到可行的商业路径。

大模型转向落地的趋势，直接体现在各家公司推广话术的变化中。比起单纯地以大模型性能、参数、跑分论优劣，更注重展示模型的应用落地场景。

为抢占早期市场，一场“价格战”爆发了。 今年5月，DeepSeek、另一创企智谱AI率先降低旗下模型的调用价格。随后字节跳动在发布其豆包大模型时打出最响一炮，主力模型价格较行业便宜99.3%。在此之后，原先持谨慎态度的阿里云、百度、腾讯云也纷纷宣布跟进降价，大模型由以分定价进入以厘定价的阶段。

在此轮价格战中，攻势猛烈的大多是国内云厂商，AI创企鲜有参与。云厂商们希望能通过亮出模型降价的招牌，吸引更多客户使用其云服务。 降价带来的短期损失能够从云服务受益中再补贴回来，还能进一步扩大其公有云市场份额。

数据显示，这样的获客手段确是有效的。据各公司最新披露，字节豆包通用模型的日均tokens使用量已超过4万亿，较七个月前首次发布时增长了33倍，百度文心大模型日均调用量达15亿次。百度创始人李彦宏曾表示，如果API调用量能在一年内上涨10倍至20亿，代表大模型算是“成了”。

受成本降低和模型进化的推动，AI应用也开始涌现。ChatGPT式的AI对话助手成为各家“标配”，包括字节豆包、月之暗面Kimi、腾讯元宝等。但据36氪此前报道，字节管理层认为即使是处于国内第一梯队的豆包，在对话轮次、时长等关键指标上的表现依然不够理想。因此判断AI对话类产品可能只是AI产品的“中间态”，并提升了AI创作平台即梦的优先级。

可自主感知环境、执行行动并完成设定目标的智能体，成为众多AI企业押注的下一个应用风口。 谷歌在推出最新的Gemini 2.0大模型时，就表明是为智能体时代构建的。今年李彦宏更是反复强调，百度将智能体视为最重要的战略方向，认为智能体这一AI应用的最主流形态即将迎来爆发点。智谱AI自10月起推出多款自主智能体，能够模拟人类操作手机与电脑，展示出智能体更大的应用潜力。

AI搜索赛道的竞争也日趋白热化。不仅谷歌、百度、阿里等巨头正在积极利用AI改造传统搜索引擎，OpenAI、月之暗面等新兴创企也开始在产品中集成AI搜索功能。近期，小红书低调上线AI搜索新产品“点点”，并在App内开启了小范围内测。 有AI搜索开发者曾对蓝鲸新闻表示，搜索是用户每天高频使用的场景，已然成为AI公司的兵家必争之地。

随着AI应用方向在垂直领域出现分化，同时应用层涌入了更多的新公司，明年或将看到形式更为多样的AI应用。编程、情感陪伴、智能硬件等领域呈现出蓬勃上升的态势。

市场仍在期待，AI时代何时能迎来像微信这样的超级应用。对此，行业领导者们态度不一。李彦宏称超级应用不如超级能干，智谱CEO张鹏则表示，超级应用的出现并不完全由技术驱动，还要考虑市场和用户是否准备好、需求发掘以及一点点运气。“不要过早地只看这个结论，保持一点耐心。”

大厂和创企，谁能继续留在牌桌？

临近年末，AI大模型领域的融资消息再次活跃起来。“六小龙”之一的创企阶跃星辰近期宣布完成数亿美元的B轮融资，上海国资、腾讯入股。本月中，智谱AI再获新一轮三十亿人民币融资。同为清华系、主攻端侧AI的面壁智能完成了数亿元新融资，AI视频创企爱诗科技获得近3亿元A+轮融资。

与今年上半年相比，下半年大模型公司的融资进度明显放缓。今年2月，阿里巴巴豪掷重金再投大模型创企，希望仿照微软与OpenAI的模式，以算力的形式支付部分投资。其中，阿里向月之暗面投资了约8亿美元，购入36%的股权，月之暗面完成的超10亿美元融资至今仍是国内AI领域的最大单笔融资记录。不到半月，阿里又领投另一创企MiniMax的6亿美元融资，推高其估值达25亿美元。

加上年初的投资，阿里已集齐中国最头部的五家大模型初创企业，包括零一万物、智谱AI、百川智能、月之暗面和MiniMax。阿里、腾讯等互联网的大手笔再次激起对大模型的FOMO（错失恐惧）情绪，高榕创投、高瓴资本等财务投资机构也跟投了部分独角兽。

蓝鲸新闻梳理创投数据服务商IT桔子的统计，截至12月30日，2024年国内人工智能行业共录得483条投资事件，总投资金额约为655亿元，较去年分别下滑了18.8%、6.1%。其中，今年下半年融资事件数较上半年更少，但融资金额更高。

2024 AI 年终盘点｜从技术到行业，留下三个悬而未决的问题

正文

请到「今天看啥」查看全文