去年的百模大战,今年的务实之争。
ChatGPT 上线两年了,大模型依然在你追我赶 。
继上次挑起价格战之后,字节跳动旗下的火山引擎再次延续策略,发布了豆包视觉理解模型,主打在教育、旅游和电商三个主要场景的落地,价格上把每千 tokens 输入的价格打到了 0.003 元,比行业平均水平降低了 85%,号称视觉 AI 进入了「厘时代」。
大洋彼岸,几天前 OpenAI 正式开放视频大模型 Sora,但很快过高的需求就导致 ChatGPT 遭遇全球范围内的宕机,而苹果新版本落地,Siri 也开始真正调用 ChatGPT。作为竞争的有力对手,谷歌也发布了最新 AI模型 Gemini 2.0,多模态能力进一步升级,智能助手 Astra 可调用谷歌搜索和识图等应用来完成任务。
2024 年年末,ChatGPT 的周活跃用户突破了 3 亿,10 亿是未来的目标,但成本的压力已经显现,它们推出了不同版本的付费模式。
而对中国市场的竞争来说,2024 年的竞争分化已经非常明显。
首先是大模型人才上的争夺,这一点在字节与阿里等大厂身上非常明显;其次是追赶速度加快,不论是通用模型和多模态大模型,技术路线有区别,但落地场景一个都不能少;最后则是大模型创业公司,它们要跟大厂同台竞技,已经走上了差异化的道路,而且不断在做减法。
2025 年,大模型市场依然背负着巨大的期望,不论快与慢,它们都要回答外界的关切:如何让用户发现我物有所值?
去年,阿里与字节在大模型竞争策略上最明显的不同,就是投资覆盖的面积。阿里选择的是海投,投资了 5 家最有代表性的大模型创业公司,包括月之暗面、智谱 AI、MiniMax、零一万物和百川智能,而字节一个都没有投,亲自下场,布局从模型到应用的市场。
而今年,在人才争夺上,字节和阿里成为最明显的对垒。年中,阿里通义千问大模型技术负责人周畅离职创业,年末才被爆出,周畅实际早已经加入字节跳动,负责 AI 大模型相关工作,而阿里方面也以违反竞业协议为由起诉周畅,进行索赔。
而抢人才,是字节跳动在大模型竞争最明显的动作之一,根据今年 9 月发布的《2024 大模型人才报告》,AI 大模型领域人才竞争激烈,字节跳动成为新发大模型岗位量最多的企业,其次是小红书,超过了阿里、美团等互联网大厂。
而除了加入字节大模型团队的周畅,原零一万物核心成员黄文灏、面壁智能核心成员秦禹嘉、谷歌原 videopoet 项目负责人蒋路等人都被字节跳动大模型团队招入麾下,向负责人朱文佳汇报工作。
阿里并非不注意人才密度的问题。今年 10 月,阿里云创始人王坚在媒体采访中也提到了人才的问题,他举出的一个最明显的例子,就是对比谷歌和 OpenAI。OpenAI 有 600 多人,而谷歌对应的有几千人,而最后决定创新成败的还是人才的密度。因为 OpenAI 人才密度高,而谷歌人多却各自为战。
「人才密度加上科研的强度,创新加速度就出来了」,王坚当时认为,而这个「加速度」才是科技创新最重要的东西,有加速度即使落后也能赶上,没有加速度即使先进也会落后。
纵观 2024 年,「加速度」恰好可以成为字节和阿里在大模型领域竞争的关键词。
阿里通义大模型今年的发展不能算慢,9 月,正式上线了 AI 通义万相视频生成大模型,而在模型端,通义千问开源模型 Qwen 2.5,性能上完胜 Meta 405B 参数的 Lama3.1,而在基础层,AI Infra 系列产品构建起阿里云稳定高效的 AI 基础设施产品,模型算力利用率整整提升了20%。
但更本质上的对标,字节大模型+火山引擎,瞄准的就是通义千问+阿里云这套打法,二者都瞄准了 B 端市场的未来。
阿里云 CEO 吴泳铭曾在财报会上披露,预计2025 财年下半年(2024 年 10 月-2025 年 3 月),阿里云将恢复两位数的收入增长,而从今年前三个季度的业绩来看,阿里云营收增长的一个推动力就是 AI 相关产品,连续五个季度保持三位数增长,在公共云中的占比中进一步提升。
而字节跳动争抢云端市场的策略非常明确,就在 12 月 18 日,火山引擎的 FORCE 原动力大会公布一系列豆包大模型的最新进展,久未露面的张楠也发布了即梦 AI,作为前抖音 CEO,如今她把抖音定义为一个真实世界的相机,而即梦则是想象力的相机。
即梦 AI(原 Dreamina)是剪映旗下一款一站式 AI 视频创作平台,对标的就是 OpenAI 的 Sora,今年 5 月正式更名,下半年发力;11 月开始密集更新,上线 S2.0 版本;进入 12 月,豆包电脑版上也开启内测了视频生成模型 PixelDance。
火山引擎成为阿里云毫无疑问的竞争对手,二者都掌握着实力相似的 AI 算力基础设施,对二者来说,持续不断降低的算力成本和模型价格已经成为过去式,未来如何长出更繁荣的 AI 应用生态,成为各自更迫切的赛点。
腾讯
VS 百度:起跑的快慢
从一开始,腾讯在大模型上就选择了开源路线,而百度则是闭源模型领域的大厂代表。起跑争先的百度,和不争先的腾讯,成为大模型行业的另外一组对标。
去年,百度是国内大厂中最先发布大语言模型的一家,而腾讯则是大厂中起跑最晚的一个,二者发布时间间隔了 6 个月。
而今年,二者在技术升级和场景拓展上都有进步,也与各自原有业务上结合出了新亮点,比如百度文库经过大模型重构成为了「一站式 AI 内容获取和创作平台」,而微信搜一搜等场景中,混元大模型都成为更高效的存在。