专栏名称: AI范儿

AI领域四大媒体之一。智能未来，始于Prompt！

2024年中国AI都发生了什么？| 追赶与超越之路（上）

AI范儿 · 公众号 · 科技媒体 · 2024-12-31 17:45

主要观点总结

本文介绍了中国在人工智能领域的发展情况，特别是以智谱AI等为代表的企业在追赶超越国际巨头的过程中的关键事件。文章描述了这些企业在技术竞赛、资本投入、人才争夺、产品发布等方面的动态，同时也提到了行业的挑战和争议。

关键观点总结

关键观点1: 人工智能行业的竞争非常激烈，各种企业都在不断追赶和超越。

中国AI企业在技术和产品上取得了重要进展，与国际巨头的差距在缩小。价格战争是竞争的一部分，但技术创新和商业模式才是决定胜负的关键。

关键观点2: 人才争夺是AI行业的重要一环。

为了吸引和留住顶尖人才，企业不惜下重金。但原创性技术创新和研发氛围的营造也许更为关键。

关键观点3: 资本在AI行业的发展中起到了重要作用。

尽管存在竞争和挑战，但资本市场对AI行业的看好没有改变。企业的融资情况反映了行业的繁荣和机遇。

关键观点4: 技术创新是AI行业的核心驱动力。

无论是模型的创新、产品的升级还是市场的拓展，技术创新都是企业取得成功的关键。企业需要不断投入研发，保持技术领先。

正文

在人工智能发展史上，2024年注定是一个值得铭记的年份。这一年，中国AI企业上演了一场惊心动魄的追赶与超越之战。从年初紧追GPT-4的步伐，到年中直面GPT-4o的冲击，再到年末与OpenAI的o1系列针锋相对，中国企业展现出了惊人的执行力和创新潜力。

这是一个群雄并起的时代。智谱AI、月之暗面、MiniMax、百川智能、零一万物、阶跃星辰等"AI六小龙"，与BAT等互联网巨头展开了激烈角逐。资本的青睐、人才的流动、技术的突破交织在一起，构成了这个行业最动人心魄的篇章。当年末的钟声敲响时，中国AI企业已经在某些赛道上实现了对国际巨头的真正超越。

在这场无声的竞赛中，每一次OpenAI的创新都会激起一波追赶浪潮。然而，中国企业并非简单模仿，而是逐渐走出了自己的特色。从智谱的全栈布局到月之暗面的极致体验，从MiniMax的效率追求到DeepSeek的垂直突破，每家企业都在寻找着独特的发展路径。

这是一个充满戏剧性的故事，也是一个关于创新与坚持的传奇。让我们走进2024，重温这场改变中国AI行业格局的精彩角逐...

一月群雄逐鹿：开年竞逐

2024年的第一场雪还未在北京落尽，AI行业的竞争已经白热化。在这个行业里，人们早已习惯了连轴转的工作节奏——毕竟，OpenAI从不给对手喘息的机会。

此时距离GPT-4发布已有9个月，这个横亘在所有企业面前的丰碑依然让人望而生畏。尽管百度在2023年10月就宣称文心一言4.0已经"毫不逊色"于GPT-4，但市场和用户显然还在等待更多的挑战者登场。

1月16日，这个看似平常的工作日，注定要载入中国AI发展史册。清华大学计算机系教授唐杰创立的智谱AI，在这一天推出了 新一代基座大模型GLM-4 。当测试数据出炉时，整个行业都为之振奋：在MMLU、GSM8K等多个权威评测中，GLM-4均达到GPT-4 90%以上的水平。更令人瞩目的是，在中文对齐能力上，GLM-4首次实现了对GPT-4的超越。

巧合的是，被业内称为"AI六小龙"之一的MiniMax选择在同一天亮剑。他们发布了国内首个MoE（混合专家模型）大语言模型ABAB6，这个创新的混合专家架构在处理复杂任务和提升计算效率方面表现出独特优势。

仅仅两周后，MiniMax又一次出手，推出能在6秒内完成音色复刻的语音大模型abab-speech-01，用数百万小时的音频数据训练成果，展示了他们在多模态领域的实力。

从此，声音复刻也成为国内AI聊天机器人的标配功能。

1月22日，一个重量级人物带着他的新作品加入战局。李开复领导的零一万物发布了Yi-VL多模态语言模型，这款产品一经推出就在MMMU和CMMMU数据集上创造佳绩，展现出强大的跨学科知识理解能力，让这家低调的公司一举成为全球开源社区的焦点。

仅仅四天后，被誉为"最懂AI"的团队月之暗面展示了他们对产品打磨的极致追求。Kimi Chat的重大更新不仅全面提升了基础模型能力，更在用户体验上实现突破：回复速度翻倍，联网搜索、上下文学习、多场景能力一应俱全。特别是小程序版本新增的语音输入功能，让这个产品在用户友好度上遥遥领先。

这些创新功能的完美呈现，让这家一向低调的企业迅速成为业界瞩目的新秀。在2024年上半年，Kimi一跃成为最受欢迎的AI应用之一，吸引了大量原本专注使用ChatGPT的用户转投旗下。其影响力之大，甚至在资本市场掀起了"Kimi概念股"的投资热潮。

就在这个波澜壮阔的一月即将结束时，1月29日，一个重磅消息引爆全场。被业内称为"中国最特立独行的AI独角兽"的百川智能推出了超千亿参数的Baichuan 3。这个庞然大物不负众望，在医疗评测中展现出最佳性能，更在中文任务上超越了GPT-4，同时在自然语言处理和代码生成领域也表现不俗。

至此，新年第一个月的角力渐入尾声。五家"AI六小龙"已经悉数亮相，每家都展现出独特的技术路线和产品特色，而另外一家六小龙此刻还在继续蓄力，他将在几个月以后才首次亮相。

然而，就在一片欢呼声中，一个令人深思的声音从另一个科技巨头传来。

1月30日，字节跳动CEO梁汝波在年度全员会上罕见地流露出强烈的危机感。这家移动互联网时代的佼佼者，在AI时代似乎迷失了方向。"直到2023年才开始讨论GPT，而业内做得比较好的大模型创业公司都是在2018年至2021年创立的。"

这番话像一记惊雷，在科技圈久久回荡。当AI创业公司在你追我赶的时候，这家曾以敏锐闻名的互联网巨头，终于意识到自己在这场空前的技术变革中落后了。字节跳动的自我反思，某种程度上也折射出整个中国科技行业在AI领域的尴尬： 曾经的创新者，如今却不得不重新找寻追赶的勇气 。

这场波澜壮阔的竞赛，才刚刚拉开序幕。没有人知道，在春节即将来临之际，一个名为Sora的风暴正在大洋彼岸酝酿...

春节惊雷：Sora引发的震动

2024年的除夕还未到来，美国硅谷已经给中国AI圈送来了一份"特别的新年礼物"。

2月10日，农历大年初一，OpenAI在社交媒体上低调发布了文生视频产品Sora。这个以冰岛语"故事"命名的模型，能将文本描述转化为长达60秒的高质量视频，支持多角度镜头转换，甚至能准确还原复杂的物理运动规律。

一时间，原本应该享受团圆的中国工程师们，纷纷被迫中断休假，钉在电脑前研究Sora的演示视频。

这个突如其来的"春节礼物"，让整个中国AI圈陷入沉思。视频生成这个全新赛道的出现，意味着又一次技术范式的转变。一位不愿透露姓名的AI创业公司CTO感叹："当我们还在研究如何追赶GPT-4时，OpenAI已经在开辟下一个赛道了。"

3月：暗流涌动

就在各家企业还在消化Sora带来的冲击时，资本市场率先做出了反应。二月底， 月之暗面以超10亿美元的融资为春季融资大战打响第一枪 ，其豪华的投资方阵容——阿里、红杉中国、小红书、美团和砺思资本等的加入，展现出资本市场对中国AI企业的坚定信心。

3月6日， MiniMax也获得了阿里领投的6亿美元融资 ，估值一举突破25亿美元。资本的青睐似乎在为即将到来的技术竞赛做准备

几乎是同一时间，零一万物发布并开源了Yi-9B模型。这个在代码和数学能力上表现卓越的模型，以其优异的中英文处理能力和低成本的部署优势，很快在开源社区引起轰动。

产品战场上，阿里云率先发力。3月14日，通义千问展示了令人瞩目的场景创新能力，其一键速读万页文档的解析功能，以及随后推出的6小时超长音视频转写能力，展现出在垂直领域的深耕成果。

几天后，月之暗面再传捷报，Kimi智能助手将无损上下文长度提升至200万字，这一远超OpenAI的成就，为行业树立了新的标杆。

在这个充满变数的三月，一个重磅消息让整个行业为之振奋。

3月19日，英伟达在GTC 2024大会上发布 新一代AI芯片GB200 。这颗搭载2080亿晶体管的"超级芯片"，以其四倍于H100的训练算力和更低的能耗，重新定义了AI计算的极限。

这个消息让中国AI圈既看到了希望，又感受到了压力，获取这些顶级算力的难度和成本，可能会让行业分化加剧。

3月23日， 最低调的"AI六小龙"阶跃星辰终于揭开了神秘的面纱 。他们的Step系列通用大模型矩阵——包括千亿参数语言大模型Step-1、多模态大模型Step-1V及万亿参数MoE语言大模型Step-2预览版的同时亮相。

月末，阿里又一次展现了技术创新实力。3月29日推出的首个开源MoE模型Qwen1.5-MoE-A2.7B，用27亿参数就能匹敌70亿参数的传统模型，不仅大幅降低了训练成本，更为行业探索出一条提升效率的新路径。这是继春节前推出Qwen1.5系列后，阿里在模型架构创新上的又一重要突破。

从春节的Sora震撼，到三月英伟达GB200的发布，再到各家企业匆忙的技术布局，这个春天注定是不平静的。中国AI企业在视频生成领域的暂时"失语"，以及对顶级算力的迫切需求，都预示着行业格局可能发生剧变。而随着四月的到来，一场涉及技术、资本、人才的多维度竞争，正在悄然展开......

4月：百舸争流

进入4月，行业竞争进一步白热化。4月3日，阿里云推出AI编程工具"通义灵码"，支持200多种编程语言，展现出在垂直领域的野心。3个月后，这个产品被 WAIC（世界人工智能大会）评为镇馆之宝之一。

一周后，他们又推出320亿参数的通义千问（Qwen1.5-32B），这个在性能、效率和内存占用间达到平衡的模型，为行业提供了一个更高效、经济的解决方案。

4月17日， MiniMax发布abab 6.5系列模型 ，包含万亿参数的abab 6.5和更高效的abab 6.5s。这两款模型支持200k tokens上下文长度，能在1秒内处理近3万字文本，展现出惊人的处理效率。更具战略意义的是，4月29日，MiniMax宣布开放平台API服务全面升级，降价超过50%，处理速度翻倍，向着普惠AI迈出重要一步。

4月18日，Kimi智能助手迎来重大更新，包括模型能力提升、新增常用语功能、语音输入/播报以及搜索引用溯源，旨在提高用户体验和效率。新版Kimi在逻辑推理、数学编程、中英翻译等方面表现更优，同时支持个性化常用语设置和语音交互，让信息获取更便捷。搜索结果新增引用溯源功能，确保回答的严谨性。

4月30日，一个重要的评测结果引发业界关注：百川智能的Baichuan 3在SuperCLUE中文大模型评测中以73.32分位居国内第一，超越GPT-4-Turbo等32个大模型。特别是在知识百科（82分）和逻辑推理（68.60分）两个关键维度上的出色表现，让业界看到了中国模型的真实实力。

5月鏖战：巨头觉醒与价格风暴

五月，人工智能赛道上的竞争骤然加速。5月9日， 阿里云发布通义千问2.5版本，并开源1100亿参数模型Qwen1.5-110B 。这个版本在理解、逻辑推理等方面显著提升，中文能力领先业界。在多个基准测评中，Qwen1.5-110B成功超越Meta的Llama-3-70B模型，标志着通义大模型首次赶上GPT-4水准。

5月13日，OpenAI发布GPT-4o（ "Omni"），这个全能型模型不仅能够分析和生成文本、图像和声音，其速度是GPT-4 Turbo的两倍，成本仅为后者的一半。一时间，中国企业好不容易拉近的技术差距，再次被拉大。

李开复领导的零一万物同样不甘示弱。5月13日，他们发布千亿参数AI模型Yi-Large，并宣布开源闭源双轨战略，展现出清晰而审慎的商业路线。

5月15日，MiniMax推出AI聊天APP"小海螺AI"，这款基于多模态大模型的应用能快速处理大量文本，理解情绪，支持多种文件格式和语音交互。

在行业治理方面，智谱AI选择了独特的切入点。5月21日，他们与OpenAI、谷歌、微软等15家顶级AI公司共同签署前沿人工智能安全承诺，以平等者的姿态加入全球AI治理对话。同日，百川智能的Baichuan 4在SuperCLUE综合基准评测中以80.64分刷新国内记录，超越GPT-4 Turbo，展现出中国企业在技术追赶上的坚定决心。

紧随其后，百川智能在5月22日推出新一代大模型Baichuan 4和首款AI助手"百小应"。这款助手在通用能力、数学和代码能力上显著提升，国内评测中能力位居首位。

两家沉睡已久的科技巨头也在这个月醒来。

5月15日， 字节跳动发布豆包大模型， 公布了足以搅动行业的使用价格。豆包通用模型pro-32k版，模型推理输入价格仅为0.0008元/千Tokens，而市面上同规格模型的定价一般为0.12元/千Tokens，是豆包模型价格的150倍。pro-128k版模型推理输入价格为0.005元/千Tokens，比行业价格低95.8%。

月末，腾讯也加入战局。腾讯元宝AI产品基于腾讯混元大模型开发，具备多模态能力，旨在提供即时答案、创意灵感和新鲜资讯，覆盖知识学习、生活百科、职场办公和趣味创作等多个场景。

然而，这场激烈竞争中并非完全一片光明。遗憾的是，百川智能在2024年4月的这次重磅发布后，随后半年多时间内未见类似跟进，年末更传出联合创始人、商业化负责人洪涛离职的消息，为这个季度蒙上了一层阴影。

随着五月的硝烟渐渐散去，六月的阳光将照进这个充满期待与不确定的赛道。谁能在这场没有硝烟的战争中脱颖而出，依然是悬而未决的谜题。

谁打响了价格战的第一枪？

在人工智能的激烈赛道上，字节跳动这个曾经的睡巨人终于苏醒，却发现世界已经面目全非。如果说DeepSeek用那一枚价格子弹打响了价格战的第一枪，那么字节则如同重炮手，瞬间引爆了全面的价格战争。

5月初，私募巨头幻方旗下的深度求索犹如一匹黑马，以DeepSeek-V2模型的性价比率先发起降价突袭。这款在数学、编程、中英文能力上已逼近GPT-4的模型，使用价格仅为GPT-4o的1/35，瞬间点燃了行业敏感的神经。

字节跳动随即加入战局，以其一贯的激进风格，将豆包通用模型Pro-32k的输入价格狠狠砍至0.8元/百万tokens。火山引擎总裁谭待更是豪言：" 大模型从此以厘计价。 "这一举动，无异于向整个行业发出了价格战的总动员令。

阿里云、百度紧随其后，纷纷大幅下调价格，甚至直接推出免费模型。科大讯飞和腾讯也不甘示弱，星火Lite API和混元大模型lite 256k相继宣布免费。短短数日间，国内AI大模型市场已然陷入了一场全面的价格厮杀。

然而，这场看似激烈的价格战实质上暴露了国内AI企业的深层焦虑。 价格战犹如饮鸩止渴，看似痛快，实则危机四伏。 企业们试图用低价换取市场份额，背后却是对商业模式的迷茫和对未来的不确定性。

字节跳动的这一招，表面上看似凌厉，实则透露出其在AI赛道上的无奈。作为一家习惯了通过规模和流量取胜的互联网巨头，他们似乎尚未找到在AI领域真正的制胜之道。价格战，不过是他们手中为数不多的武器之一。

这场没有硝烟的价格大战，正将所有参与者拖入一个越来越窄的通道。技术创新被价格的漩涡淹没，商业价值被无序的竞争稀释。谁能在这场看似激烈实则内耗的竞争中保持理性和长远眼光，谁就可能最终站在这个新兴赛道的制高点。

当价格战硝烟散去，留下的或许只有一地鸡毛和对未来的迷茫。在AI这个注定要改变世界的赛道上，价格从来都不应是最终的制胜法宝。

六、七月暗涌：人才、资本与算力的博弈

价格战的硝烟刚刚散去，AI行业并未迎来平静，反而进入了一个更为残酷的角逐场——人才、资本与算力的白热化战场。如果说五月是巨头觉醒和价格风暴的舞台，那么六月则预示着更为深层次的竞争即将展开。

6月，资本的嗅觉异常灵敏。 6月3日，智谱AI率先收获国际资本的青睐，获得沙特阿美旗下基金Prosperity7的4亿美元融资 ，估值突破30亿美元，这无疑是对其技术实力和发展前景的有力背书。

紧接着，6月17日，杭州DeepSeek宣布DeepSeek Coder V2开源，该模型在代码和数学能力上直逼GPT-4-Turbo，总参数达2360亿，位居全球前列。模型、代码和论文的全面开源，为业界树立了开放共享的标杆，也加速了中国AI生态的繁荣。DeepSeek的开源举动，不仅展现了其技术自信，也吸引了更多开发者和研究者的关注，为后续的人才争夺战埋下了伏笔。

如果说资本的流动是暗流涌动，那么人才的争夺则是一场公开的博弈。7月，人才争夺战进入白热化。字节跳动展现出令人震撼的进攻性，以高规格待遇挖来了“最懂阿里大模型的人”——前通义大模型负责人周畅及其团队，更网罗了零一万物前算法副总裁黄文灏、面壁智能原核心成员等多位AI领域顶尖人才。