百度,
瞄准了大模型角力的「第二场」
。
文 | 佘宗明
DeepSeek
火爆带动的新一轮大模型角力,终于在
2
月底迎来了高潮。标志就是,分隔在大洋两岸的两大
AI
企业——
OpenAI
和百度,手持「
4.5
」的号码牌「狭路相逢」。
2
月
28
日,在预热多时后,
OpenAI
发布了其「迄今为止规模最大、知识最丰富的聊天模型」
GPT4.5
。
同日,百度官宣,「百度有史以来最强大模型」文心大模型
4.5
将于
3
月
16
日发布,并于
6
月
30
日正式开源。
▲百度官宣,将于3月16日发布文心大模型4.5版本。
「在幻觉方面降至新水平」「具备原生多模态与深度思考等高阶能力」外加「开源」,让蓄势待发的文心大模型
4.5
受到了多方聚焦。
若只是「就模型看模型」,从
GPT-4.5
和文心大模型
4.5
的区别中看到的也许是几个侧面。
但若将视角拉得更远、维度拉得更高,会意识到二者路径差异的链式反应很可能延续到以「应用落地」为主题的后半场,成为中美
AI
竞争未来方位变化的显微镜。
据了解,
OpenAI
的
GPT-5
、百度的下一代大模型文心大模型
5.0
都将在今年内发布,届时「隔空斗法」的情势如何,兴许也能从此次迂回交锋中窥见端倪。
需要注意的是,近期接连打出「开源
+
免费」组合拳的百度,在文心大模型
4.5
上延续了开放立场。「开源
+
免费」,也是理解百度如何在大模型第二场角力抢占主动权的题眼。
要是在
1
年多前就将风行于移动互联网时期的「下半场」叙事引入
AI
领域,那难免会被认为是言之过早。
但到了今天,随着
Scaling law
边际效应递减,
DeepSeek
又在「大力出奇迹」的道路旁开了个「四两拨千斤」的岔口,大模型竞争转场到下个阶段的态势已清晰可见。
问题来了:第二场,比的是什么?从历次科技革命深处传来的答案,指向了应用。
李彦宏说「基础模型只有在能够大规模有效解决现实世界问题时才真正有价值
」,斯坦福教授吴恩达说「未来
AI
的竞争不是比谁模型大,而是比谁能把技术塞进企业工作流」,本质上强调的是同一点,那就是:应用,应用,应用。
这是基于产业发展规律的洞见:每次技术变革,在「价值链金字塔」中贡献最大的均是应用层,移动互联网时代从应用层到基础设施的倒三角型利益分配,支撑了移动生态的长久繁荣,就是直观注解。
▲应用生态是AI竞争「第二场」的决胜点。图片由文小言生成。
如果说以往很多
AI
应用开发者在
Scaling law
筑起的大山面前只能望而却步,那随着
技术成本降低和开源生态构建,
AI
应用迎来寒武纪般的爆发
已非奢望。
在此情形下,大模型竞争的「底层逻辑」也会被重构:以往是参数竞赛、算力比拼,现在是生态争夺、产业落地竞速。
已全量上线
DeepSeek
满血版的百度搜索就说:在大模型「狂飙」两年后,竞争
的重点已发生根本偏移——价值锚点正从「技术惊艳度」转向「经济转化率」;竞争维度正从「实验室指标」扩展到「产业渗透深度」;胜负手正从「算法优势」转变为「生态掌控力」。
这时候,开发者生态和应用场景的丰富度成了重中之重。
DeepSeek
和文心大模型
4.5
的「降本效应」,就在为此提供支撑。
那怎样才能更好地助力
AI
应用爆发?核心其实就在于两点:
以开源促
AI
技术平权,以高性能基础模型助产业提效。
此前
DeepSeek
已经让各方看到了大模型「开源
+
高性能」迸发出的能量,而文心大模型
4.5
想要接着引爆。
可以看到,
2
月中旬以来,大模型「开源周」业已开启。在刚过去不久的
2025
全球开发者先锋大会上,商汤科技、
MiniMax
、阶跃星辰等多家企业就纷纷亮出自家最新的开源模型。
而带头宣布转向开源的是百度。
2
月
13
日,百度宣布文心一言自
4
月
1
日起全面免费开放,次日,宣布文心大模型
4.5
系列将开源。
在
OpenAI
还在表示正在讨论公开
AI
模型权重,马斯克炮轰
OpenAI
变
CloseAI
后也只是表示「
xAI
将在
Grok 3
变得稳定后对
Grok 2
开源」的背景下,百度在转向开源问题上没有挤牙膏,而是一步到位,颇堪寻味。
李彦宏在
2024
财报电话会议上就对此作了解释:「我们从
DeepSeek
学到的一件事是,那就是将最为优秀的模型开源供所有人使用,将可以极大地推动其应用,因为大家出于好奇自然会想去尝试开源模型,进而推动其更广泛的应用。」
对百度而言,推出「开源
+
免费」组合拳,有益于
扩大自身应用生态
。
开源社区的分布式创新模式,可以夺得生态主导权,显著降低技术优化的边际成本。
作为《
Time
》口中「全球少有的在
AI
上实现全栈布局的公司」,百度的
AI
四层架构
(芯片
-
框架
-
模型
-
应用)
的垂直整合能力可以放大「开源
+
免费」的赋能应用价值。
尽管开源
意味着会减少
API
调用收入,但
通过「
开源引流
+
云服务变现
」的模式有效拉动云服务需求,有望形成「
技术优化
—
用户增长
—
商业变现
」的正向循环,带来长远价值。
不仅如此,推出「开源
+
免费」组合拳,还有助于
刷新公众对其大模型能力的认知
。
以往很多用户了解文心大模型的切口是产品端的文小言
(前身为文心一言)
,而开源和免费之后,以往埋在
API
调用日志
中跳动的数字
里的百度先进大模型能力,就可以被更多
B
端
C
端用户感知——他们用完后没准会感慨:原来,文心大模型还可以这样。
说白了,「开源
+
免费」本身会说话,可以让更多开发者跟普通用户知道文心大模型
API
日均调用量从
2023
年的
5000
万次增长到
16.5
亿次并非没有来由,文心一言在咨询机构沙利文的《
2024
年中国大模型能力评测》中拿下五大评测维度的四项第一也不是没有依据。
▲开源+免费,可以让更多人了解到先进文心大模型的能力。
正因如此,在行业外部分人还在议论闭源转开源的态度变化时,行业内关注得更多的却是百度借「开源
+
免费」撬动「
AI+
云」飞轮的想象空间。
要知道,据第三方测算,文心大模型
4.5
系列的开源,将带动至少百万开发者入场,孵化出教育、医疗、制造等领域的千亿级
AI
应用市场。
这意味着,百度在大模型竞争重点向应用倾斜的情况下,有了更大的重塑竞争优势空间。
「
开源
+
免费」策略只有跟高性能基础模型结合,才能带来强动能与高势能的叠加。
文心大模型
4.5
能力过硬,是支撑「技术底座开放—开发者增加—数据增多—场景丰富」增强回路的关键支点。
评判模型能力的常见指标里,少不了
「幻觉率」
这一项。幻觉向来是大模型输出采信度的最大「天敌」,从当年
ChatGPT
被调侃为
CheatGPT
起,
AI
「一本正经地胡说八道」「制造信息污染」问题就引发了公众警惕。
在那些容错率极低的应用场景
(如金融、安全)
内,看似细小的幻觉问题很可能给行业企业带来重大损失。
GPT4.5
的主要卖点,除了情商更高之外,就是幻觉率大幅减少。
文心大模型
4.5
在融入了百度结合搜索技术积累形成的模型特色
RAG
(检索增强生成)
和首创的
iRAG
(基于检索增强的文生图技术)
后,就被业界寄予了「在消除幻觉上实现新突破」的期望,其中也包括攻克公认难题——
AI
生图幻觉问题。
iRAG
凭着大模型生成能力跟百度搜索亿级图片库这个「外挂知识库」结合,实现了对特定人物、场景的高还原度
,消除了图像生成中的
AI
味,就为此提供了解决思路。
凭借该技术,品牌海报制作成本可以从数十万元降至近乎零,影视漫画行业的内容生产效率可以提升数十倍以上。
值得注意的是,
百度搜索在接入
DeepSeek
时没有简单「拿来主义」,而是利用
RAG
为
DeepSeek
提供更精准的知识来源,优化模型输出的可靠性与专业性
,所以
DeepSeek inside
的百度搜索幻觉率往往也低于其他
AI
搜索工具。
▲接入了DeepSeek的百度搜索主页面。
从进阶能力看,现实中,
生成式
AI
常面临两大痛点:一是
多模态协同
,二是
深度思考能力
。
从单一的文本语义理解到多模态能力,是
AI
技术的关键迭代。多模态协同催生的「看听说写画」的应用场景,可以
让
AI
的表现更真实
,因而也被视作
通用人工智能
(
AGI
)
发展的关键
。谷歌公司此前
发布的《
2025
年
AI
商业趋势报告》预测,
2025
年多模态
AI
将成为企业采用
AI
的主要驱动力,助力改善客户体验,提高运营效率,开发新商业模式。
但具备原生多模态能力而非「拼接型」,能实现文本、图像、语音、视频、代码深度融合的大模型,还不是很多。
深度思考是
DeepSeek
给很多人留下的强心智点所在。输入问题
(即便是复杂的
STEM
即科学、技术、工程和数学问题)
后,看着对话框里蹦出思考过程,不少人会对大模型的拓展推理能力惊呼「瑞思拜」。
但兼具这两项能力的大模型很少,
GPT4.5
跟
o3
‑
mini
也是
分别擅长前后者。
RAG
和
iRAG
跟「
理解
-
检索
-
生成
」协同优化框架带来的多模态检索协同能力,还有异构信息统一表示、冲突信息逻辑推理能力
,则为文心大模型
4.5
兼具这两大能力提供了基础。
「开源
+
免费」带来成本下降,模型能力升级带来性能提升,集两点于一身的文心大模型
4.5
,不啻为给开发应用的便捷度加了
N
倍「杠杆」。
到头来,此举可以加速技术传播与应用创新,构建更活跃的生态系统,进而吸引用户沉淀场景数据,再反哺模型性能优化,打通整个闭环。
「谋一时,莫如谋长久;谋一域,莫如谋全局」,置于应用生态构建已成大模型竞争重点的语境中,对强大模型开源,无疑是更贴合「长期主义」要义的谋长久与谋全局。
对百度来讲,「开源
+
免费」能将百度积累的
AI
全栈能力释放的倍增器。
文心大模型
4.5
的开源,百舸
AI
异构计算平台