专栏名称: Tech星球
36氪旗下品牌媒体,专注小程序生态,聚焦互联网前沿科技。
目录
相关文章推荐
51好读  ›  专栏  ›  Tech星球

百度文心4.5与X1登场后,大模型第一梯队的竞争再升级?

Tech星球  · 公众号  ·  · 2025-03-17 18:54

正文

👆点击 Tech星球 > 点击右上角“···” > 设为星标🌟
Tech星球(微信ID: tech618

| 任雪芸

封面来源 | 图虫创意



比预想中更快一步,3月16日,百度正式发布文心大模型4.5(以下简称文心4.5)及文心大模型X1(以下简称文心X1),在文心一言官网即可免费使用。


文心4.5不仅在基础能力上有大幅度提升,且具备原生多模态等能力,其多项基准测试成绩优于GPT4.5、DeepSeek-V3等,并且平均分达到79.6分,高于GPT4.5的79.14。文心X1不仅在性能上对标DeepSeek-R1,且具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运动工具的深度思考模型。


和DeepSeek横空出世一样,文心4.5和文心X1不仅点燃了国内用户的热情,更让外网沸腾。在推特上,不少人纷纷在求百度测试账号,他们为两大模型优异的性能和超低的价格感到不可思议,不少人觉得百度的股价被低估了。甚至有人在百度推特账号下@萨姆·奥尔特曼,他们表示游戏结束了。



在看到文心新模型的表现后,在推特上拥有70万粉丝的美国投资人Bill Gurley感慨道,美国人工智能公司应将100%的时间用于开发和创新,而不是在华盛顿特区游说寻求保护以躲避竞争。这种情况很糟糕,明显暴露出缺乏自信。



两大模型的优异能力,是对过去3月外界对于“百度大模型掉队了”最有效的回应,也再一次证明了百度对AI战略贯彻到底的决心。毕竟,大模型竞技是一场持久战,拼的是耐力、技术、资本。从Transformer到OpenAI-o1和DeepSeek-R1,技术的更新时刻在发生,没有人可以保证永远领先,但关键的是敢拼的勇气。


所有玩家从来没有放弃和停止在大模型领域的努力,百度也是如此。开年以来,百度在大模型领域动作频频——文心一言完全免费、文心4.5将于6月30日正式开源;百度核心业务搜索接入DeepSeek;很快百度还会发布4.5系列模型,以及更前沿的下一代模型5.0版本。


动作频频的背后,透露出百度依然想留在牌桌上的决心,它也确实做到了。但百度并不能掉以轻心。因为,大模型的终局远未到来,包括百度在内,所有的玩家都必须全力以赴。这也是百度坚持不懈的根源。


百度加速变革:一场必要的战略纠偏


半个月之前,OpenAI举办了一场线上发布会,正式发布了其最新一代基础模型GPT-4.5。3月16日,百度并没有任何发布动作,而是直接上线了文心4.5与文心X1。


这场上线发生得悄无声息。有百度内部人士称,无论是文心4.5全面免费,还是PC和移动两端直接上线,百度管理层都是在半天之内做出的决策。


这似乎是现在的百度与过去的百度,以及行业的一场赛跑。


这一次的百度越来越快了。据百度方面透露,此次文心4.5和X1大模型发布之后,百度后续还会推出文心4.5系列模型,以及在下半年推出更先进的下一代模型5.0版本。


其实,此次模型迭代进程明显加快,并非偶然。这一现象背后,其实是百度对过往策略选择的反思与积极纠偏。


过去半年间,DeepSeek等新兴公司凭借开源、低成本的模式,给OpenAI、百度这类传统大模型巨头带来了不小的压力。如今,全球AI企业中,无论是OpenAI,还是百度,都逐渐意识到,大模型领域未来走向依旧充满变数,尚无定论。


激烈竞争的大模型领域,保持竞争力的关键在于果敢地 “求变”。于是,就在今年2月,比OpenAI更快一步,百度决定及时转变策略。


随后,百度创始人李彦宏就快速且坚决地推动了一系列动作:文心一言免费、核心业务搜索接入DeepSeek、文心大模型4.5系列将在6月30日正式开源等。


这次纠偏是文心一言对当下市场竞争的直接回应。从悄然上线文心4.5与X1,以及后续透露的一系列迭代计划,无一不彰显出百度谋求变革的坚定决心。


不过,百度突然加快脚步,让外界有人质疑它可能会迷失方向。但目前来看,百度的“变快”建立在对自身技术实力与市场趋势的研判上,每一次模型的迭代都伴随着技术架构的深度优化,以及性能的飞跃提升。


从百度自有业务来看,百度旗下多款用大模型重构后的AI应用,包括百度App、百度地图、百度网盘、百度文库等体验感都在持续提升。在此次文心4.5与文心X1上线后,这些应用也在迎来全方位升级。



让大模型产品,植入“原生技术内核”


作为百度重回牌桌的阶段性产品,原生多模态大模型文心4.5以及深度思考模型文心X1,究竟在哪些方面实现了蜕变与升级?


据了解,文心4.5是百度自主研发的新一代原生多模态大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。


而文心大模型X1具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运用工具的深度思考模型,兼备准确、创意和文采。


基于文心大模型4.5和文心大模型X1,Tech星球分别实测了一些应用场景。


我们上传了一段“体重管理年”的新闻视频,要求文心4.5概括新闻内容,可以看到其给出了准确的回答,证明了其跨模态的能力。目前,文心4.5支持上传的视频文件,兼容常见的格式,单个视频文件大小不超过20M。



在图片理解上,通过这个问题也能够看出在图形推理、图表分析的“高智商”以外,文心4.5还具备了理解梗图、漫画、歌曲、电影等多模态内容的“高情商”。








请到「今天看啥」查看全文