作者|林志佳
编辑|胡润峰
本文首发于钛媒体APP
为什么MaaS模式盈利较难?
大模型下半场:“六小虎”加速分化
“服务器繁忙,请稍后再试。”
这是DeepSeek模型近一个月内经历“拥堵”、“间歇性瘫痪”之后频频回复的内容,亦说明接入DeepSeek的相关服务器依然处于爆满状态,大模型算力需求依然旺盛。
程荫表示,接入DeepSeek大模型的部署过程需同时满足高并发与低延迟的严苛要求,并需全面考量数据安全、隐私保障、资源弹性扩展以及系统维护等多重因素,DeepSeek推出了多种部署模式许可也挑战了全球大模型技术提供商的主要商业化方式,目前推出的方式有云端部署、本地/内网部署、边缘部署、混合部署、容器化/微服务部署,以及联邦部署模式等。
与此同时,C端方面,超级应用“腾讯微信”在AI搜索功能中接入DeepSeek模型,使得国产AI应用迎来“诺曼底时刻”。
大模型是资本密集型研发产业,不仅训练需要花费大量算力,运行时还需花费大量资金进行推理。同时,如今DeepSeek-R1/V3全面开源之后,闭源模型价值被质疑。
百川智能创始人、CEO王小川近期表示,创业总是难的,之前主要是让老板相信,这次是让团队、投资人、外部合作伙伴都能相信。
进入 2025 年,新一轮 DeepSeek 热潮袭来,这也让国内 “大模型六小虎”—— 智谱 AI、百川智能、阶跃星辰、零一万物、月之暗面、Minimax 站在了新的十字路口,做出了不同的发展选择:有的选择继续投身新模型的研发,探索产业落地的更多可能;有的则选择拥抱 DeepSeek 模型,借助其优势,开拓新的业务版图。
-
阶跃星辰:最新“跃文”接入DeepSeek-R1模型;
-
MiniMax:01海外版已上线DeepSeek-R1深度思考模式;
-
零一万物:旗下的海外AI应用PopAi接入了DeepSeek模型。而DeepSeek-R1问世之前,零一万物创始人李开复已公开表示,公司将不再追求训练超级大模型,参数适中同时性能优异、推理速度更快、推理成本更低的轻量化模型更适合商用场景,“会成为AI-First应用爆发的催化剂”。此外,2月14日,零一万物与苏州高新区联合成立的产业大模型基地正式授牌。
-
百川智能:1月25日发布新模型Baichuan-M1-preview,具备语言、视觉和搜索推理能力,2月13日,以Baichuan-M1为底座打造的“AI儿科医生”经过近一个月的内测后在京“上岗”;
-
月之暗面:1月25日发布Kimik1.5多模态思考模型,另外还将推出“持续拿到SOTA结果”的大模型。
-
智谱AI:暂不会接入DeepSeek,而是选择加码Agent智能体,Agentic GLM(智谱专为手机研发的系统级大模型)登陆三星最新款Galaxy S25系列手机,提供基于AI的实时语音和视频通话,以及实现视觉理解和系统功能调用、AI搜索、文案写作等功能。
国际投行摩根士丹利最新报告预测,AI 市场正在走向分化。DeepSeek改变了 AI 行业叙事方式,展示了不走寻常路径的回报,而世界上只有少数几家公司才能满足条件、以极其强大的芯片和基建设施为AI发展提供动力的观念已不再是事实,有能力支付进场成本的公司也不再局限于少数行业佼佼者。
摩根士丹利指出,DeepSeek热潮促使一些公司愿意支付高价保持领先地位;但对于另一阵营,AI 是成本中心,对这些公司而言追求的是更便宜的tokens。
“我们认为市场赢家最终将是能够迅速扩大规模并将新技术突破商业化的公司。随着市场进入推理阶段,我们对 AI 大模型参与者逐渐看好,并认为从2025年下半年开始,将有来自边缘设备复苏的更好机会。”摩根士丹利认为,如今 AI 热潮有点像1995年的互联网普及,当时大家预计思科(CISCO),或者是AltaVista、Hotmail赢得竞赛,但亚马逊却提供了最低廉的每秒服务token,成为最终的赢家。
程荫表示,对于 AI 应用而言,大模型的更新升级将有助于加速应用场景的创新及商业化落地,未来无论是像文案撰写和内容生成、在线会议总结、AI助手、搜索等面向个人生产效率提升的应用,还是面向客服、营销等水平业务职能的场景,亦或是行业特有场景的商业化落地都将会是今年市场关注的重点。
谈及算力影响,程荫对钛媒体AGI表示,她认为目前还不好说,现在并不能证明大模型的预训练和推理对于算力要求明显降低,如果在驱动更多企业部署AI的假设下,中国算力市场就可能会迎来增长。
程荫强调,DeepSeek引领基础大模型开启另一开发新范式。2025年,产业界也更加关注大模型和生成式AI的落地,整个生态系统应通力合作加速应用场景的创新及商业化。
(本文首发于钛媒体App)
热点视频推荐