通用大模型虽然还没达到激烈的百“模”大战,但是DeepSeek-R1的发布着实也“卷”到了其他公司。
1月29日以来,包括微软、亚马逊云科技、英伟达等海外AI巨头纷纷宣布,已接入DeepSeek。2月1日,华为云发文称,经过硅基流动和华为云团队连日攻坚,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。
该服务具备两大特点:
一是,得益于自研推理加速引擎加持
,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球高端GPU部署模型的效果。
二是,提供稳定的、生产级服务能力
,让模型能够在规模生产环境中稳定运行,并满足业务商部署需求。华为云昇腾云服务可以提供澎湃、弹性、充足的算力。
与此同时,当地时间1月31日,OpenAI紧急上线新一代推理模型o3-mini,并首次向ChatGPT免费用户开放推理模型。这一举动也被业内解读为感受到了DeepSeek带来的压力。
紧急“上新”的还有阿里云,1月29日凌晨,阿里云正式发布升级了通义千问旗舰版模型Qwen2.5-Max,据介绍,Qwen2.5-Max模型预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了包括DeepSeek-V3在内目前全球领先的开源MoE模型以及最大的开源稠密模型。