饶毅:DeepSeek是鸦片战争以来,中国对人类最大的科技震撼。
芯东西2月5日报道,今年
国产AI大模型
DeepSeek犹如春雷炸响,以前所未有的影响力轰动全球科技圈。当前
沐曦
、
天数智芯
、
摩尔线程
、
海光信息
4家国产GPU企业,
华为云
、
腾讯云
、
天翼云
、
阿里云
、
百度智能云
、
火山引擎
6家国内云计算巨
头,
无问芯穹
、
硅基流动
等AI基础设施企业,以及
PPIO派欧云
、
云轴科技
等独立云厂商,均
已
宣布适配及上架DeepSeek模型服务。
还有更多企业正在跟上。
DeepSeek也成为本季度科技财报电话会议的必问话题,在今日刚刚举行的财报电话会议上,
AMD董事长兼CEO苏姿丰
、
谷歌CEO
桑达尔·皮查伊都
对DeepSeek大加夸赞。
昨日,
天数智芯、摩尔线程、海光信息接连宣布完成与DeepSeek模型的国产化适配
。
加上周日率先
宣布的
沐曦
,已有4家国产GPU企业公开拥抱DeepSeek。
上周
英伟达
、
AMD
、
英特尔
等海外芯片巨头更是早早完成支持。
▲近期官宣支持DeepSeek模型的芯片企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)
在今日
财报电话会议上,
AMD董事长兼CEO苏姿丰称赞
DeepSeek
展现了
“
AI世界创新的速度和步伐
”
、
“
模型和算法创新有利于AI普及
”
。
她认为
有新方法可以用更少的基础设施实现训练和推理能力,是好事,
有助于在更广泛的应用领域部署AI计算
,并夸开源模型的采用速度和步伐是相当惊人的。
谷歌CEO
桑达尔·皮查伊
今日也在财报会议中夸DeepSeek是一支
“了不起的团队”
、
“做得非常非常好”
。他透露说,谷歌的Gemini 2.0 Flash模型和2.0 Flash Thinking模型在效率方面与DeepSeek R1相当。
随着AI推理成本不断下降,AI将有更多用途
,皮查伊认为这是谷歌的“机会空间”。
继两大海外云巨头AWS和微软Azure后,这两天更多国内云计算巨头加入到支持行列中。
阿里云、百度智能云、火山引擎
先后官宣对DeepSeek V3、R1模型的支持。
加之此前的
华为云
、
天翼云
、
腾讯云
,
目前国内六大云巨头都已正式支持DeepSeek。
▲近期官宣支持DeepSeek模型的云服务及AI基础设施企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)
DeepSeek卷起的全球AI风暴,正在深度卷入产业中的每一位玩家,而
中国芯片圈和云服务领域的巨头和创企们,已然集体出动。
国内外芯片厂商纷纷快速响应,宣布对于DeepSeek模型的支持。
海外芯片三巨头中,
AMD
响应最积极,早在1月25日新年前就官宣将DeepSeek-V3模型集成到了Instinct MI300X GPU上。
在X平台发文中,AMD特别感谢了DeepSeek和SGLang团队的密切配合。
1月31日,AI计算“扛把子”
英伟达
也官宣其NVIDIA NIM微服务预览版对于DeepSeek-R1模型的支持。NIM微服务基于HGX H200系统,每秒能够处理3872个tokens。
开发者们可以调用API进行测试和试验,该API后续会作为英伟达AI企业软件平台的一部分提供。
同样在1月31日,
英特尔
也宣布DeepSeek能够在搭载酷睿处理器的AI PC上离线使用。
在酷睿Ultra 200H(Arrow Lake H)平台上,DeepSee
k-R1-1.5B模型能够本地离线运行,做翻译、做会议纪要、进行文档撰写等任务。
国内芯片厂商这边,
华为
的昇腾系列AI芯片自然不必多说。
沐曦
也联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,
2月2日首批上线的四个较小规模的模型(1.5B、7B、14B、32B),均部署在国产沐曦曦云GPU上。
▲沐曦模型资源包发布
DeepSeek-R1模型+沐曦曦云GPU+Gitee AI平台,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。官方称之为“100%国产AI的力量”。
昨
日,天数智芯、摩尔线程、海光信息接连宣布对D
eepSeek模型的支持。
天数智芯
宣布与Gitee AI合作,仅用时一天,就完成了与DeepSeek-R1模型的适配工作,并已上线多个大模型服务,包括1.5B、7B、14B等版本。
▲天数智芯完成DeepSeek-R1模型适配,上线多个大模型服务
天数智芯写道
,国内GPU与DeepSeek的适配可实现深度学习框架与国内自主硬件的深度融合,能促进国内AI产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本,有助于国内GPU拓展市场,完善产业链生态。
摩尔线程
已实现对DeepSeek蒸馏模型推理服务的部署,并
即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。
▲摩尔线程官宣信息
摩尔线程称DeepSeek的开源模型与摩尔线程的硬件形成闭环,验证了国产全功能GPU对复杂AI任务的支持能力,为AGI技术普惠化提供了可行路径。
海光信息
也在昨日宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线。DCU是海光信息推出的高性能GPGPU架构AI加速卡,已在多个领域规模化应用。
用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,即可基于DCU平台快速部署和使用相关模型。
2月1日大年初四,
华为云
正式官宣,经过和
硅基流动
团队连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。
▲硅基流动联合华为云上线的DeepSeek-R1/V3推理服务
华为云提到得益于自研推理加速引擎加持,双方支持部署的DeepSeek模型可以获得持平全球高端GPU部署模型的效果。
同日,
天翼云
宣布上架DeepSeek-R1模型。天翼云智算产品体系(
息壤-科研助手、天翼AI云电脑、魔乐社区、
“息壤”智算平台、GPU云主机/裸金属
)均接入DeepSeek R1模型并上线相应服务
。
▲息壤一体化智算服务平台
2月2日,
腾讯云
官宣了对DeepSeek-R1模型的支持,在腾讯云的HAI平台上,开发者大约花3分钟就可以接入并调用模型。
▲腾讯云HAI平台
2月3日下午16点58分,
阿里云
官宣其PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。
▲PAI Model Gallery
44分钟后,
百度智能云
也宣布了其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,公布输入和输出价格,并从上线到2月18日24点模型限时免费。
▲百度智能云公布模型的输入和输出价格
昨日下午,字节跳动旗下
火山引擎
宣布
将支持V3/R1等不同尺寸的DeepSeek开源模型,可以通过两种方式使用模型:
一是在火山引擎机器学习平台veMLP中部署,
二是在火山方舟中调用模型,将提供有竞争力的价格、全网最高限流、两周限时5折优惠,
助力企业畅享满血版DeepSeek-R1。
▲PAI Model Gallery
同日,
腾讯云
TI平台宣布
上架DeepSeek系列模型,包括“满血”的V3、R1原版模型和基于DeepSeek-R1蒸馏得到的系列模型,
全面支持DeepSeek系列模型的一键部署,并限时开放了R1模型的免费在线体验。
除了六大云巨头外,国内AI基础设施企业
无问芯穹
更是早在1月28日除夕一大早就宣布了其Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持。
PPIO派欧、云轴科技则同在2月2日官宣对于DeepSeek模型的支持。
PPIO派欧算力云
支持了DeepSeek-V3、DeepSeek-R1、蒸馏模型DeepSeek-R1-Distill-Llama-70B,模型价格与官方价格保持一致。
▲PPIO派欧算力云