专栏名称: 芯东西
芯东西专注报道芯片、半导体产业创新,尤其是以芯片设计创新引领的计算新革命和国产替代浪潮;我们是一群追“芯”人,带你一起遨游“芯”辰大海。
目录
相关文章推荐
51好读  ›  专栏  ›  芯东西

四大国产GPU力挺DeepSeek!

芯东西  · 公众号  ·  · 2025-02-05 11:04

正文

饶毅:DeepSeek是鸦片战争以来,中国对人类最大的科技震撼。
作者 | 云鹏
编辑 | 漠影
芯东西2月5日报道,今年 国产AI大模型 DeepSeek犹如春雷炸响,以前所未有的影响力轰动全球科技圈。当前 沐曦 天数智芯 摩尔线程 海光信息 4家国产GPU企业, 华为云 腾讯云 天翼云 阿里云 百度智能云 火山引擎 6家国内云计算巨 头, 无问芯穹 硅基流动 等AI基础设施企业,以及 PPIO派欧云 云轴科技 等独立云厂商,均 宣布适配及上架DeepSeek模型服务。
还有更多企业正在跟上。 DeepSeek也成为本季度科技财报电话会议的必问话题,在今日刚刚举行的财报电话会议上, AMD董事长兼CEO苏姿丰 谷歌CEO 桑达尔·皮查伊都 对DeepSeek大加夸赞。
昨日, 天数智芯、摩尔线程、海光信息接连宣布完成与DeepSeek模型的国产化适配 加上周日率先 宣布的 沐曦 ,已有4家国产GPU企业公开拥抱DeepSeek。 上周 英伟达 AMD 英特尔 等海外芯片巨头更是早早完成支持。

▲近期官宣支持DeepSeek模型的芯片企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)

在今日 财报电话会议上, AMD董事长兼CEO苏姿丰称赞 DeepSeek 展现了 AI世界创新的速度和步伐 模型和算法创新有利于AI普及 她认为 有新方法可以用更少的基础设施实现训练和推理能力,是好事, 有助于在更广泛的应用领域部署AI计算 ,并夸开源模型的采用速度和步伐是相当惊人的。
谷歌CEO 桑达尔·皮查伊 今日也在财报会议中夸DeepSeek是一支 “了不起的团队” “做得非常非常好” 。他透露说,谷歌的Gemini 2.0 Flash模型和2.0 Flash Thinking模型在效率方面与DeepSeek R1相当。 随着AI推理成本不断下降,AI将有更多用途 ,皮查伊认为这是谷歌的“机会空间”。
继两大海外云巨头AWS和微软Azure后,这两天更多国内云计算巨头加入到支持行列中。 阿里云、百度智能云、火山引擎 先后官宣对DeepSeek V3、R1模型的支持。 加之此前的 华为云 天翼云 腾讯云 目前国内六大云巨头都已正式支持DeepSeek。

▲近期官宣支持DeepSeek模型的云服务及AI基础设施企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)

DeepSeek卷起的全球AI风暴,正在深度卷入产业中的每一位玩家,而 中国芯片圈和云服务领域的巨头和创企们,已然集体出动。

01 .
国内GPU企业纷纷响应
美国芯片三巨头到齐


国内外芯片厂商纷纷快速响应,宣布对于DeepSeek模型的支持。
海外芯片三巨头中, AMD 响应最积极,早在1月25日新年前就官宣将DeepSeek-V3模型集成到了Instinct MI300X GPU上。 在X平台发文中,AMD特别感谢了DeepSeek和SGLang团队的密切配合。

1月31日,AI计算“扛把子” 英伟达 也官宣其NVIDIA NIM微服务预览版对于DeepSeek-R1模型的支持。NIM微服务基于HGX H200系统,每秒能够处理3872个tokens。 开发者们可以调用API进行测试和试验,该API后续会作为英伟达AI企业软件平台的一部分提供。

同样在1月31日, 英特尔 也宣布DeepSeek能够在搭载酷睿处理器的AI PC上离线使用。 在酷睿Ultra 200H(Arrow Lake H)平台上,DeepSee k-R1-1.5B模型能够本地离线运行,做翻译、做会议纪要、进行文档撰写等任务。
国内芯片厂商这边, 华为 的昇腾系列AI芯片自然不必多说。 沐曦 也联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型, 2月2日首批上线的四个较小规模的模型(1.5B、7B、14B、32B),均部署在国产沐曦曦云GPU上。

▲沐曦模型资源包发布

DeepSeek-R1模型+沐曦曦云GPU+Gitee AI平台,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。官方称之为“100%国产AI的力量”。
日,天数智芯、摩尔线程、海光信息接连宣布对D eepSeek模型的支持。
天数智芯 宣布与Gitee AI合作,仅用时一天,就完成了与DeepSeek-R1模型的适配工作,并已上线多个大模型服务,包括1.5B、7B、14B等版本。

▲天数智芯完成DeepSeek-R1模型适配,上线多个大模型服务

天数智芯写道 ,国内GPU与DeepSeek的适配可实现深度学习框架与国内自主硬件的深度融合,能促进国内AI产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本,有助于国内GPU拓展市场,完善产业链生态。
摩尔线程 已实现对DeepSeek蒸馏模型推理服务的部署,并 即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。

▲摩尔线程官宣信息

摩尔线程称DeepSeek的开源模型与摩尔线程的硬件形成闭环,验证了国产全功能GPU对复杂AI任务的支持能力,为AGI技术普惠化提供了可行路径。
海光信息 也在昨日宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线。DCU是海光信息推出的高性能GPGPU架构AI加速卡,已在多个领域规模化应用。 用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,即可基于DCU平台快速部署和使用相关模型。

02 .
中国六大云巨头
均已支持DeepSeek






请到「今天看啥」查看全文