专栏名称: 经济观察报
《经济观察报》官方微信。最具影响力的市场化财经媒体,下辖纸质版、经济观察网、研究院、电子版、音视频、微博、微信等全媒体矩阵,并主办中国最受尊敬企业、中国杰出营销奖、中国蓝筹地产、观察家年会、可持续发展在中国、中国最具创新企业等系列品牌活动。
目录
相关文章推荐
央视财经  ·  刚刚,登顶!全球第一! ·  9 小时前  
央视财经  ·  =͟͟͞͞大=͟͟͞͞风=͟͟͞͞+=͟͟͞ ... ·  2 天前  
经济观察报  ·  A股收评:沪指高开低走跌0.65%,Deep ... ·  2 天前  
首席商业评论  ·  雷军为何会公开惦念大S? ·  3 天前  
51好读  ›  专栏  ›  经济观察报

DeepSeek激活AI产业链 大批公司春节加班适配

经济观察报  · 公众号  · 财经  · 2025-02-07 12:00

主要观点总结

本文介绍了DeepSeek(深度求索)在春节期间受到广泛关注的情况,其用户量突破2200万,成为继ChatGPT之后的又一个现象级AI产品。云服务厂商、GPU厂商纷纷部署并讨论相关方案。文章详细描述了DeepSeek的发展历程、重要版本更新、用户反馈、云厂商的行动、GPU厂商的适应以及行业专家的观点。

关键观点总结

关键观点1: DeepSeek用户量突破2200万,成为现象级AI产品。

文章指出,DeepSeek凭借颠覆性和高性价比,迅速吸引了大量用户,成为继ChatGPT之后的又一个备受关注的AI产品。

关键观点2: 云服务厂商纷纷上线DeepSeek大模型,并纳入各自的模型商店。

国内主要云厂商如联通云、京东云、阿里云、腾讯云等自2月5日以来纷纷上线DeepSeek大模型,以更好地消耗并兜售自己的算力。

关键观点3: DeepSeek引发GPU厂商的积极响应,国产GPU公司也在努力适配。

文章提到,GPU是大模型算力的核心器件,国内多家GPU公司正在或已完成对DeepSeek的适配。例如,摩尔线程提供包含GPU和集群在内的完整算力基础设施,适配DeepSeek以降低客户部署大模型的门槛。

关键观点4: DeepSeek的出现可能对英伟达市场地位产生影响。

快思慢想研究院院长田丰认为,DeepSeek的出现降低了市场对英伟达芯片的需求预期。过去需要大量英伟达芯片才能实现的模型性能,现在可以通过国产GPU和DeepSeek以更低的成本实现。这也导致英伟达的股价遭受重创。

关键观点5:

许多智算中心都在研判DeepSeek,并可能会因此改变建设方案,增加国产设备的采购比例。DeepSeek提供的高性价比模型有助于国产GPU与国产云服务相结合,形成一整套纯国产方案。


正文

春节期间,云服务厂商、GPU厂商和智算中心的建设方纷纷部署DeepSeek并商讨相关方案。
作者:沈怡然 杨思颖
封图:视觉中国






截至2025年2月6日,DeepSeek(深度求索)的用户量突破2200万。 凭借颠覆性和高性价比,DeepSeek成为继ChatGPT之后的又一个现象级AI产品,并引发AI产业链的追逐。


春节期间,云服务厂商、GPU厂商和智算中心的建设方纷纷部署DeepSeek并商讨相关方案。


2月5日以来,国内主要云厂商联通云、京东云、阿里云、腾讯云、百度智能云和移动云等纷纷上线DeepSeek大模型,并将其纳入各自的模型商店。国际云厂商微软云和亚马逊云科技早在春节前就上线了DeepSeek。


春节前,移动云团队发现,客户对DeepSeek最新版本R1和V3的反应非常强烈,便迅速展开研究与适配工作,对DeepSeek的满血版、蒸馏版、量化版等多个版本进行适配。移动云在全国拥有13个智算中心,将DeepSeek部署到每一处智算中心并不是个小工程。


云厂商上线DeepSeek的目的是更好地消耗并兜售自己的算力。DeepSeek的庞大用户基础,有望为他们带来业务增量。此外,DeepSeek是开源模型,云厂商之间不存在利益冲突。


移动云从2024年初起就关注到DeepSeek,并从V1版本开始上架这款模型。然而,从技术角度看,DeepSeek V1的多模态能力有限,无法很好地处理图像、音频等非文本信息,且在深度推理场景中也未显现出强大功能,因此当时用户的反应并不强烈。


直到DeepSeek团队在2024年12月26日发布了V3版本,仅使用2048块英伟达H800 GPU,训练成本低至558万美元。DeepSeek团队在2025年1月20日发布了R1版本,同样采用了极低成本,实现了与OpenAI o1系列相当的推理能力。


云厂商的上游GPU公司也行动起来。GPU是大模型算力的核心器件,目前国内多家GPU公司正在或已完成对DeepSeek的适配。


国产GPU公司摩尔线程的工程师在春节期间加班加点,于2月4日完成了DeepSeek蒸馏模型的部署。在该公司看来,这种蒸馏模型就是将大规模模型的能力迁移至更小、更高效的版本,它借鉴了教育领域中的“知识传递”概念,将一个大型且复杂的模型(教师模型)的知识“传授”给一个小型且简单的模型(学生模型)。这种方法不仅减少了模型的计算和存储需求,而且使模型更加易于部署。


摩尔线程提供包含GPU和集群在内的完整算力基础设施,适配DeepSeek能帮助其客户在资源受限的情况下部署大模型。


快思慢想研究院院长田丰认为,DeepSeek的出现降低了市场对英伟达芯片的需求预期。过去需要大量英伟达芯片才能实现的模型性能,现在可以通过国产GPU和DeepSeek以更低的成本实现。


1月27日以来,英伟达股价遭遇最大跌幅17%,市值蒸发约5400亿美元。


不过,各厂商对DeepSeek的适配尚未得到DeepSeek官方的确认。适配的好坏差异较大,这意味着GPU厂商需要在适配方面下功夫,以提升自身产品的性能和竞争力。


DeepSeek对产业链的激活还可能影响国内的智算中心。一位算力中心运营方人士对经济观察网记者称,许多智算中心都在研判DeepSeek,还可能会因此改变建设方案,增加国产设备的采购比例。


据中国信息通信研究院数据,截至2024年7月底,国内纳入监测的智算中心(含已建和在建)达87个。


前述算力中心运营方人士称,DeepSeek提供的高性价比模型有助于国产GPU与国产云服务相结合,形成一整套纯国产方案。过去,尽管各地政府鼓励智算中心增加国产设备的采购,但由于国产GPU产能和性能不足,未能很好地满足本土市场需求,导致许多算力中心的采购仍以英伟达品牌为主。








请到「今天看啥」查看全文