专栏名称: 经济观察报
《经济观察报》官方微信。最具影响力的市场化财经媒体,下辖纸质版、经济观察网、研究院、电子版、音视频、微博、微信等全媒体矩阵,并主办中国最受尊敬企业、中国杰出营销奖、中国蓝筹地产、观察家年会、可持续发展在中国、中国最具创新企业等系列品牌活动。
目录
相关文章推荐
第一财经  ·  京东宣布:为外卖骑手缴纳五险一金! ·  昨天  
经济观察报  ·  A股收盘:创业板指涨0.51%,人形机器人、 ... ·  3 天前  
央视财经  ·  刚刚,又见证历史!全球TOP10! ·  3 天前  
腾讯财讯  ·  一周机会前瞻|刷屏!微信接入DeepSeek ... ·  3 天前  
51好读  ›  专栏  ›  经济观察报

DeepSeek带火英伟达GPU “库存的禁售型号都抢空了”

经济观察报  · 公众号  · 财经  · 2025-02-15 10:08

正文

DeepSeek的出现颠覆了市场将高性能GPU视为AI赛道核心的传统认知,导致作为高性能GPU垄断者的英伟达率先被市场看空。更多产业人士发现,近期,无论是高性能的H系列GPU,还是RTX 40系列的高端显卡,英伟达的GPU重新变得供不应求。
作者:沈怡然
封图:图虫创意






2月13日,一位英伟达代理商告诉经济观察网记者,春节后第一周,两家中国科技企业为支撑开源大模型DeepSeek的推理服务,紧急向他们公司采购了L20 GPU算力设备。“去年,客户下单总要反复考虑和比价,现在连库存的禁售型号都抢空了”。


DeepSeek的出现颠覆了市场将高性能GPU视为AI赛道核心的传统认知,导致作为高性能GPU垄断者的英伟达率先被市场看空。


然而,更多产业人士发现,近期,无论是高性能的H系列GPU,还是RTX 40系列的高端显卡,英伟达的GPU重新变得供不应求。




算力需求爆发


前述英伟达代理商目前正加紧为客户调配英伟达的产品。他发现,英伟达芯片在中国市场全线紧缺,一些已经禁售的H800系列存货一卡难求。


此时,接入DeepSeek的中外企业已达数百家,国内云服务、互联网、手机、芯片、金融、医疗、汽车等行业都在上线和部署DeepSeek。


迅速增长的用户量为上述企业带来“泼天富贵”:云服务借此兜售算力、芯片企业借此推广产品、车企以更低成本升级自己的软件、上市公司借此推升市值。


一家IT厂商对经济观察网记者称,其调用DeepSeek的平台在上线首日增加了上万个用户,服务器几乎崩溃,现有算力已经跟不上用户的需求。团队为缓解压力,不得不紧急调配更多英伟达GPU。许多上线DeepSeek的平台显示服务器繁忙,实际上是平台提供的算力跟不上飞速增长的用户需求。


向金融、科研、航空航天等企业提供超算云服务的并行科技(839493.BJ)董事长陈健称,模型的生命周期通常是先训练,然后部署为服务,最后进行推理。目前是企业在DeepSeek模型推理过程中爆发了大量算力需求。


据经济观察网记者统计,英伟达在中国合法销售的型号包括:H20、L20,T4;游戏显卡涵盖RTX 40系列(除RTX 4090外)和RTX 30系列及更早型号,还有新推出的RTX 5090限制版5090D。


目前市面上有十几款国产GPU品牌,但普遍在性能、稳定性和生态上与英伟达存在一定差距,英伟达卡仍是企业们的最优选择。


DeepSeek的R1模型发布后,英伟达股价遭遇过去一年来最大跌幅17%,但自2月3日开始出现反弹,目前回升了13%。


国内某模型厂商一位人士对经济观察网记者称,DeepSeek的出现让业界反思算力泡沫,AI训练是否可以不再依赖大规模的高端GPU集群,但是随着提供模型和使用模型的个人和企业都在爆发式增长,大量的模型推理再一次推升了对英伟达卡的需求。


陈健认为,DeepSeek带给产业界的震动是AIGC大模型训练、推理算力消耗大幅降低。相比模型推理,模型训练的需求并没有在短期内出现爆发式增长。




算力需求可持续吗?

DeepSeek展现出强大的推理能力与优秀的文采,但是提供DeepSeek服务的代价也很大。

上述国内模型厂商人士表示,目前DeepSeek满血版对硬件配置要求非常高,至少需要两台H800卡才能运行起来,而国内大多数基础模型只需要一台4090卡就能运行。

通常来说,模型能力与参数量和精度密切相关,参数量影响AI的知识量,精度影响AI的准确性和推理能力,这也是为什么很多平台上线的DeepSeek看起来“智商”不足,因为背后的算力不足以支持模型在参数量和精度上达到最佳状态。

不过,上述国内模型厂商人士认为,这种急迫的算力需求未必持续很久。在实际应用中,开发者通常会将超过600B参数量的模型进行蒸馏,压缩到更低参数规模,再用于商业化。而DeepSeek发展得太快以至于团队还没来得及完成蒸馏,可能后续几个月蒸馏好后,那些上线DeepSeek的企业可以节约一些推理算力。








请到「今天看啥」查看全文