专栏名称: 财联社
财联社系上海报业集团旗下界面(上海)网络科技有限公司产品,定位财经资讯报道,全面聚焦全球证券市场资讯,为投资者提供365天24小时不间断的“快速、准确、权威、专业”金融信息服务。
目录
相关文章推荐
汇易咨询  ·  2025年第10周菜粕周评:ICE ... ·  20 小时前  
玩物志  ·  苹果发布多款新品/麦当劳官宣「全新 ... ·  2 天前  
刀法研究所  ·  2024出游用户中女性占比近60%;蓝瓶咖啡 ... ·  3 天前  
51好读  ›  专栏  ›  财联社

DeepSeek重塑AI、云计算,“卖水人”迎来价值重构?

财联社  · 公众号  ·  · 2025-02-10 07:05

正文

DeepSeek的热度跨越春节,而A股投资者对DeepSeek概念股的追逐,逐渐从股权投资方、应用端,扩展到云计算这一“卖水人”环节。

春节后的A股三个交易日里,作为第三方云计算厂商的优刻得和青云科技连收三个一字板。同期北交所并行科技收获两个30CM涨停,首都在线收获两个20CM涨停。

港股上市的金山云先行一步,其股价自2024年10月低点至今涨幅达5倍,近10个交易日涨幅超70%。

云计算产业如何受益于DeepSeek?

如果说DeepSeek证明了算法优化下低成本复现尖端大模型的可能性,李飞飞团队则以不到50美元的云计算费用,以知识蒸馏和小样本微调的方法,用26分钟成功训练出有推理能力的s1模型, 进一步凸显了模型开源、算法创新、高质量数据、算力租用对中小企业高效率打造优质模型的意义

对于这两个“高性价比”模型的训练和普及,云服务尤为重要。s1模型的训练基于阿里云通义千问(Qwen)模型进行微调,仅用了1000个样本数据和16块H100GPU;DeepSeek的开源模型允许中小企业在云上进行微调,降低了构造模型的算力门槛。

无论技术如何进步,模型在训练和使用过程中都需要算力支撑,云计算商不仅为中小企业提供了训练和部署AI模型的基础设施,还通过弹性扩容(如MaS、API服务)满足了不断增长的推理需求

模型开源策略加速云计算普及

DeepSeek的核心创新在于算法效率显著提升和成本大幅下降,这为中小型企业切入AI提供了新思路:按需租用算力便可在云端训练自己的模型,无需像大厂那样投入巨额资金构建大规模的GPU集群。

云厂商在中间扮演“卖水人”角色——把DeepSeek等大模型的的API底座能力开放给更多C端用户,或作为底座模型去开发出更多垂直类应用。

DeepSeek在发布多款模型后,多个云平台宣布部署DeepSeek旗下模型。阿里云、百度智能云、华为云、腾讯云、京东云、火山引擎、天翼云均已接入了DeepSeek模型。海外的亚马逊AWS、微软Azure等云巨头同样官宣支持。此外,国家超算互联网平台已正式上线DeepSeek-R1模型的1.5B、7B、8B、14B版本,并将于近期陆续更新32B、70B等版本。

处于开源模型的生态中,中小企业依靠云服务完成AI化而非自建算力,第三方中立云企业凭借中立性和强大的云计算服务能力,为各类企业提供支持,满足AI训练和推理的需求,有望脱颖而出。

针对云平台与大模型如DeepSeek的合作部署,天使投资人、资深人工智能专家郭涛表示,云平台会提供必要的计算资源、存储资源和网络带宽,以支持大模型的运行和数据处理。在合作过程中,双方还会共同优化模型性能,提升用户体验。此外,云平台还负责大模型的运维管理,确保其稳定运行并及时更新迭代。通过这种模式,云平台能够提供高效、便捷的大模型服务,也促进了自身业务发展。

云端推理算力需求或大幅增加

DeepSeek API定价仅为GPT-4的1%(每百万token 0.014美元),吸引百万级用户调用。虽然DeepSeek实现了低成本高性能,但春节期间由于访问量剧增导致经常宕机,推理算力不足的问题已经显露。

未来,模型训练成本的进一步下降有望推动应用普及,而应用爆发将进一步倒逼推理算力需求。东吴证券便表示,







请到「今天看啥」查看全文