专栏名称: 财联社AI daily
财联社及科创板日报旗下产品 ,聚焦TMT领域,更独家、更深度。
目录
相关文章推荐
格隆  ·  大跌眼镜!谁扛住了? ·  13 小时前  
格隆  ·  大跌眼镜!谁扛住了? ·  13 小时前  
河南环境  ·  省生态环境厅公布2024年12月及1-12月 ... ·  14 小时前  
南方财富网  ·  DeepSeek最新8大核心龙头股梳理,看这 ... ·  19 小时前  
南方财富网  ·  DeepSeek最新8大核心龙头股梳理,看这 ... ·  19 小时前  
51好读  ›  专栏  ›  财联社AI daily

都来了,DeepSeek“朋友圈”再扩容

财联社AI daily  · 公众号  · 科技投资 科技自媒体  · 2025-02-05 19:45

主要观点总结

DeepSeek模型受到广泛关注,多个云巨头和芯片厂商支持。其开源路线和低成本化推动AI应用场景扩大。国产芯片厂商积极适配DeepSeek模型,面临挑战和机遇。DeepSeek对未来AI产业链的影响包括降低训练成本、扩大应用场景、推动AI应用爆发等。

关键观点总结

关键观点1: DeepSeek模型热度飙升,引起多方关注

DeepSeek模型因其在AI领域的出色表现,受到了广泛的关注。国内主流云平台均陆续上线相关模型,推动开源生态发展。

关键观点2: DeepSeek模型获得主流云平台和芯片厂商支持

包括京东云、华为云、阿里云等在内的六大云巨头已正式支持DeepSeek模型。此外,多家国产芯片厂商也已实现对DeepSeek模型的兼容支持。

关键观点3: DeepSeek模型的开源路线和低成本化推动AI应用场景扩大

DeepSeek模型选择开源的开放路线,其低成本化有助于扩大AI的应用场景。国内AI产业链有望受益于此。

关键观点4: 国产芯片厂商积极适配DeepSeek模型,面临挑战和机遇并存

为了支持DeepSeek模型的应用,多家国产芯片厂商已进行适配工作,并提供了相关服务。然而,由于DeepSeek模型对硬件的高要求,这也给国产芯片厂商带来了新的挑战和机遇。

关键观点5: DeepSeek模型对未来AI产业链的影响

DeepSeek模型的出现有望降低AI训练成本,扩大应用场景,并推动AI应用的爆发。此外,其对数据中心建置量的影响也不可小觑。


正文

随着DeepSeek热度飙升,其“朋友圈”也在快速扩容。

今日,京东云宣布正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式。前几日,阿里云、百度智能云、华为云、腾讯云、火山引擎、天翼云已接入了DeepSeek模型。海外的亚马逊AWS、微软Azure等云巨头同样官宣支持。
多家国产芯片厂商亦纷纷响应。华为今天宣布DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro上线昇腾社区;DeepSeek-V3满血版在国产沐曦GPU首发体验上线。天数智芯、摩尔线程、海光信息也在2月4日宣布支持DeepSeek模型。而英伟达、AMD、英特尔等海外芯片巨头在更早已完成支持。
此外,无问芯穹、硅基流动等AI基础设施厂商,以及青云科技、PPIO派欧云、云轴科技等独立云厂商,已宣布适配及上架模型服务。
从底层芯片到云服务商,随着DeepSeek朋友圈的扩大,有望进一步推动大模型的低成本化,扩大AI的垂直应用场景。
目前,华为小艺助手App的智能体广场已上线DeepSeek-R1的Beta版。科创板上市公司光云科技、当虹软件等也接入DeepSeek系列模型开展应用探索。
六大云巨头上线DeepSeek系列模型 推动开源生态发展
DeepSeek旗下大模型“爆火”后,国内主流云平台均陆续上线了相关模型。
今日,京东云言犀AI开发计算平台宣布支持DeepSeek-V3、DeepSeek-R1以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署。
春节期间,华为云和硅基流动联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。阿里、腾讯、百度、火山引擎等云厂商也上线了DeepSeek系列模型。其中,百度智能云还提出了限时免费的服务方案。至此,国内六大云巨头都已正式支持DeepSeek。
中国云平台集中上线DeepSeek,其背后是云厂商们希望在DeepSeek的火爆浪潮中,吸引更多客户使用其算力和服务。
AI产品榜的数据显示,DeepSeek仅上线18天时日活就突破1500万,而ChatGPT过1500万花了244天,增速是ChatGPT的13倍。上线20天后,DeepSeek日活已达2215万,实ChatGTP日活用户的41.6%,超过豆包的日活用户1695万。
云基础设施厂商有望受益于DeepSeek带来的新叙事,而DeepSeek的成功,也将提振整个开源社区的共建氛围,使得更多开源模型能够“站在巨人肩膀上”快速进步。
相比OpenAI的闭源路线,DeepSeek选择了开源的开放路线,这类似于PC时代的Windows和Linux之争。面对DeepSeek的爆火,OpenAI首席执行官萨姆·阿尔特曼此前承认称,OpenAI在开源策略上“站在了历史的错误一边”,并表示需要考虑制定不同的开源策略。
华泰证券认为,开源模型的优势体现在社区共建和技术共享。理论上所有的小参数模型均能够直接利用DeepSeek-R1蒸馏出的标签数据,来增强推理性能。2025年或是开源模型快速进步的一年,国产大模型进展值得关注。
主流国产芯片兼容支持 挑战和机遇并存
在芯片领域,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,同时提供精度性能微调,推理服务化快速部署等能力,
摩尔线程也发文称,已实现对DeepSeek蒸馏模型推理服务的部署。为推进国产AI生态发展,摩尔线程即将开放自主设计的夸娥(KUAE)GPU智算集群,全面支持DeepSeek-V3、R1模型及新一代蒸馏模型的分布式部署。
天数智芯与Gitee AI成功完成了与DeepSeek-R1的适配工作,并且已正式上线多款大模型服务,其中包括DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B等。天数智芯还称,正在与并行科技、算力互联等多家伙伴,开展DeepSeek包括R1在内的多款模型的适配与上线,后续即将上线的并行科技平台,不仅面向普通用户和开发者,更是主要面向企业用户的AI服务平台。
Gitee AI联合沐曦于2月2日首发全套DeepSeek-R1千问蒸馏模型,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。2月5日,Gitee AI进一步表示,DeepSeek-V3满血版在国产沐曦GPU首发体验上线。
而海光信息也完成了DeepSeek V3和R1模型与海光DCU(深度计算单元)的适配,并正式上线。
此外,国家超算互联网平台已正式上线DeepSeek-R1模型的1.5B、7B、8B、14B版本,并将于近期陆续更新32B、70B等版本。除R1模型外,国家超算互联网平台还上线了DeepSeek-V3、DeepSeek-v2.5系列、DeepSeek-coder系列、DeepSeek-math系列(7b)和DeepSeek-v2系列(Lite)等模型。
DeepSeek大模型与国产芯片的适配基本不花时间,而性能优化估计一周完成。”有算力领域人士介绍。
“当下,主流国产芯片已基本实现对DeepSeek 蒸馏版小模型的兼容支持。这意味着,只要此前能够运行Llama、Qwen这类常见模型,如今便可直接无修改地运行DeepSeek蒸馏版小模型。”魔形智能联合创始人徐凌杰对记者表示,“可以预见,随着基于 DeepSeek的应用如雨后春笋般爆发,越来越多芯片厂商的入局,新一轮市场竞争与价格调整或许即将拉开帷幕
不过,徐凌杰也指出,满血版的V3和R1拥有6710亿参数,这使得它们对硬件的要求大幅提升。同时,由于采用了此前未被广泛应用的MoE专家并行(EP)策略,其运行需要额外的推理框架支持。
目前,仅有少数几家国产芯片成功上线了满血版。要想完全解锁DeepSeek高性能、低成本的推理优势,按照官方推荐配置,需在推理的解码部分部署320个GPU,以实现完全的专家并行。这种‘超节点’式的部署方式,对所有国产芯片厂商而言,既是全新的挑战,也是难得的机遇。”徐凌杰提到。
扩大AI的应用场景
谈及未来DeepSeek对国内AI产业链的利好影响,沐曦联合创始人杨建表示,最大的影响是强化学习的蒸馏流程开源,让大模型在垂直领域的后训练和推理成本急剧下降,同时在垂直领域的可用性急剧上升,同时催生大模型在各行各业的认知,拉升私有化垂直模型部署的愿望。R1蒸馏32B模型的能力逼近OpenAI的O1,使得企业可以私有化低成本部署而不用担心泄密问题,部署意愿极大提高。
TrendForce集邦咨询研究指出,DeepSeek模型虽然降低了AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。





请到「今天看啥」查看全文