专栏名称: 加一研究院
加一研究院是一所面向世界没有围墙的实战型大学,打通商学院到企业的最后一公里,培养“10万+”胸怀世界,启迪未来的世界级企业家,向世界贡献“中国模式”,用“增长法则”帮助企业家裂变式成长!
目录
相关文章推荐
Java编程精选  ·  前阿里员工:内推了个38岁的研发,简历到HR ... ·  2 天前  
浙江新闻  ·  全球特警“世界杯”,“China ... ·  2 天前  
解放军报  ·  起床号 ·  3 天前  
51好读  ›  专栏  ›  加一研究院

10大国产AI芯片力挺DeepSeek!寒武纪缺席

加一研究院  · 公众号  ·  · 2025-02-07 16:04

正文

国产AI大模型DeepSeek的产业辐射力正持续扩大。在令人瞩目的短短六天时间内,有十家国内顶尖的AI芯片企业——包括华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技以及昆仑芯,纷纷宣布已成功适配或正式上架DeepSeek模型服务。

截至2月6日,正式宣布支持DeepSeek模型的国产AI芯片企业名单(按时间顺序排列,图源:智东西制表)

在这份名单中,海光信息作为科创板上的CPU+GPU领先企业赫然在列,其强大的技术实力和市场地位不言而喻。同时,科创板AI领域的佼佼者云天励飞也宣布了对DeepSeek的支持,进一步彰显了DeepSeek的广泛影响力。此外,昆仑芯科技作为百度旗下的AI芯片公司,其加入无疑为DeepSeek注入了更多的技术活力和市场潜力。值得注意的是,燧原科技、壁仞科技、摩尔线程、沐曦这四家备受瞩目的AI芯片独角兽企业,尽管均处于IPO进程中,但也纷纷宣布了对DeepSeek的支持,这无疑为DeepSeek的未来发展增添了更多的期待和想象空间。

除了AI芯片企业,云计算与智算企业也展现出了对DeepSeek的浓厚兴趣。华为云、天翼云、腾讯云、阿里云、百度智能云、火山引擎、京东云、联通云、移动云等九大国内云计算巨头纷纷宣布了对DeepSeek的支持,这标志着DeepSeek在云计算领域的广泛应用前景。此外,无问芯穹、硅基流动、云轴科技ZStack、PPIO派欧云、超算互联网、青云科技、算力互联、并济科技、优刻得、神州数码等至少十家独立云及智算企业也加入了支持DeepSeek的行列,这进一步拓展了DeepSeek的应用场景和市场空间。

截至2月6日,正式宣布支持DeepSeek模型的国内云服务及智算企业名单(按时间顺序排列,图表来源:智东西精心制表)

中国智算产业的半壁江山,已然深情拥抱DeepSeek,共同书写着科技融合的新篇章!

值得注意的是,截至本文发稿之际,“科创板AI芯片第一股”寒武纪尚未发布任何与支持DeepSeek相关的官方消息。回顾过去一年,寒武纪的股价如猛虎下山般迅猛上涨,一举夺得年度股王的桂冠,其市值更是气势如虹地突破了3000亿元大关。然而,在近五个交易日里,寒武纪的股价却遭遇了连续下滑的挑战。相比之下,春节过后的股市中,科大讯飞、并行科技、中科曙光、浪潮信息等企业的股票则呈现出喜人的上涨态势,为市场注入了新的活力。

寒武纪、科大讯飞、并行科技近5个交易日股价变化

港股上市企业金山云同样受到了DeepSeek热潮的积极提振,其在春节后首个交易日便迎来了股价的大幅飙升,涨幅高达31%。而紧接着的今日,股价再度上涨6%,展现出强劲的市场表现。以收盘价来计算,金山云董事长雷军所持有的4.66亿股股份,其市值已经超过了40亿港元(折合人民币约为37亿元),这无疑彰显了DeepSeek对整个行业以及相关企业的深远影响。

中科曙光、浪潮信息、金山云近5个交易日股价变化

十大国产AI芯片力挺DeepSeek

2月1日,华为昇腾率先行动,打响了国产AI芯片支持DeepSeek系列模型的第一炮。随后,九家独立的AI芯片企业纷纷跟进,宣布了对DeepSeek模型快速部署乃至训练的支持,形成了一股不可忽视的力量。

1、华为昇腾

2月1日,华为云携手硅基流动,联合首发并上线了基于昇腾云服务的DeepSeek R1/V3推理服务。该服务凭借其自研的推理加速引擎,使得DeepSeek模型在部署时能够媲美全球高端GPU的部署效果。

仅仅两日后,2月4日,DeepSeek R1、V3、V2、Janus-Pro模型便在昇腾社区正式上线。用户只需一键操作,即可轻松获取DeepSeek系列模型,并在昇腾硬件平台上实现开箱即用,快速完成推理部署。值得一提的是,天翼云、联通云、移动云这三大运营商的云服务平台,均已采用昇腾算力底座来支持DeepSeek模型的运行。此外,神州数码也特别指出,其推出的神州鲲泰推理服务器产品,搭载了昇腾硬件,能够全面支持DeepSeek模型的快速部署。

2、沐曦

国产GPU领域的独角兽沐曦,其对DeepSeek的支持则由国内知名的一站式大模型托管平台Gitee AI代为官宣。2月2日,Gitee AI宣布上线了1.5B、7B、14B、32B四个不同尺寸的DeepSeek R1模型,且这些模型均部署在国产沐曦曦云GPU上。

2月5日,Gitee AI再次发文,宣布经过严格测试,已确认DeepSeek-V3全精度满血版(671B)可以成功运行在沐曦的训推一体GPU上,并将V3满血版模型上线到了平台上。同日,联想携手沐曦,共同发布了基于DeepSeek大模型的首个国产一体机解决方案。该方案以“联想服务器/工作站+沐曦训推一体国产GPU+自主算法”为核心架构,配合联想AI Force智能体开发平台,推出了智能体一体机与训推一体服务器两种产品形态。其中,面向敏捷部署的DeepSeek智能体一体机,采用ThinkStation PX工作站为载体,搭载沐曦曦思N260国产GPU,可支持本地部署DeepSeek各种参数蒸馏模型的推理工作。而面向更广泛场景的DeepSeek训推一体机,则基于联想问天WA5480 G3 AI服务器,搭载8张曦云C500国产GPU,为大模型的训练和推理提供了强大的算力支撑。

3、天数智芯

2月4日,天数智芯与Gitee AI强强联手,仅用时一天便成功完成了与DeepSeek R1的适配工作,并正式上线了多款大模型服务,包括1.5B、7B、14B等不同尺寸。此外,天数智芯还在与并行科技、算力互联等多家合作伙伴紧密协作,全力推进DeepSeek多款模型的适配与上线工作。

此前,当DeepSeek V3 671B一经发布,天数智芯便迅速响应,完成了与该模型的适配。经过严格的测试与验证,适配后的模型精度高度对标论文精度,展现出了出色的稳定性与可靠性,已经准备好快速投入各类应用场景中。

4、摩尔线程动态

2月4日,摩尔线程欣然宣布,其DeepSeek R1蒸馏模型推理服务已迅速实现在摩尔线程夸娥(KUAE)GPU智算集群上的高效部署。公司即将对外开放这一先进的夸娥GPU智算集群,以全面赋能DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署需求。

此外,用户还能够依托摩尔线程的MTT S80和MTT S4000显卡,轻松完成DeepSeek-R1蒸馏模型的推理部署工作。值得一提的是,早在1月28日,已有B站UP主成功在MTT S80显卡上实践并推理了DeepSeek R1模型,展现了摩尔线程技术的领先性和实用性。

基于Ollama开源框架,摩尔线程成功部署了DeepSeek-R1-Distill-Qwen-7B蒸馏模型,并在多个中文任务场景中展现出了卓越的性能表现。这不仅验证了摩尔线程全功能GPU的广泛适用性和CUDA兼容性,也进一步彰显了其在AI加速领域的深厚实力。

5、海光信息动态

2月4日至5日期间,海光信息传来喜讯,其技术团队近日圆满完成了DeepSeek V3模型、R1模型以及Janus-Pro多模态大模型与海光DCU(深度计算单元)的适配优化工作,并正式上线供用户使用。

DCU作为海光信息倾力打造的高性能GPGPU架构AI加速卡,能够无缝支持DeepSeek模型的直接运行,大大减少了适配工作的繁琐。技术团队的主要精力集中在精度验证和性能优化方面,以确保用户能够享受到最佳的使用体验。

用户现可通过“光合开发者社区”中的“光源”板块便捷地访问并下载这些经过精心优化的模型。同时,登录官方网站[http://www.sourcefind.cn],搜索“DeepSeek”,即可基于DCU平台快速部署和使用相关模型,轻松开启AI加速之旅。

6、壁仞科技新进展

2月5日,壁仞科技正式宣布,其强大的AI算力平台现已正式上线DeepSeek R1蒸馏模型推理服务。这一服务为开发者提供了云端体验1.5B、7B、8B、14B、32B直至70B全系列模型服务的便捷途径,助力开发者在AI领域取得更显著的突破。

该服务以其两大核心优势脱颖而出:一是实现了真正的“零部署成本”,让开发者能够享受到“开箱即用”的云端推理体验,极大地降低了使用门槛;二是具备广泛的多场景覆盖能力,针对大语言模型等不同任务,预设了多种优化配置方案,确保在各种应用场景下都能发挥出最佳性能。

壁仞科技已与上海智能算力科技有限公司、中兴通讯、科华数据、无问芯穹、开源中国(Gitee AI)、UCloud优刻得、一蓦科技等众多战略伙伴携手合作,基于壁砺系列训推产品106M、106B、106E、110E,全面展开了DeepSeek全系列模型的适配与上线工作,共同推动AI技术的快速发展。

同日,UCloud优刻得也发布了重要消息,宣布其平台已与壁砺系列实现了完美的适配兼容,并在短短数小时内就成功完成了对DeepSeek R1全系列蒸馏模型的支持,进一步展示了壁仞科技与合作伙伴们的高效协同能力。

7、太初元碁新突破

2月5日,太初元碁传来振奋人心的消息,公司在太初T100加速卡上仅耗时2小时,便成功完成了DeepSeek R1系列模型的适配工作,并迅速上线了多款大模型服务。这一成果不仅彰显了太初元碁在AI加速领域的卓越实力,也为用户提供了更加便捷、高效的AI解决方案。

用户现在可以在太初元碁官网的模型中心轻松获取DeepSeek-R1系列模型。该模型中心不仅为用户提供免费的太初T100加速卡试用机会,还提供了包括模型权重下载、在线/离线推理脚本、模型评测脚本等在内的全流程内容,助力用户轻松实现AI模型的部署与应用。

更为贴心的是,当前DeepSeek-R1系列推理API正限时无限量免费开放,为用户提供了更加灵活、低成本的AI服务选择。

此外,太初元碁正在积极携手京算、是石科技、神威数智、龙芯中科等合作伙伴,共同打造DeepSeek系列模型的云端推理平台。通过这一平台,用户将能够享受到更加高效、稳定的AI推理服务,进一步推动AI技术的普及与应用。

8、云天励飞新进展

2月5日,云天励飞传来喜讯,其芯片团队已成功完成DeepEdge10芯片平台与DeepSeek R1系列(包括1.5B、7B、8B版本)大模型的适配工作,并正式向客户交付使用。这一里程碑式的成就标志着云天励飞在AI芯片与模型适配领域取得了重要突破。

与此同时,DeepSeek R1系列中的更大规模版本(32B、70B)以及V3/R1 671B MoE大模型的适配工作也在紧锣密鼓地进行中。云天励飞致力于确保DeepEdge10芯片平台能够在端、边、云各个场景下全面支持DeepSeek全系列模型,为用户提供更加高效、灵活的AI解决方案。

此次适配工作的顺利完成,不仅展现了云天励飞在技术创新和产品研发方面的强大实力,也为公司在AI领域的未来发展奠定了坚实基础。

9、燧原科技重大进展

2月6日,燧原科技宣布了一项令人瞩目的成就:公司已成功完成了对DeepSeek全量模型的高效适配工作,涵盖了DeepSeek R1/V3 671B原生模型及其蒸馏模型,展现了燧原科技在AI模型适配领域的卓越能力和领先地位。

目前,DeepSeek的全量模型已在庆阳、无锡、成都等地的智算中心实现了数万张卡的快速部署,这一成果不仅彰显了燧原科技在AI技术落地方面的强大执行力,也标志着公司在国内率先实现了DeepSeek全量模型的规模化部署和应用,为AI产业的快速发展注入了强劲动力。

燧原科技与并济科技、并行科技、东华软件、道客网络、光环云、迈富时、清程极智、燧弘华创、未来速度、无问芯穹、向量栈、亿算智能、中科加禾等一系列合作伙伴建立了紧密的合作关系,携手并进,积极推动DeepSeek全量模型的系统级优化工作,旨在进一步提升推理性能与性价比,为用户带来更加卓越的使用体验。

此外,燧原科技还与万物安全、飞渡科技、万物之宜等伙伴展开了深度合作,即将隆重推出国内首款面向智慧城市、智慧园区、智慧交通等AIoT场景的DeepSeek智算训推一体机。这款一体机将为用户解决国产化私有算力部署、超清数字孪生构建以及物联网安全防护等一系列问题,助力用户实现更高效、更安全的AI应用与部署。

10、昆仑芯重大进展

2月6日,昆仑芯宣布了一项令人瞩目的技术突破:公司已圆满完成了Deepseek R1、V3系列模型训练与推理全版本的适配工作,这涵盖了MoE模型及其高效的蒸馏小模型。此次适配不仅展现了卓越的性能表现,还实现了极致的成本效率,更提供了便捷的一键部署功能,为用户带来了前所未有的使用体验。

据详细介绍,昆仑芯的P800在显存规格上相较于同类主流GPU有着显著的优势,性能提升幅度高达20%-50%,尤其对于MoE架构展现出了更加友好的支持。值得一提的是,P800率先实现了8bit推理的支持,使得单机配置8张卡即可轻松运行671B这一庞大规模的模型,从而能够游刃有余地完成DeepSeek-V3/R1全版本的推理任务。此外,P800还能够有力支撑Deepseek系列MoE模型的大规模训练任务,仅需32台设备即可满足模型全参训练的需求,高效地完成了模型的持续训练和微调工作。

昆仑芯,其前身为百度智能芯片及架构部,于2021年4月成功完成了独立融资,标志着其独立发展迈出了坚实的一步。而在2月5日,百度智能云也传来了振奋人心的消息,其成功点亮了昆仑芯三代P800的万卡集群,而三万卡集群的点亮工作也将在不久的将来顺利完成。这一系列的进展无疑为昆仑芯的未来发展注入了强劲的动力,也让我们对其在AI芯片领域的持续创新充满了期待。

中国九大云端领航者全面拥抱DeepSeek

在AI技术浪潮的推动下,中国云端服务领域迎来了新的里程碑。2月1日,华为云率先宣布正式上线DeepSeek R1/V3推理服务,此举不仅标志着华为云在AI服务领域的又一次重要布局,也让其成为国内首批支持DeepSeek-R1模型的云端服务商中的佼佼者。

同日,中国电信旗下的天翼云也不甘落后,紧随其步伐宣布对DeepSeek的全面支持,并自豪地宣称自己是国内首家成功完成DeepSeek大模型国产化适配的运营商,展现了其在推动AI技术国产化进程中的坚定决心和强大实力。

随后,腾讯云、阿里云、百度智能云、火山引擎、京东云、联通云以及移动云等云端巨头也相继宣布上线DeepSeek模型服务,这一连串的动作无疑为DeepSeek在国内的普及和应用奠定了坚实的基础。

然而,值得注意的是,截至本文发稿时,浪潮云和金山云尚未正式宣布对DeepSeek的支持。但相信在不久的将来,这两家云端服务商也会加入到这一行列中来,共同推动中国AI技术的不断发展和创新。

1、华为云

2月1日,华为云携手硅基流动,共同首发并上线了基于华为云昇腾云服务的DeepSeek R1/V3推理服务。凭借华为云自研的推理加速引擎,硅基流动与华为云昇腾云服务所部署的DeepSeek模型,展现出了与全球高端GPU部署模型相媲美的卓越性能。

2、天翼云

同样在2月1日,中国电信旗下的天翼云宣布,其天翼云智算产品体系(涵盖息壤-科研助手、天翼AI云电脑、魔乐社区、“息壤”智算平台以及GPU云主机/裸金属)已成功实现了R1模型的部署、推理、微调及应用。

而到了2月6日,天翼云再次发布消息,强调其自主研发的“息壤”智算平台已率先完成了国产算力与DeepSeek R1/V3系列大模型的深度适配优化。这一成就使天翼云成为国内首家成功落地DeepSeek模型全栈国产化推理服务的运营商级云平台。同时,“息壤”智算平台还推出了DeepSeek R1/V3系列模型的限时免费推理API服务,方便用户快速调用。该平台还支持从DeepSeek-R1满血版到轻量化蒸馏模型的灵活部署,满足多样化的应用需求。

3、腾讯云

2月2日,腾讯云宣布其高性能应用服务HAI已支持DeepSeek-R1大模型的一键部署功能,开发者仅需3分钟即可轻松接入并调用该模型。

紧接着,2月4日,腾讯云TI平台又推出了“开发者大礼包”,其中包含了DeepSeek全系模型的一键部署服务。从千亿级“满血版”(671B参数)到轻量级(1.5B)的模型均可供开发者选择,同时还提供了R1和R1-1.5B模型的限时免费在线体验机会。

4、阿里云

2月3日,阿里云宣布其PAI Model Gallery平台已支持云上一键部署DeepSeek V3、R1模型。在该平台上,用户可以享受到零代码实现从训练到部署再到推理的全过程服务,从而大大简化了模型开发的流程。

5、百度智能云

同样在2月3日,百度智能云也宣布了一个好消息:其千帆平台已正式上架DeepSeek R1、V3模型,并推出了超低价格方案以及限时免费服务。用户只需登录百度智能云千帆ModelBuilder平台,即可快速体验DeepSeek模型的强大功能。

6、火山引擎

2月4日,火山引擎正式对外宣布,将全面支持V3、R1等多种规格的DeepSeek开源模型。用户可以通过两种便捷的方式充分利用这些模型:一方面,他们可以在火山引擎的机器学习平台veMLP上部署DeepSeek模型,该平台现已全面覆盖并支持所有尺寸的DeepSeek模型,为用户提供灵活高效的部署选项;另一方面,用户还可以在火山方舟中轻松调用DeepSeek模型,目前火山方舟已支持4个不同版本的模型,不仅提供了极具竞争力的API价格,还确保了全网最高的限流能力,确保用户能够稳定、高效地利用这些先进的AI模型。

7、京东云

2月4日,京东云宣布其言犀AI开发计算平台现已支持DeepSeek V3、R1以及全系列蒸馏小参数模型的一键部署功能。该平台提供了公有云在线部署和专混私有化实例部署两种灵活模式,用户可根据实际需求选择适合的部署方式,实现快速调用和高效应用。

8、联通云

2月5日,联通云率先与DeepSeek实现了多场景的深度对接。基于星罗平台,联通云已成功适配了国产及主流算力下的多规格DeepSeek R1模型,兼顾私有化和公有化场景,实现了开箱即用的便捷体验。目前,这些模型已接入联通云桌面、编程助手等多个产品场景,为用户提供更加智能化的服务。

此外,联通云的骨干云池已在全国超过270个城市进行部署,其7.5版本也已上架DeepSeek R1镜像,形成了预部署能力。同时,联通云还能将超百款行业应用与DeepSeek模型进行融合,为医疗、政务等行业提供定制化的AI解决方案。

基于联合创新和自研加速引擎,联通云构建了昇腾全栈自主可控的智算底座,与DeepSeek R1模型实现了深度对接。这不仅简化了调用流程,还具备了复杂任务下的推理能力,其效能与国际主流算力部署持平。

为了满足用户多样化的需求,联通云还基于A800、H800、L40S等多款主流算力卡,预置了DeepSeek R1多尺寸模型。用户可以根据实际需求灵活选择、快速扩展,并快速搭建DeepSeek-R1推理和微调环境。

9、移动云

2月5日,移动云宣布已全面上线DeepSeek,实现了全版本覆盖、全尺寸适配以及全功能的畅享体验。移动云支持DeepSeek V1、V2、V3、R1等全量版本,包括满血版(671B)以及7B、14B等高效蒸馏小模型,为用户提供丰富的选择空间。

为了进一步提升用户体验,移动云将DeepSeek集成至其智能体平台,并在中国移动覆盖全国的13个智算中心全面上线了这些能力。目前,移动云的智算平台、代码大模型、弹性计算和AI原生存储等产品已深度集成并融合了DeepSeek模型,同时搭载了自研的COCA算力原生平台,实现了开箱即用的便捷性。

此外,移动AI云电脑也将迎来全面升级,用户可以选择DeepSeek内核来实现AI秘书功能。为了满足不同用户的需求,移动云还针对DeepSeek R1模型定制了算力方案,为互联网企业和高校科研提供高性价比的算力与开发环境。

在国产昇腾生态方面,移动云全链路深度扎根其中,并支持DeepSeek全系列产品。同时,移动云已集成了昇腾、壁仞、天数、昆仑芯、寒武纪等多元国产智算芯片,并依托4+N+31+X全网资源池,在热点区域布局了千至万卡级的算力资源,而在31个省份则按需布局了百至千卡级的资源,为用户提供更加全面和高效的算力支持。

AI Infra、智算领域及独立云服务商

纷纷宣布引入DeepSeek模型

自1月28日起,无问芯穹、硅基流动以及PPIO派欧云等一众企业相继宣布正式引入DeepSeek模型,此举标志着国内云计算及智算行业对DeepSeek模型的适配与引入工作正式拉开序幕。且随着时间的推移,这一名单上的企业名称正以惊人的速度不断增加。

1、无问芯穹

1月28日,国内领先的AI基础设施企业无问芯穹欣然宣布,已将DeepSeek-R1蒸馏模型成功上架至其Infini-AI异构云平台。同时,DeepSeek-R1(加速优化版)与DeepSeek-V3(加速优化版)正处于紧锣密鼓的上线筹备中,而备受期待的DeepSeek-R1(国产推理版)也即将面世。为庆祝此次合作,无问芯穹特别为DeepSeek系列模型的用户提供了专属优惠,每位用户均可享受百万token的免费使用额度。

2、PPIO派欧云

同样在1月28日,分布式云服务的佼佼者PPIO派欧云也传来喜讯,其一站式AIGC云服务平台——PPIO派欧算力云,已全面融入DeepSeek R1模型。开发者只需轻松编写一行代码,即可便捷地调用API,享受智能生成内容的乐趣。

而到了2月2日,PPIO派欧算力云再次传来佳音,宣布已全量上线DeepSeek全系列模型。用户只需一键操作,即可支持DeepSeek V3满血版、R1满血版以及R1 70B蒸馏模型。更令人振奋的是,PPIO派欧算力云所提供的模型价格与官方价保持一致,且即将推出更多R1蒸馏模型,以满足用户日益增长的多样化需求。

PPIO派欧算力云为开发者慷慨献礼,特别准备了每人价值高达1亿DeepSeek V3 tokens的代金券,旨在助力开发者在智能生成内容领域更高效地探索与创新。

2月5日,PPIO派欧云再度传来捷报,自DeepSeek模型成功上架其平台以来,已吸引了超过千家开发团队的热烈响应与接入,充分彰显了PPIO派欧云在推动AI技术发展与应用方面的强大吸引力和广泛影响力。

3、硅基流动

1月28日,国内知名的AI基础设施企业硅基流动宣布,其大模型云服务平台SiliconCloud迅速响应市场需求,第一时间上线了DeepSeek Janus-Pro-7B模型,并在限时内提供免费使用服务,让开发者能够轻松调用API,体验智能生成的魅力。此外,SiliconCloud平台还提供了丰富的模型选择,开发者可以自由对比并体验数十款大模型,以满足不同的应用需求。







请到「今天看啥」查看全文