专栏名称: 电子发烧友网
关注电子发烧友网,即时收听电子行业动态,抢先知晓半导体行业发生的最新事件。
目录
相关文章推荐
宁夏市场监管  ·  自治区市场监管厅与中国电信宁夏公司签署战略合 ... ·  23 小时前  
福州新闻网  ·  华为,突传消息! ·  昨天  
福州新闻网  ·  华为,突传消息! ·  昨天  
网信江苏  ·  2024中国正能量网络传播AI精品案例公示, ... ·  2 天前  
网信江苏  ·  2024中国正能量网络传播AI精品案例公示, ... ·  2 天前  
股妖姬  ·  商业航天领域的10大龙头股 ·  2 天前  
股妖姬  ·  商业航天领域的10大龙头股 ·  2 天前  
51好读  ›  专栏  ›  电子发烧友网

DeepSeek一体机背后,国产算力芯片崛起

电子发烧友网  · 公众号  ·  · 2025-03-10 07:00

正文

电子发烧友网报道(文/黄晶晶)自DeepSeek推出以来,最火的硬件产品非DeepSeek一体机莫属。DeepSeek大模型的应用和部署设计需要计算设备的支持,根据不同的大模型参数版本,例如DeepSeek-R1目前已经发布了1.5B/7B/8B/14B/32B/70B/671B共7类,选择不同规格的硬件配置。
自2月份以来,已有多家芯片厂商宣布支持DeepSeek模型,包括华为昇腾、海光、沐曦、昆仑芯、壁仞科技、天数智芯、摩尔线程、燧原科技、云天励飞等等。许多产品已经在DeepSeek一体机中得以广泛应用。例如,联想联合沐曦发布基于DeepSeek大模型的首个国产一体机解决方案,发布一个月以来,累计发货量已突破千台,配备沐曦国产GPU卡近万张,覆盖医疗、教育、制造等十余个核心行业。

昇腾910

软通动力旗舰版超强A800I A2服务器,基于鲲鹏920处理器、昇腾910 AI处理器,8模组高效推理,支持PFLOPS FP16超高算力和高速NPU互联技术,支持DeepSeek全量版本适配。
优刻得 DeepSeek 满血版大模型一体机支持沐曦、壁仞、昇腾、天数智芯等国产 AI 芯片全适配,以软硬一体化的交付模式,提供从底层算力获取、模型微调和推理能力、AI 应用开发的全栈式解决方案。结合云计算平台,提供灵活的 DeepSeek 模型部署与管理服务,支持弹性扩展。
据外媒报道,华为计划在今年量产最新AI芯片昇腾910C,其制良品率已升至40%,相比于一年前的20%(昇腾910B的良品率)已翻了一倍。华为计划今年量产10万块昇腾910C芯片,及30万块昇腾910B芯片。2024年,华为共生产20万块910B芯片。
根据Tom's Hardware报道,昇腾910C芯片是华为最新推出的AI芯片,采用了chiplet封装,晶体管数量达530亿个。实际应用方面,据称910C的推理性能相当于Nvidia H100 GPU的60%。

海光DCU

海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU(深度计算单元)的国产化适配。DCU是海光信息推出的高性能GPGPU架构AI加速卡,致力于为行业客户提供自主可控的全精度通用AI加速计算解决方案。凭借卓越的算力性能和完备的软件生态,DCU已在科教、金融、医疗、政务、智算中心等多个领域实现规模化应用。
海光DCU技术团队表示,将持续推动大模型迭代适配与优化更新,携手更多优秀大模型企业为行业客户提供更高效、更经济、更安全的AI解决方案。同时,团队也将积极探索更多应用场景,推动AI技术在更多行业的落地与普及。

沐曦曦思N260、曦云C500

联想联合沐曦发布基于DeepSeek大模型的首个国产一体机解决方案。面向敏捷部署的DeepSeek智能体一体机,采用ThinkStation PX工作站为载体,搭载沐曦曦思N260国产GPU,可支持本地部署DeepSeek各种参数蒸馏模型推理。面向更广泛场景的DeepSeek训推一体机,基于联想问天WA5480 G3 AI服务器,搭载8张曦云C500国产GPU,可为大模型训练和推理提供强大的算力支撑。
据悉,发布一个月以来,累计发货量已突破千台,配备沐曦国产GPU卡近万张,覆盖医疗、教育、制造等十余个核心行业。搭配沐曦曦思N260国产GPU的一体机可支持在本地部署DeepSeek各种参数蒸馏模型,实测数据显示,在相同并发条件下,DeepSeek-R1-Distill-Qwen-14B模型推理性能达到国际主流GPU的110%-130%。
浪潮云联合沐曦股份、铨兴科技等生态伙伴,发布预置DeepSeek-R1和DeepSeek-V3模型的海若一体机,率先实现671B DeepSeek大模型国产GPU单机推理服务,为行业客户提供大模型智能应用落地的一体化解决方案。
另外,Gitee AI在2月2日宣布上线1.5B、7B、14B、32B四个尺寸的DeepSeek R1模型并均部署在国产沐曦曦云GPU上。2月5日,Gitee AI再度发文,宣布经测试已确认DeepSeek-V3全精度满血版(671B)可以成功运行在沐曦训推一体GPU上,并将V3满血版上线到平台上。

昆仑芯P800

DeepSeek的推理模型,通过蒸馏模型(如DeepSeek-R1-Distill-Qwen和DeepSeek-R1-Distill-Llama)、MoE(专家混合系统)、MLA(多头潜在注意力机制)等创新技术,显著降低了计算开销,同时维持了模型的高性能。这使得国产AI芯片厂商能够在推理任务中与英伟达GPU竞争,甚至在某些场景中表现更好。
以百度昆仑芯P800为例,其XPU-R架构将通用计算单元和专用AI加速单元进行了融合,算力水平达到了仅次于昇腾910的水平,支持训练、推理和虚拟化等多模式任务,能够灵活适配AI算法的快速迭代需求。昆仑芯P800特别适用于需要大吞吐量的AI应用,单卡即可支撑高并发、高计算量的实时计算需求。
凭借昆仑芯P800强大的算力,对于DeepSeek R1/V3满血版的本地化部署,只需要8张基于昆仑芯P800的加速卡,即一台8卡的服务器就能够完成,部署起来非常的便捷。

壁仞科技壁砺系列训推产品

壁仞科技自主研发的壁砺TM系列产品完成对DeepSeek-R1全系列蒸馏模型的支持,涵盖了从1.5B到70B各等级参数版本,包括LLaMA蒸馏模型和千问蒸馏模型,为开发者提供高性能、低成本的大模型部署与开发解决方案。
壁仞科技已联合上海智能算力科技有限公司、中兴通讯、科华数据、无问芯穹、开源中国(Gitee AI)、UCloud优刻得、一蓦科技等战略伙伴,基于壁砺系列训推产品106M、106B、106E、110E,全面开展DeepSeek全系列模型的适配与上线。

天数 BI-V150

天数智芯成功完成了对DeepSeek R1千问蒸馏模型的适配,为开发者提供了更多灵活选择算力的机会。借助天数智芯强大的算力,DeepSeek模型能够提供更为高效且稳定的推理服务,从而更好地适应不同规模和多样化需求的应用场景。
长城擎天 GF7280 V5 AI 训推一体机配置了双路 S5000C 处理器,CPU 核心数量高达 128 个,并配备了 16 个 DDR5 内存条,总内存容量达到 1024GB。可验证搭配 NV L20 和国产天数 BI-V150 和沐曦C500 三种不同 GPU 算力卡适配 DeepSeek R1 私有化部署情况,具有 “开箱即用、经济高效、持续更新与支持” 三大优势。

摩尔线程KUAE集群

摩尔线程实现了对 DeepSeek 蒸馏模型推理服务部署。DeepSeek-R1-Distill-Qwen系列模型在摩尔线程KUAE集群上成功部署与应用。KUAE(夸娥)智算中心,是摩尔线程首个全国产千卡千亿模型训练平台,是国内首个以国产全功能GPU(图形处理器)为底座的大规模算力集群。
DeepSeek 开源模型(如 V3、R1 系列)在多语言理解与复杂推理任务中展现了卓越性能。通过 DeepSeek 提供的蒸馏模型,能够将大规模模型的能力迁移至更小、更高效的版本,在国产 GPU 上实现高性能推理。

燧原科技第三代推理卡S60

太湖亿芯智算中心采用燧原科技生产的第三代推理卡S60,完成DeepSeek在太湖亿芯智算中心的部署上线。弘信电子战略合作伙伴燧原科技完成对DeepSeek全量模型的高效适配,包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸馏模型。整个适配进程中,燧原AI加速卡的计算能力得以充分利用,能够快速处理海量数据,同时其稳定性为模型的持续优化和大规模部署提供坚实的基础。

申威AI加速卡

申威DeepSeek大模型一体机将中国电科新一代服务器CPU申威威鑫H8000与DeepSeek深度兼容,实现从硬件到算法完全自主创新,规避数据外泄风险、满足合规要求,通过可视化管控平台与智能运维体系,适配智能办公、写作翻译等基础场景,以及内容创作、文献解读、数学推理、代码生成等专业场景,有效缩短运维周期、降低人力成本,加速智能化升级进程。申威DeepSeek大模型一体机采用轻量化拓扑设计,单机即可运行,并支持平滑扩展,在维持高性能前提下降低硬件成本,实现降本增效与资源集约化利用。
申威一体机搭载的申威威鑫H8000芯片及申威AI加速卡性能强大,以往需要专门建一个智算中心才能完成的计算任务,如今只要部署一两台内置DeepSeek的一体机就能实现。






请到「今天看啥」查看全文