继V3之后，沐曦GPU再完成DeepSeek-R1全尺寸适配，已上线Gitee AI

OSC开源社区 · 公众号 · 程序员 · 2025-02-07 15:11

正文

继 DeepSeek 全套蒸馏模型以及 V3 版本上线后，经过 Gitee AI 和沐曦团队两天紧锣密鼓的适配和机器筹备， DeepSeek-R1 全尺寸版本现在已上线 Gitee AI 供开发者们使用 。

截至目前， DeepSeek-R1 、 DeepSeek-V3 以及 DeepSeek-R1-Distill(1.5B/7B/14B/32B) 千问蒸馏模型均实现了在国产沐曦训推一体 GPU 上成功运行，且均已上线 Gitee AI 开放使用体验， 国内 AI 全链路自主技术闭环踏出了巨大且关键的一步 。在此特别感谢沐曦团队的技术支持以及来自上海加佳的算力支撑。

三大「杀手锏」成就国产模型新高度

DeepSeek-R1 的性能相信大家已经充分领教了，其「杀手锏」之一就是 开放了思维链输出过程 ，用户可以看到模型进行推理时的每一步逻辑，告别了传统大模型的「黑盒」问题。

DeepSeek-R1 另一个「杀手锏」则是在后训练阶段大规模使用了强化学习技术， 在仅有极少标注数据的情况下，极大提升了模型推理能力 。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI-o1 正式版。

DeepSeek-R1 的第三个「杀手锏」无疑是开放的许可证和用户协议，模型开源 License 统一使用 MIT， 完全开源，不限制商用，无需申请 。

同时，产品协议明确可「模型蒸馏」，明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

这三大「杀手锏」使得 DeepSeek-R1 不但拥有极高的透明度和易用性，也为开发者提供了更灵活的训练和应用方式，极大地加速了模型的落地与普及， 迅速让国产模型在世界 AI 竞争格局中登上了新的制高点 。

沐曦 GPU+曦源一号万卡集群=国产算力新标杆

当然，想要实现技术自主与独立，仅有模型的领先还不够，关键在于 AI 模型对国产 GPU 的深度适配与高效运行。

唯有 DeepSeek-R1 能够在国产 GPU 上稳定运行，中国 AI 技术体系才能真正实现自主可控的完整闭环 。

本次 DeepSeek-R1 部署采用了 沐曦训推一体 GPU ，使用完全自主研发的 GPU IP，拥有完整的知识产权，并具备强大的多精度混合计算能力及高带宽显存支持。同时，沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈，可广泛应用于智能、通用计算和数据处理等场景。

此外，由 上海加佳智云数字科技有限公司 运营的 曦源一号国产替代万卡集群 正以其卓越的性能为本次部署以及各类 AI 平台、AI 模型及 AI 应用提供强大的算力支持。

曦源一号国产替代算力集群是基于沐曦高性能 GPU 加速卡所构建的一个开放、标准、高效的计算架构，有效促进了计算资源、数据资源与智能服务的全面整合。这种创新不仅提升了整体性能，也在 AI 实时推理、大规模模型训练等众多领域展现出巨大的潜力，从而满足了目前急需高效、稳定计算能力的国内市场。

Gitee AI——模型 API 新选择

2024 年初上线以来，Gitee AI 平台以 Serverless API、模型引擎、AI 应用为核心功能与服务，致力于让开发者轻松构建和部署 AI 应用，为企业客户提供更加智能、高效的 AI 应用解决方案。

请到「今天看啥」查看全文

推荐文章

程序员的那些事 · 趣图：“微软穷疯了？上架的 DeepSeek 要 29 元？”

10 小时前

程序员的那些事 · 突发！o3-mini 思维链公开，却被曝光全是「作假」，奥特曼现身解释网友炸锅

昨天

OSC开源社区 · Gitee邀您参与SBOM行业调研：共建可信代码库，助力开源生态发展

2 天前

程序猿 · 清晰的、模块化的编码风格

2 天前

程序员的那些事 · 热搜第一！DeepSeek百万年薪招AI人才，实习生都能月入过万

3 天前

编织人生 · 厉害哦！V领自带袖的计算及织法，全程无需断线和缝合~

8 年前

果壳 · 蜜蜂数量骤减，咋办？有人试图造“机械蜜蜂”来传粉……

7 年前

南都娱乐周刊 · 《长安十二时辰》启动网友骚动：陈坤微博被翻出！难道厂花被马伯庸钦点了？

7 年前

腾讯科技 · 8×12小时吐血蹲点发现：共享充电宝的真正问题竟然是这个

7 年前

铁血网 · 有脾气！刚刚，汪小菲向蔡英文开炮：当汉奸，你一个人就够了！

7 年前