专栏名称: 新华三
新华三集团官方账号
目录
相关文章推荐
格上财富  ·  国家顶级规划,怎样给大城市“划重点”? ·  2 天前  
格上财富  ·  广东成立新机构,信号强烈 ·  3 天前  
格上财富  ·  Deepseek时代:普通人站稳脚跟的2个关键策略 ·  2 天前  
格上财富  ·  人生建议:先上车,再调整姿势 ·  3 天前  
心禅道  ·  投资#801 ... ·  2 天前  
心禅道  ·  投资#801 ... ·  2 天前  
51好读  ›  专栏  ›  新华三

新华三DeepSeek大模型一体机性能配置全揭秘

新华三  · 公众号  ·  · 2025-02-19 18:28

正文

图片

近日,图灵中试基地联合新华三集团推出的灵犀Cube大模型一体机(DeepSeek版)正式发布,该产品包含纯享版和使能版两大系列,共计六大款型12款产品,覆盖14B至671B规模的DeepSeek大模型。作为业界首个基于“智算-算法-治理”模式深度耦合DeepSeek的大模型一体机,灵犀Cube不仅实现了不同体量大模型的快速部署与上线,更解决了大模型落地实践中面临的场景适配不足、运维成本高等难题,为AI应用落地按下“加速键”。

灵犀Cube纯享版

开箱即用,轻量极简


快速交付,轻松上手: 预装DeepSeek大模型,提供可视化对话界面,支持二次开发和API接口调用,开箱即用,无需复杂配置。
极致性价比: 软硬件深度定制,轻量级软件平台持续迭代,未来支持AI商店,提供更多免费模型、镜像和优质数据集等AI资产一键下载,降低使用门槛。
强劲性能:

纯享旗舰版671B模型单机推理时,在较好体验的上下文长度场景下,真实并发数>32@15 Tokens/s;

纯享经济版32B模型单机推理时,在较好体验的上下文长度场景下,真实并发数>16@10 Tokens/s。

如需支持32B推理时更高并发,或未来需要挂载知识库,纯享标准版会是您更优的选择,该款可选支持70B模型预装。

灵犀Cube使能版

AI赋能,不止于DeepSeek


功能强大,灵活易用: 提供全面易用的可视化平台,支持多模型推理、知识库挂载、AI应用编排、模型蒸馏、微调等,满足多样化需求。
生态丰富,开放兼容: 除预装DeepSeek官方模型外,还提供H3C AIGC系列产品灵犀使能平台LinSeer Hub、灵犀推理引擎LinSeer RT、灵犀AI助手LinSeer Copilot软件安装,支持用户知识库挂载、流程编排、智能体创建、内置多种智慧应用。
高效推理,场景定制: 基于异构算力,实现多元模型推理,提供高并发、低延时的推理服务。同时可结合用户实际落地场景提供AIGC应用定制开发、知识库构建等专家服务,深度结合用户业务场景,提供DeepSeek等开源模型及商业模型的灵活适配、敏捷接入,保持底层模型技术“新鲜”。
全流程支持,持续优化: 通过统一的模型管理、推理部署、服务监控为大模型推理提供支持,实现从提示词工程、向量知识库、流程编排、智能体创建等场景化应用工具链,帮助用户快速落地行业智能应用,支持AI应用持续优化和稳定运行,赋能百行百业智慧转型。






请到「今天看啥」查看全文