专栏名称: 百度智能云
聚焦人工智能(AI)、大数据(Big Data)、云计算(Cloud),以“ABC”三位一体战略,帮助企业客户实现数字化、智能化转型。百度云,智能,计算无限可能!
目录
相关文章推荐
白鲸出海  ·  ChatGPT官宣周活过4亿,TikTok重 ... ·  4 小时前  
阿里开发者  ·  我是如何基于 DeepSeek-R1 ... ·  8 小时前  
阿里开发者  ·  GPU是如何进行算力管理的? ·  17 小时前  
阿里开发者  ·  基于LLM打造沉浸式3D世界 ·  昨天  
51好读  ›  专栏  ›  百度智能云

百度百舸+昆仑芯:率先完成DeepSeek全版本适配,提供稳定高效部署方案

百度智能云  · 公众号  · 科技公司  · 2025-02-19 16:06

正文



2月18日晚,百度发布2024年Q4及全年财报。 数据显示,百度2024全年总营收1331亿元,归属百度核心净利润达234亿元,同比增长21%。 受AI驱动,百度智能云呈高速增长,四季度收入同比增长达26%,成为公司重要的增长引擎。


百度创始人李彦宏表示: 2024年是我们从以互联网为中心转向以人工智能为先的关键一年。随着我们全栈AI技术得到广泛的市场认可,智能云的增长态势愈发强劲。 ”在全栈AI技术方面,百度已经形成了从云基础设施、框架、模型到应用的四层架构,能够形成高效的反馈闭环,帮助大模型不断调优迭代,实现端到端的优化。


在财报电话会上,百度集团执行副总裁,百度智能云事业群总裁沈抖在谈到云基础设施时表示, 得益于更快、更先进的网络架构,2024年第四季度,百度智能云将统一GPU集群的规模扩大了一倍,但仍然实现了99%的有效训练时间,这证明了百度智能云大规模提供峰值性能的能力。


此外, 百度智能云近期成功点亮昆仑芯 P800万卡集群,未来还将进一步点亮三万卡集群。昆仑芯万卡集群不仅为企业提供了强大的算力支持,还显著提升了资源利用率,降低了大模型训练成本,推动模型降本增效,为企业提供稳定、高效的算力支持。


春节期间, DeepSeek凭借其卓越的技术性能和创新功能,迅速在市场中崭露头角,实现了C端用户数量的爆发式增长。然而,当考虑将其应用于企业业务时,除了模型本身强大的性能之外,稳定性和安全性也是关键因素。为此,百度百舸基于昆仑芯P800,发布部署 “满血版DeepSeek R1+联网搜索” 服务。通过联网搜索功能,将最新的互联网数据融入答案生成,为企业提供更及时、准确的信息支持,让企业业务不再等待,高效运转成为常态。



昆仑芯率先完成训练推理DeepSeek全版本适配

在模型适配方面,昆仑芯领先业界。 在DeepSeek-V3/R1上线不久,昆仑芯便率先完成全版本模型适配 ,这其中包括DeepSeek MoE模型及其蒸馏的Llama/Qwen等小规模dense模型。


仑芯 P800在性能上表现卓越,这使得昆仑芯在部署上更加轻松,运行成本显著降低,还能轻松完成DeepSeek-V3/R1全版本推理任务。 不仅如此,昆仑芯P800在DeepSeek系列MoE模型大规模训练任务中也表现出色,全面支持MLA、多专家并行等特性,仅需32台即可支持模型全参训练,高效助力模型的持续训练和微调。


同时, 为了满足企业客户私有化部署的需求,百度智能云分别发布了百舸DeepSeek一体机、千帆DeepSeek一体机,均支持昆仑芯P800单机8卡部署满血版DeepSeek R1/V3。 百舸DeepSeek一体机可满足高性能训练与推理需求,从开箱上电到服务上线最快仅需半天。而千帆DeepSeek一体机除了满足训推需求之外,还为企业提供了一站式的模型应用解决方案,能够满足企业全链路模型开发应用工具链需求,具备更强、更全面的应用开发能力。


百舸4.0助力昆仑芯万卡集群建设

打造“多快稳省”AI基础设施

目前,百度智能云已成功点亮昆仑芯 P800万卡集群,这也是国内首个正式点亮的自研万卡集群。 百度智能云将进一步点亮3万卡集群。 国产昆仑芯万卡集群以及未来三万卡集群的建设,从硬件到软件,技术挑战是全方位的。 而24年9月升级的百度百舸AI异构计算平台4.0,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型训练、模型推理四大方面,能为企业提供“多芯、快、稳、省”的AI基础设施,在万卡集群的建设中发挥了至关重要的作用。


DeepSeek最擅长的推理能力方面,百度百舸还提供了针对在线推理服务的全生命周期管理、弹性扩缩容、自研框架推理加速、完备的运维监控体系等优势能力,结合昆仑芯P800的强大算力,为用户提供服务稳定性的联合保障,同时有效降低推理成本并提升推理性能。








请到「今天看啥」查看全文