DeepSeek开源周第二弹：第一个用于MoE模型训推的EP通信库，暂只支持英伟达卡

AI前线 · 公众号 · AI · 2025-02-25 12:16

主要观点总结

DeepEP是一个专为混合专家模型（Mixture-of-Experts, MoE）和专家并行（Expert Parallelism, EP）设计的通信库，具备高效通信、优化带宽和低延迟推理等特点。

DeepEP提供了高吞吐量、低延迟的GPU通信功能，支持MoE中的分发和组合操作，以及低精度计算（如FP8）。

针对DeepSeek-V3论文中的算法，DeepEP优化了数据在不同硬件域之间的传输，如NVLink到RDMA，并适合训练和推理任务。此外，它还能控制GPU资源（SM）的使用。

DeepEP对推理任务进行了优化，使用纯RDMA通信减少延迟，并支持通信和计算重叠的技术，不占用额外GPU资源。

DeepEP与DeepSeek-V3论文中提出的组限门控算法保持一致，提供针对非对称域带宽转发优化的内核，并在特定硬件环境下进行了测试。

DeepEP目前需要的软硬件环境包括Hopper GPUs、NVLink用于节点内通信、RDMA网络、Python 3.8及以上版本、CUDA 12.3及以上版本、PyTorch 2.1及以上版本。

推荐文章

机器之心 · 超越DeepSeek-ProverV1.5！豆包首个形式化数学推理模型BFS-Prover来了，直接开源

15 小时前

爱可可-爱生活 · 突破性的“一步扩散”生成模型查看图片 //@爱可可-爱生活:-20250225075219

22 小时前

量子位 · 全球最快AI视频生成火了，5秒让老黄马斯克拥抱，Made in China

昨天

机器之心 · 联手华为诺亚，南大LAMDA组获EDA顶会DATE 2025最佳论文

昨天

爱可可-爱生活 · 【[924星]LegendApp/legend-list：一个高-20250223154041

2 天前

美好滁州 · 【荐读】赶火车挤掉了一只鞋子，两个小男孩的举动让全世界感动！

8 年前

强国梦 · 丹麦官方微博紧急求救，我正直的大吃货国人民正义感爆炸！

7 年前

实验与分析 · 水质检测分析方法的分类汇总！

7 年前

有调App · 这才是拼图界BOSS的终极地狱！

7 年前

五饼二鱼 · 一个42个月的孩子——主内安睡了！生前的故事，传遍基督教的朋友圈，谁看谁流泪！

7 年前