专栏名称: Datawhale
一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。
目录
相关文章推荐
51好读  ›  专栏  ›  Datawhale

刚刚!DeepSeek开源DeepEP,GPU通信加速器,专为MoE设计!

Datawhale  · 公众号  ·  · 2025-02-25 12:07

正文

Datawhale分享

开源周:Day 02,编辑:Datawhale

信息来源|X,机器之心,APPSO
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。

昨天, 他们开源了第一个代码库 ——FlashMLA 一款用于 Hopper GPU 的高效型 MLA 解码核。

就在刚刚,DeepSeek 第二天的开源项目 DeepEP 正式发布。


DeepSeek 官方在 X 平台发文称:

「很高兴向大家介绍 DeepEP——首个专为 MoE(专家混合)模型训练和推理打造的开源 EP 通信库。

✅ 高效优 化的全对全(all-to-all)通信
✅ 支持节点内(intranode)和节点间(internode)通信,兼容 NVLink 和 RDMA
✅ 训练与推理预填充(prefilling)阶段的高吞吐率计算核
✅ 推理解码(decoding)阶段的低延迟计算核
✅ 原生支持 FP8 数据调度
✅ 灵活的 GPU 资源控制,实现计算与通信的重叠处理」

短短发布 1 个多小时,Stars 数已接近 2k。



项目地址:https:






请到「今天看啥」查看全文