专栏名称: 新华网财经
权威、专业、快速、深度
目录
相关文章推荐
北京新闻广播  ·  记者实测AI看病,是“超级外挂”还是“玩命盲盒”? ·  12 小时前  
海西晨报  ·  DeepSeek,重磅突发! ·  16 小时前  
海西晨报  ·  DeepSeek,重磅突发! ·  16 小时前  
常观  ·  直冲24℃!常州下周要入春? ·  2 天前  
常观  ·  直冲24℃!常州下周要入春? ·  2 天前  
杭州公安  ·  官方通报!82款App违法违规,抓紧卸载 ·  2 天前  
51好读  ›  专栏  ›  新华网财经

DeepSeek,重磅突发!

新华网财经  · 公众号  · 互联网安全 科技自媒体  · 2025-02-25 16:38

主要观点总结

DeepSeek宣布开源代码库DeepEP,这是首个用于MoE模型训练和推理的开源EP通信库。DeepEP支持高效全员沟通,包括节点内和节点间的NVLink和RDMA通信。它提供用于训练和推理的高吞吐量内核,以及用于推理解码的低延迟内核。此外,它还支持原生FP8调度和灵活的GPU资源控制,实现计算与通信的重叠。

关键观点总结

关键观点1: DeepEP是首个用于MoE模型训练和推理的开源EP通信库。

该库的主要功能包括高效的全员沟通,节点内和节点间的通信支持NVLink和RDMA。

关键观点2: DeepEP提供用于训练和推理的高吞吐量内核。

通过使用DeepEP,用户可以更有效地进行模型训练和推理工作。

关键观点3: DeepEP还具备用于推理解码的低延迟内核。

这一特性使得DeepEP在推理解码方面表现优异,提高了响应速度。

关键观点4: DeepEP支持原生FP8调度和灵活的GPU资源控制。

这些特性使得DeepEP能够更有效地管理GPU资源,提高计算性能。


正文


2月25日,DeepSeek官宣, 今日开源代码库为DeepEP,它是首个用于 MoE 模型训练和推理的开源EP通信库。


特点有:高效的全员沟通;节点内和节点间均支持 NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生 FP8 调度支持;灵活的GPU资源控制,实现计算-通信重叠。


图片





来源:每日经济新闻
编辑:陈林曦 白雨晨


关注“ 新华网财经 ”视频号



更多财经资讯等你来看










请到「今天看啥」查看全文