文章总数 946
51好读  ›  专栏  ›  GiantPandaCV
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
【翻译】在FSDP2中开启Float8 All-Gather
GiantPandaCV  ·  公众号  · 3D  ·  4 月前  · 
图解大模型训练系列:序列并行1,Megatron SP
GiantPandaCV  ·  公众号  · 3D  ·  4 月前  · 
【ml-engineering 翻译系列】大模型推理
GiantPandaCV  ·  公众号  · 3D  ·  4 月前  · 
【翻译】使用PyTorch FSDP最大化训练吞吐量
GiantPandaCV  ·  公众号  · 3D  ·  4 月前  · 
CUDA-MODE 课程笔记 第14课,Triton 实践指南
GiantPandaCV  ·  公众号  · 3D  ·  4 月前  · 
【翻译】CUDA-Free Inference for LLMs
GiantPandaCV  ·  公众号  · 3D  ·  4 月前  · 
图解KV Cache:加速大模型推理的幕后功臣
GiantPandaCV  ·  公众号  · 3D  ·  4 月前  · 
Flex Attention API 应用 Notebook 代码速览
GiantPandaCV  ·  公众号  · 3D  ·  4 月前  · 
将GLM-4-Plus大模型应用到Cursor中
GiantPandaCV  ·  公众号  · 3D  ·  4 月前  ·