|
vLLM源码之PagedAttention(持续更新) GiantPandaCV · 公众号 · · 7 月前 · |
|
|
大模型训练:Megatron-Kwai中的内存优化 GiantPandaCV · 公众号 · · 7 月前 · |
|
|
GLM大模型的机器翻译能力测试 GiantPandaCV · 公众号 · · 7 月前 · |
|
|
LLM101n 硬核代码解读:Micrograd,一个轻量级的自动微分引擎 GiantPandaCV · 公众号 · · 7 月前 · |
|
|
CUDA-MODE课程笔记 第8课: CUDA性能检查清单 GiantPandaCV · 公众号 · · 7 月前 · |
|
|
LLM 20,000 QPS背后的力量:揭秘Character AI的高效推理技术 GiantPandaCV · 公众号 · · 7 月前 · |
|
|
Diffusion反馈强势助力CLIP秒变火眼金睛:北京智源研究院、中科院自动化所联合推出DIVA GiantPandaCV · 公众号 · · 7 月前 · |
|
|
图解大模型计算加速系列:分离式推理架构2,模糊分离与合并边界的chunked-prefills GiantPandaCV · 公众号 · · 7 月前 · |
|
|
SGLang:LLM推理引擎发展新方向 GiantPandaCV · 公众号 · · 7 月前 · |
|
|
CUDA-MODE课程笔记 第7课: Quantization Cuda vs Triton GiantPandaCV · 公众号 · · 7 月前 · |
|
|
LLM101n 硬核代码解读:手把手教你用PyTorch实现多层感知机MLP GiantPandaCV · 公众号 · · 7 月前 · |
|
|
A100算力加持!书生大模型实战营全面升级,趣味闯关等你来 GiantPandaCV · 公众号 · · 7 月前 · |
|
|
一文弄懂 LLM 结构化数据生成原理 GiantPandaCV · 公众号 · · 7 月前 · |
|
|
大模型人才今年的薪资。。 GiantPandaCV · 公众号 · · 7 月前 · |
|
|
CUTLASS 2.x & CUTLASS 3.x Intro 学习笔记 GiantPandaCV · 公众号 · 3D · 7 月前 · |
|
|
FP8 低精度训练:Transformer Engine 简析 GiantPandaCV · 公众号 · 3D · 7 月前 · |
|
|
图解大模型计算加速系列:vLLM源码解析3,Prefix Caching GiantPandaCV · 公众号 · 3D · 7 月前 · |
|
|
CUDA-MODE 第一课课后实战(下) GiantPandaCV · 公众号 · 3D · 7 月前 · |
|
|
CUDA-MODE课程笔记 第6课: 如何优化PyTorch中的优化器 GiantPandaCV · 公众号 · 3D · 7 月前 · |
|