|
免费 | 抢先试用此芯Armv9 AI PC开发套件瑞莎“星睿O6” GiantPandaCV · 公众号 · 3D · 2 天前 · |
|
|
美团基于SGLang提供INT8无损满血版DeepSeek R1部署方案 GiantPandaCV · 公众号 · 3D · 3 天前 · |
|
|
谈谈DeepSeek原厂推理方案 GiantPandaCV · 公众号 · 3D · 6 天前 · |
|
|
分析一下EP并行和DeepSeek开源的DeepEP代码 GiantPandaCV · 公众号 · 3D · 1 周前 · |
|
|
《超大规模操作手册:在 GPU 集群上训练 》Part4(深入GPU编程) GiantPandaCV · 公众号 · 3D · 1 周前 · |
|
|
《超大规模操作手册:在 GPU 集群上训练 》Part3(寻找最佳的GPU优化配置) GiantPandaCV · 公众号 · 3D · 1 周前 · |
|
|
《超大规模操作手册:在 GPU 集群上训练 》Part2(SP,CP,PP,EP,5D) GiantPandaCV · 公众号 · 3D · 2 周前 · |
|
|
《超大规模操作手册:在 GPU 集群上训练 》Part1(基础概念,DP,TP) GiantPandaCV · 公众号 · 3D · 2 周前 · |
|
|
Windsurf(可平替 Cursor) 的使用体验和技巧 GiantPandaCV · 公众号 · 3D · 2 周前 · |
|
|
SGLang DP MLA 特性解读 GiantPandaCV · 公众号 · 3D · 3 周前 · |
|
|
浅析主流 Alignment 算法与 NeMo-Aligner 框架 GiantPandaCV · 公众号 · 3D · 3 周前 · |
|
|
DeepSeek-V3 FP8量化浅析 GiantPandaCV · 公众号 · 3D · 1 月前 · |
|
|
MoE之年的总结和MoE 推理优化的一些认识 GiantPandaCV · 公众号 · 3D · 1 月前 · |
|
|
Fused AllGather_MatMul Triton工程实现 GiantPandaCV · 公众号 · 3D · 1 月前 · |
|
|
谈谈对DeepSeek-R1的一些理解 GiantPandaCV · 公众号 · 3D · 1 月前 · |
|
|
使用NCU和Cursor Claude-sonnet-3.5写出高效cuda算子的正确姿势 GiantPandaCV · 公众号 · 3D · 1 月前 · |
|
|
再读MLA,还有多少细节是你不知道的 GiantPandaCV · 公众号 · 3D · 1 月前 · |
|
|
PyTorch博客 《使用 Triton 加速 2D 动态块量化 Float8 GEMM 简介》 GiantPandaCV · 公众号 · 3D · 1 月前 · |
|