|
AwesomeCLIP---100+篇CLIP相关工作整理 GiantPandaCV · 公众号 · 3D · 昨天 · |
|
|
小白视角:利用 vllm serve 新的 Embedding Model GiantPandaCV · 公众号 · 3D · 3 天前 · |
|
|
小白视角:利用 SGL 来 Serve Embedding Model GiantPandaCV · 公众号 · 3D · 5 天前 · |
|
|
小白视角:vllm 迁移到 SGLang 的体验与收获 GiantPandaCV · 公众号 · 3D · 6 天前 · |
|
|
【ml-engineering 翻译系列】计算加速器之cpu GiantPandaCV · 公众号 · 3D · 1 周前 · |
|
|
梳理下Flash Attention的dispatch逻辑(文末免费送书) GiantPandaCV · 公众号 · 3D · 1 周前 · |
|
|
图解大模型训练系列:序列并行3,Ring Attention GiantPandaCV · 公众号 · 3D · 1 周前 · |
|
|
【ml-engineering 翻译系列】训练之模型并行 GiantPandaCV · 公众号 · 3D · 2 周前 · |
|
|
图解大模型训练系列:序列并行2,DeepSpeed Ulysses GiantPandaCV · 公众号 · 3D · 2 周前 · |
|
|
【翻译】在FSDP2中开启Float8 All-Gather GiantPandaCV · 公众号 · 3D · 2 周前 · |
|
|
图解大模型训练系列:序列并行1,Megatron SP GiantPandaCV · 公众号 · 3D · 2 周前 · |
|
|
【ml-engineering 翻译系列】AI系统中的网络 benchmark GiantPandaCV · 公众号 · 3D · 3 周前 · |
|
|
OpenAI o1技术初探3:如何让模型拥有自我纠错的能力 GiantPandaCV · 公众号 · 3D · 3 周前 · |
|
|
【ml-engineering 翻译系列】AI系统中的网络 debug GiantPandaCV · 公众号 · 3D · 3 周前 · |
|
|
OpenAI o1 技术初探2:使用MCTS增强推理能力(基于代码实践的解读) GiantPandaCV · 公众号 · 3D · 3 周前 · |
|
|
【ml-engineering 翻译系列】AI系统中的网络概述 GiantPandaCV · 公众号 · 3D · 3 周前 · |
|
|
【ml-engineering 翻译系列】大模型推理 GiantPandaCV · 公众号 · 3D · 4 周前 · |
|
|
【翻译】使用PyTorch FSDP和Torch.compile最大化训练吞吐量 GiantPandaCV · 公众号 · 3D · 4 周前 · |
|
|
课程升级、资源加码!万人共学的书生大模型实战营第4期正式起航! GiantPandaCV · 公众号 · 3D · 4 周前 · |
|
|
OpenAI o1 技术初探1:整体框架,利用Test-Time Scaling Law提升逻辑推理能力 GiantPandaCV · 公众号 · 3D · 1 月前 · |
|