|
系统调优助手,PyTorch Profiler TensorBoard 插件教程 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
CUTLASS 基础介绍 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
图解大模型计算加速系列:vLLM源码解析2,调度器策略(Scheduler) GiantPandaCV · 公众号 · · 10 月前 · |
|
|
nndeploy - 一款开源的模型端到端部署框架 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
TensorRT-LLM初探(二)简析了结构,用的更明白 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
最新11个SAM+医学图像创新点,冲Nature! GiantPandaCV · 公众号 · · 11 月前 · |
|
|
ICLR 2024 spotlight WURSTCHEN - 一个高效的大规模文本到图像扩散模型的架构 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
图解大模型计算加速系列:vLLM源码解析1,整体架构 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
LLM推理加速的文艺复兴:Noam Shazeer和Blockwise Parallel Decoding GiantPandaCV · 公众号 · · 11 月前 · |
|
|
大模型训练加速之FlashAttention系列:爆款工作背后的产品观 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
大模型推理核心技术之Continuous Batching和我的WXG往事 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
如何为LLM推理任务选择正确的GPU GiantPandaCV · 公众号 · · 11 月前 · |
|
|
《PytorchConference2023翻译系列》25 数据加载技术的演进 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
整理了2000篇2024年顶会论文合集【附下载】 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
大模型训练之序列并行双雄:DeepSpeed Ulysses & Ring-Attention GiantPandaCV · 公众号 · · 11 月前 · |
|
|
聊聊PyTorch的ZeroRedundancyOptimizer优化器 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
图解大模型计算加速系列之:vLLM核心技术PagedAttention原理 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
谈一谈Distributed Optimizer(ZERO)坑爹的地方 GiantPandaCV · 公众号 · · 11 月前 · |
|
|
多模态融合56个创新点汇总,找idea必看! GiantPandaCV · 公众号 · · 11 月前 · |
|
|
新进展!Larimar-让大型语言模型像人一样记忆与遗忘 GiantPandaCV · 公众号 · · 11 月前 · |
|