|
FasterTransformer Decoding 源码分析(五)-AddBiasResidualLayerNorm介绍 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
AffineQuant: 大语言模型的仿射变换量化 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
单节点8xA800跑起来HuggingFace DeepSeek V2踩坑 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
FasterTransformer Decoding 源码分析(四)-SelfAttention实现介绍 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
炸裂!最新CVPR2024、ICLR2024、AAAI2024、ICML、ACL2024论文+Code大合集! GiantPandaCV · 公众号 · · 10 月前 · |
|
|
在GPU上加速RWKV6模型的Linear Attention计算 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
性能提升,星辰AI大模型TeleChat-12B评测 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
FasterTransformer Decoding 源码分析(三)-LayerNorm介绍 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
图解大模型计算加速系列:vLLM源码解析3,块管理器(BlockManager)上篇 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
FasterTransformer Decoding 源码分析(二)-Decoder框架介绍 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
Llama 3 五一超级课堂丨微调、量化部署、评测全覆盖,手把手带你免费学 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
FasterTransformer Decoding 源码分析(一)-整体框架介绍 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
好消息,微信公众号官方支持留言了 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
梳理RWKV 4,5(Eagle),6(Finch)架构的区别以及个人理解和建议 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
100+论文与创新点!SLAM+路径规划资料合集 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
如何用Infini-attention实现超长上下文Transformer GiantPandaCV · 公众号 · · 10 月前 · |
|
|
Tensor Cores 使用介绍 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
推理部署工程师面试题库 GiantPandaCV · 公众号 · · 10 月前 · |
|
|
CVPR2024-扩散模型可解释性新探索,图像生成一致性创新高!AI视频生成新机遇? GiantPandaCV · 公众号 · · 10 月前 · |
|
|
最新大模型论文研究论文合集,包含谷歌/苹果/亚马逊/港大、阿里最新研究报告! GiantPandaCV · 公众号 · · 10 月前 · |
|