|
【显存优化良药】一文搞懂大模型压缩技术 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
大模型国产化适配11-LLM训练性能基准测试(昇腾910B3) 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
大模型Infra这些年,从黑铁时代到黄金时代再到白银时代 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
SOTA多模态大模型架构设计的最佳实践 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
大语言模型工具学习全面综述:背景、定义、范式、评估、趋势 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
从零训练的 1B 以下小模型汇总 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
FP8 低精度训练:Transformer Engine 简析 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
突破AI部署瓶颈:模型压缩技术如何助力高效AI应用 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
多模态模型(VLM)部署方法抛砖引玉 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
内存墙与LLM 计算 吃果冻不吐果冻皮 · 公众号 · 科技创业 科技自媒体 · 7 月前 · |
|
|
压缩下一个token通向超过人类的智能 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
清华汪玉教授团队:首部高效模型压缩与设计专著重磅上市 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
详解这一年多模态视觉-语言大模型的架构演进 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
图解大模型计算加速系列:分离式推理架构1,从DistServe谈起 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
NVIDIA GPGPU 总览 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
只要捞“偏门”,篇篇都是顶会顶刊! 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
大模型国产化适配10-快速迁移大模型到昇腾910B保姆级教程(Pytorch版) 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
月之暗面kimi底层推理系统方案揭秘 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
豆瓣8.4,时隔9年,经典Python编程三剑客之一第2版重磅上市! 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
|
关于RAG优化的几个小技巧 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|