吃果冻不吐果冻皮 - 公众号 - 文章列表 - 历史文章

最新

【显存优化良药】一文搞懂大模型压缩技术

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

大模型国产化适配11-LLM训练性能基准测试（昇腾910B3）

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

大模型Infra这些年，从黑铁时代到黄金时代再到白银时代

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

SOTA多模态大模型架构设计的最佳实践

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

大语言模型工具学习全面综述：背景、定义、范式、评估、趋势

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

从零训练的 1B 以下小模型汇总

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

FP8 低精度训练：Transformer Engine 简析

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

突破AI部署瓶颈：模型压缩技术如何助力高效AI应用

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

多模态模型(VLM)部署方法抛砖引玉

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

内存墙与LLM 计算

吃果冻不吐果冻皮 · 公众号 · 科技创业科技自媒体 · 7 月前 ·

压缩下一个token通向超过人类的智能

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

清华汪玉教授团队：首部高效模型压缩与设计专著重磅上市

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

详解这一年多模态视觉-语言大模型的架构演进

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

图解大模型计算加速系列：分离式推理架构1，从DistServe谈起

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

NVIDIA GPGPU 总览

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

只要捞“偏门”，篇篇都是顶会顶刊！

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

大模型国产化适配10-快速迁移大模型到昇腾910B保姆级教程（Pytorch版）

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

月之暗面kimi底层推理系统方案揭秘

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

豆瓣8.4，时隔9年，经典Python编程三剑客之一第2版重磅上市！

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

关于RAG优化的几个小技巧

吃果冻不吐果冻皮 · 公众号 · · 7 月前 ·

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!