文章总数 295
51好读  ›  专栏  ›  吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
从零训练的 1B 以下小模型汇总
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
FP8 低精度训练:Transformer Engine 简析
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
多模态模型(VLM)部署方法抛砖引玉
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
压缩下一个token通向超过人类的智能
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
NVIDIA GPGPU 总览
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
月之暗面kimi底层推理系统方案揭秘
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
关于RAG优化的几个小技巧
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  ·