文章总数 295
51好读  ›  专栏  ›  吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
大模型低显存推理优化-Offload技术
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
Transformer推理结构简析(Decoder + MHA)
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
大模型千卡训练总结
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
【万字长文】模型推理服务工具综述
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
对大模型演进方向的思考
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
OpenAI o1 的价值意义及 RL 的 Scaling Law
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
入坑大模型18个月的反思与贩私
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
为啥大模型需要量化?如何量化?
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
Meta: System 2 蒸馏
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
ICLR'24 | MiniLLM:大模型的知识蒸馏
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
GPT5训练失败的思考
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
第十二期-AI书籍赠送活动
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  · 
算法技术设计思考:迭代的思维方式
吃果冻不吐果冻皮  ·  公众号  ·  ·  5 月前  ·