|
大模型低显存推理优化-Offload技术 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
Transformer推理结构简析(Decoder + MHA) 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
【万字长文】模型推理服务工具综述 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
对大模型演进方向的思考 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
大模型对齐技术总结:PPO,DPO, SimPO,KTO,Step-DPO, MCTS-DPO,SPO 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
关于 OpenAI 发布 o1 系列模型的分析及其展望 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
OpenAI o1 的价值意义及 RL 的 Scaling Law 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
无法保证“安全“的大模型还能用吗? 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
基于 chunked prefill 理解 prefill 和 decode 的计算特性 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
大模型二次开发基本思路 吃果冻不吐果冻皮 · 公众号 · 科技自媒体 · 5 月前 · |
|
|
大模型推理服务调度优化技术-Continuous batching 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
入坑大模型18个月的反思与贩私 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
为啥大模型需要量化?如何量化? 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
Meta: System 2 蒸馏 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
ICLR'24 | MiniLLM:大模型的知识蒸馏 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
黑神话悟空火了,为何没人用H100打游戏?(盘点H100和4090的十点区别) 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
GPT5训练失败的思考 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
第十二期-AI书籍赠送活动 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
算法技术设计思考:迭代的思维方式 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|