|
大模型应用落地那些事 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
RAG 工业落地框架细节比对 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
算法岗哀鸿遍野,部署工程师却成为香饽饽 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
探讨大模型在传统NLP任务的使用姿势 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
FP8 量化基础知识(扫盲) 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
关于Tokenizer的一些感想 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
无脑Scaling!2天训完 70B RLHF-PPO 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
MoE专家大模型汇总 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
千卡集群大模型训练思考与总结 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
大模型量化性能评价指标 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
大模型国产化适配9-LLM推理框架MindIE-Service性能基准测试 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
英伟达市值全球第一,基于TensorRT的大模型推理加速功不可没 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
大模型训练:Megatron-Core中的通信优化 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
第七期-大模型应用开发书籍赠送活动 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
研发大模型的血液--万字长文详谈数据工程 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
浅谈英伟达 DGX SuperPod 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
浅谈后向传递的计算量大约是前向传递的两倍 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
RLHF替代方案:在SFT以外,我们还能拿SFT数据做什么? 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
美亚4.6,写给程序员看的大模型入门实战书来了! 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
|
LLM后端推理引擎性能大比拼 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|