|
LLM数据合成之后训练篇 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
NLP 核心技能:注意力机制和Transformer架构全面剖析 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
专补大模型短板的RAG入门与实战书来了! 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
LLM预训练与SFT数据配比调研 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
手撕LLM+RLHF+VLM+o1推理,我全都要!!! 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
大模型量化技术原理:FP6 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
现代LLM基本技术整理 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
大模型训练(SFT)实践总结 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
一文搞懂大模型文件存储格式新宠GGUF 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
第十三期-AI书籍赠送活动 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
CUDA的时代和时代的CUDA:谈谈CUDA护城河 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
从芯片公司的角度对LLM推理框架的一些思考 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
ChatGPT有什么新奇的使用方式? 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
对Triton的一些理解 吃果冻不吐果冻皮 · 公众号 · · 4 月前 · |
|
|
Reverse-o1:OpenAI o1原理逆向工程图解 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
算法岗哀鸿遍野,部署工程师却成为香饽饽 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
多模态大模型技术点总结 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
|
如何从0到1进行预训练工作? 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|