吃果冻不吐果冻皮 - 公众号 - 文章列表 - 历史文章

最新

从头预训练一只超迷你 LLaMA 3——复现 Tiny Stories

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

再次封神！AI 大模型渗透太快了。。。

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

大模型精度（FP16，FP32，BF16）详解与实践

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

3秒修复老照片！GitHub上超火的镜像教你一键实现！

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

数据为王：大模型预训练中的数据处理及思考

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

大模型训练优化方法

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

突破AI部署瓶颈：模型压缩技术如何助力高效AI应用

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

图解大模型RLHF系列：人人都能看懂的PPO原理与源码解读

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

大语言模型的生态系统

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

多模态大语言模型全面综述：架构，训练，数据，评估，扩展，应用，挑战，机遇

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

快速提升性能，如何更好地使用GPU（下）

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

AI工程师日常工作中Docker命令速查表

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

如何从零开始训练大模型（minicpm分享&讨论）

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

开源闭源争论不休，浅谈大模型开源和闭源

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

Unsloth微调Llama3-8B，提速44%，节省42%显存，约需8GB显存

吃果冻不吐果冻皮 · 公众号 · · 9 月前 ·

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!