|
从头预训练一只超迷你 LLaMA 3——复现 Tiny Stories 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
再次封神!AI 大模型渗透太快了。。。 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
大模型精度(FP16,FP32,BF16)详解与实践 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
3秒修复老照片!GitHub上超火的镜像教你一键实现! 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
数据为王:大模型预训练中的数据处理及思考 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
突破AI部署瓶颈:模型压缩技术如何助力高效AI应用 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
图解大模型RLHF系列:人人都能看懂的PPO原理与源码解读 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
大语言模型的生态系统 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
多模态大语言模型全面综述:架构,训练,数据,评估,扩展,应用,挑战,机遇 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
快速提升性能,如何更好地使用GPU(下) 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
AI工程师日常工作中Docker命令速查表 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
如何从零开始训练大模型(minicpm分享&讨论) 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
开源闭源争论不休,浅谈大模型开源和闭源 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
|
Unsloth微调Llama3-8B,提速44%,节省42%显存,约需8GB显存 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|