专栏名称: 黄建同学

数码博主超话主持人（ChatGPT超话）头条文章作者我的学习笔记，关注AI+新能源

目录

相关文章推荐

爱可可-爱生活 · [LG]《Model Alignment ... · 3 天前

宝玉xp · o1 ... · 3 天前

爱可可-爱生活 · 通俗版解读查看图片-20250112075758 · 5 天前

爱可可-爱生活 · 【[3k星]MoneyPrinterV2：在 ... · 6 天前

爱可可-爱生活 · 本文通过将投机采样技术扩展到扩散模型，并利用 ... · 6 天前

51好读 › 专栏 › 黄建同学

看了电子版前面两章，写的很不错！——GPT 系列模型的发展历程，-20250111203516

黄建同学 · 微博 · AI · 2025-01-11 20:35

正文

2025-01-11 20:35
本条微博链接

看了电子版前面两章，写的很不错！

——
GPT 系列模型的发展历程，有两点令人印象深刻。

第一点是可拓展的训练架构与学习范式：Transformer 架构能够拓展到百亿、千亿甚至万亿参数规模，并且将预训练任务统一为预测下一个词这一通用学习范式；

第二点是对于数据质量与数据规模的重视：不同于 BERT 时代的预训练语言模型，这次大语言模型的成功与数据有着更为紧密的关系，高质量数据、超大规模数据成为大语言模型的关键基础。

上述的思路看似简单，但能够从早期众多的技术路线中寻找到这条路线，并且坚定地去执行这条路线，这就是 OpenAI 成功的关键所在。

《大语言模型》这书不错，有免费电子版↓

访问：llmbook-zh.github.io/

#ai创造营##chatgpt#

推荐文章

爱可可-爱生活 · [LG]《Model Alignment Search》S Gr-20250114054612

3 天前

宝玉xp · o1 pro不是聊天对话模型，不适合长会话，最好一条消息内把上下-20250114035356

3 天前

爱可可-爱生活 · 通俗版解读查看图片-20250112075758

5 天前

爱可可-爱生活 · 【[3k星]MoneyPrinterV2：在线赚钱的自动化助手，-20250111121106

6 天前

爱可可-爱生活 · 本文通过将投机采样技术扩展到扩散模型，并利用反射最大耦合实现了高-20250111053712

6 天前

新智派 · iPhone7红色版没创新？照样这么多人疯抢！

7 年前

钱报杭州房产 · 又有两宗宅地挂牌，一宗在丁桥，一宗在牛田，激战又起？

7 年前

安全驾驶俱乐部 · 一个飞来横祸的事故，可以避免吗？

7 年前

红德智库 · 【东亚观察】日本最大“BOSS”团能为中日关系注入多少正能量？

7 年前

泡泡熊popo · 南方小巷

7 年前

Sov5搜索 · 小百科 · 移动版

51好读 - 好文章就要读起来!