专栏名称: 宝玉xp

前微软Asp.Net最有价值专家互联网科技博主我是宝玉。

目录

相关文章推荐

新智元 · 清华姚班校友等揭Transformer致命缺 ... · 16 小时前

黄建同学 · 200页的大模型论文（书？）《Foundat ... · 22 小时前

硅星GenAI · DeepSeek-R1深度思考火出圈; ... · 3 天前

硅星GenAI · DeepSeek-R1深度思考火出圈; ... · 3 天前

宝玉xp · GitHub ... · 3 天前

量子位 · 钉钉真勇！率先接入DeepSeek，阿里系第 ... · 3 天前

51好读 › 专栏 › 宝玉xp

专业👍-20250210095021

宝玉xp · 微博 · AI · 2025-02-10 09:50

正文

2025-02-10 09:50
本条微博链接

专业👍

Scaling Law过去是、现在是、将来也会继续是推动大模型快速发展的第一动力，最近之所以 Deepseek R1火出天际，一个重要原因是它复现并开源了大模型Post-Training和Inference两个阶段Scaling Law的具体做法，模型效果拔群。那么， Scaling Law曲线可以无限增长吗？再比如，目前我们有三种Scaling Law（Pre-train、RL、Test Time），它们组合起来的Scaling Law看起来是什么样子？本文探讨这些问题。

请到「今天看啥」查看全文

推荐文章

新智元 · 清华姚班校友等揭Transformer致命缺陷，OpenAI科学家紧急回应：学术界节奏太慢

16 小时前

黄建同学 · 200页的大模型论文（书？）《Foundations of La-20250210121321

22 小时前

硅星GenAI · DeepSeek-R1深度思考火出圈; OpenAI o3-mini紧急上线｜春节周AI热榜

3 天前

硅星GenAI · DeepSeek-R1深度思考火出圈; OpenAI o3-mini紧急上线｜春节周AI热榜

3 天前

宝玉xp · GitHub 资深工程师是如何使用大语言模型（LLM）这是一篇 -20250207105919

3 天前

量子位 · 钉钉真勇！率先接入DeepSeek，阿里系第一个吃螃蟹

3 天前

凤凰财经 · 世间哪有那么多天才，还不都是孤独地翻山越岭

8 年前

老高电商圈子 · 积压如山！爆某知名快递网点陷倒闭背后：真相惊人

7 年前

狗与爱的世界 · 狗狗追着灵车一路狂奔，到达墓地后它的举动让所有人都泪崩……

7 年前

广东台今日关注 · 谭咏麟：坚守诺言30多年拒真人秀坚信粤语歌有前景

7 年前

人工智能头条 · 【赠书开奖】恭喜点到名字的同学获得《TensorFlow实战》一本

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!