专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
目录
相关文章推荐
新智元  ·  清华姚班校友等揭Transformer致命缺 ... ·  16 小时前  
黄建同学  ·  200页的大模型论文(书?)《Foundat ... ·  22 小时前  
硅星GenAI  ·  DeepSeek-R1深度思考火出圈; ... ·  3 天前  
硅星GenAI  ·  DeepSeek-R1深度思考火出圈; ... ·  3 天前  
宝玉xp  ·  GitHub ... ·  3 天前  
量子位  ·  钉钉真勇!率先接入DeepSeek,阿里系第 ... ·  3 天前  
51好读  ›  专栏  ›  宝玉xp

专业👍-20250210095021

宝玉xp  · 微博  · AI  · 2025-02-10 09:50

正文

2025-02-10 09:50

专业👍
Scaling Law过去是、现在是、将来也会继续是推动大模型快速发展的第一动力,最近之所以 Deepseek R1火出天际,一个重要原因是它复现并开源了大模型Post-Training和Inference两个阶段Scaling Law的具体做法,模型效果拔群。那么, Scaling Law曲线可以无限增长吗?再比如,目前我们有三种Scaling Law(Pre-train、RL、Test Time),它们组合起来的Scaling Law看起来是什么样子?本文探讨这些问题。






请到「今天看啥」查看全文