专栏名称: 歸藏的AI工具箱

互联网科技博主产品设计师、模型设计师、不会代码的独立开发者。关注人工智能、LLM 、 Stable Diffusion 和设计。

目录

相关文章推荐

重庆之声 · 提示丨明起，出分！复试攻略都在这儿了→ · 11 小时前

重庆之声 · 提示丨明起，出分！复试攻略都在这儿了→ · 11 小时前

幸福东台 · 查！分！啦！ · 16 小时前

幸福东台 · 查！分！啦！ · 16 小时前

央广网 · 明天起出分！转存这份复试全攻略→ · 22 小时前

央广网 · 明天起出分！转存这份复试全攻略→ · 22 小时前

鸡西新闻网 · 即将出分！转存这份2025考研复试全攻略 · 23 小时前

鸡西新闻网 · 即将出分！转存这份2025考研复试全攻略 · 23 小时前

无线徐州 · 后天查成绩！复试攻略都在这儿了→ · 昨天

无线徐州 · 后天查成绩！复试攻略都在这儿了→ · 昨天

51好读 › 专栏 › 歸藏的AI工具箱

昨天的爆款论文，把推理训练玩出花了#AI创造营##ai# 训练 -20250211134933

歸藏的AI工具箱 · 微博 · · 2025-02-11 13:49

正文

2025-02-11 13:49
本条微博链接

昨天的爆款论文，把推理训练玩出花了 #AI创造营# #ai#

训练 LLM 在潜在空间（latent space）中进行推理

不需要特殊训练数据，且能处理难以用语言描述的推理任务

3.5B 的参数达到了 50B 参数模型的推理基准性能

想起 Andrej Karpathy 前段时间的话

当你的模型生成的思维链不说英语的时候，你就知道你的 RL 做对了

论文地址：arxiv.org/pdf/2502.05171

请到「今天看啥」查看全文

推荐文章

重庆之声 · 提示丨明起，出分！复试攻略都在这儿了→

11 小时前

重庆之声 · 提示丨明起，出分！复试攻略都在这儿了→

11 小时前

幸福东台 · 查！分！啦！

16 小时前

幸福东台 · 查！分！啦！

16 小时前

央广网 · 明天起出分！转存这份复试全攻略→

22 小时前

央广网 · 明天起出分！转存这份复试全攻略→

22 小时前

鸡西新闻网 · 即将出分！转存这份2025考研复试全攻略

23 小时前

鸡西新闻网 · 即将出分！转存这份2025考研复试全攻略

23 小时前

无线徐州 · 后天查成绩！复试攻略都在这儿了→

昨天

无线徐州 · 后天查成绩！复试攻略都在这儿了→

昨天

虎嗅APP · 投资人也不容易，你们不要忽悠他

8 年前

王者荣耀 · 军情观察室 | 新版本解析，上分事半功倍！

8 年前

微路况 · 宋丹丹前夫英达，美国被捕！但你知道他的背景有多牛吗？！

7 年前

正商参略 · 中老年人不要自作多情（说得真好！）

7 年前

健康与养身 · 结婚3年没有亲热过，当我提出离婚，他竟然提出这种要求……

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!