专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
重庆之声  ·  提示丨明起,出分!复试攻略都在这儿了→ ·  11 小时前  
重庆之声  ·  提示丨明起,出分!复试攻略都在这儿了→ ·  11 小时前  
幸福东台  ·  查!分!啦! ·  16 小时前  
幸福东台  ·  查!分!啦! ·  16 小时前  
央广网  ·  明天起出分!转存这份复试全攻略→ ·  22 小时前  
央广网  ·  明天起出分!转存这份复试全攻略→ ·  22 小时前  
鸡西新闻网  ·  即将出分!转存这份2025考研复试全攻略 ·  23 小时前  
鸡西新闻网  ·  即将出分!转存这份2025考研复试全攻略 ·  23 小时前  
无线徐州  ·  后天查成绩!复试攻略都在这儿了→ ·  昨天  
无线徐州  ·  后天查成绩!复试攻略都在这儿了→ ·  昨天  
51好读  ›  专栏  ›  歸藏的AI工具箱

昨天的爆款论文,把推理训练玩出花了#AI创造营##ai# 训练 -20250211134933

歸藏的AI工具箱  · 微博  ·  · 2025-02-11 13:49

正文

2025-02-11 13:49

昨天的爆款论文,把推理训练玩出花了 #AI创造营# #ai#

训练 LLM 在潜在空间(latent space)中进行推理

不需要特殊训练数据,且能处理难以用语言描述的推理任务

3.5B 的参数达到了 50B 参数模型的推理基准性能

想起 Andrej Karpathy 前段时间的话

当你的模型生成的思维链不说英语的时候,你就知道你的 RL 做对了

论文地址:arxiv.org/pdf/2502.05171






请到「今天看啥」查看全文