专栏名称: 爱可可-爱生活

知名互联网资讯博主北邮PRIS模式识别实验室陈老师

目录

相关文章推荐

爱可可-爱生活 · 本文揭示了看似信息冗余的 RLHF ... · 昨天

新智元 · 三位女数学家的学术接力！开创者是首位女性菲尔 ... · 昨天

爱可可-爱生活 · [CL]《Improving ... · 3 天前

爱可可-爱生活 · 本文创新性地揭示了验证、回溯等认知行为是驱动 ... · 3 天前

新智元 · 苹果最强M3 ... · 3 天前

51好读 › 专栏 › 爱可可-爱生活

LADDER：LLM自我进阶的递归问题分解法查看图片 //@-20250309073928

爱可可-爱生活 · 微博 · AI · 2025-03-09 07:39

正文

2025-03-09 07:39
本条微博链接

LADDER：LLM自我进阶的递归问题分解法

查看图片 // @爱可可-爱生活 :本文提出了 LADDER 和 TTRL 框架，通过递归问题分解和强化学习，使大型语言模型能够自主生成学习课程并动态提升数学积分能力，在 MIT Integration Bee 资格赛中取得了超越人类和更大规模模型的 SOTA 成绩，展示了自主学习和测试时计算扩展在提升 AI 能力方面的巨大潜力。

[LG]《LADDER: Self-Improving LLMs Through Recursive Problem Decomposition》T Simonds, A Yoshiyama [Tufa Labs] (2025)

请到「今天看啥」查看全文

推荐文章

爱可可-爱生活 · 本文揭示了看似信息冗余的 RLHF 在语言模型微调中超越离线方法-20250309055551

昨天

新智元 · 三位女数学家的学术接力！开创者是首位女性菲尔兹奖得主，40岁英年早逝

昨天

爱可可-爱生活 · [CL]《Improving LLM-as-a-Judge In-20250307054006

3 天前

爱可可-爱生活 · 本文创新性地揭示了验证、回溯等认知行为是驱动语言模型自我提升的关-20250307055458

3 天前

新智元 · 苹果最强M3 Ultra首发逆天，512GB「桌面超算」在家跑DeepSeek-R1！

3 天前

利维坦 · 猫的道德成本

8 年前

占豪 · 震惊：如果把全部决定权交给公众，那么离死也就不远了

8 年前

人民日报 · 【荐读】他六十年不选院士、不发论文，到底有什么更重要的事业？

7 年前

投资银行在线 · 32岁那年，她认识了65岁的李嘉诚

7 年前

南国都市报 · 爱吃大蒜的海南人注意了！赶紧看看，很多人还不知道（视频）

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!