专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  本文揭示了看似信息冗余的 RLHF ... ·  昨天  
爱可可-爱生活  ·  [CL]《Improving ... ·  3 天前  
新智元  ·  苹果最强M3 ... ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

LADDER:LLM自我进阶的递归问题分解法 查看图片 //@-20250309073928

爱可可-爱生活  · 微博  · AI  · 2025-03-09 07:39

正文

2025-03-09 07:39

LADDER:LLM自我进阶的递归问题分解法 查看图片 // @爱可可-爱生活 :本文提出了 LADDER 和 TTRL 框架,通过递归问题分解和强化学习,使大型语言模型能够自主生成学习课程并动态提升数学积分能力,在 MIT Integration Bee 资格赛中取得了超越人类和更大规模模型的 SOTA 成绩,展示了自主学习和测试时计算扩展在提升 AI 能力方面的巨大潜力。
[LG]《LADDER: Self-Improving LLMs Through Recursive Problem Decomposition》T Simonds, A Yoshiyama [Tufa Labs] (2025)






请到「今天看啥」查看全文