[LG] Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models
网页链接
本文综述了大型语言模型推理能力的最新进展,强调了“思考”概念的引入、强化学习的应用、测试时扩展的潜力、过程奖励模型的作用以及高质量推理数据的重要性,并指出了该领域未来研究的多个关键方向。
网页链接
本文综述了大型语言模型推理能力的最新进展,强调了“思考”概念的引入、强化学习的应用、测试时扩展的潜力、过程奖励模型的作用以及高质量推理数据的重要性,并指出了该领域未来研究的多个关键方向。