【[465星]AutoDidact:旨在通过强化学习和自我验证的自主学习系统,让小模型也能自主学习和研究的强化学习项目。亮点:1. 仅用单张RTX 4090即可运行,成本极低;2. 通过自我提问和验证,模型准确率从23%提升至53%;3. 完全开源,支持本地运行,无需依赖外部服务】
'Autonomously train research-agent LLMs on custom data using reinforcement learning and self-verification.'
'Autonomously train research-agent LLMs on custom data using reinforcement learning and self-verification.'