专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  【Xyne:AI驱动的开源工作搜索与问答引擎 ... ·  昨天  
黄建同学  ·  Tom ... ·  2 天前  
爱可可-爱生活  ·  【Aperture:可视化Stable ... ·  2 天前  
51好读  ›  专栏  ›  爱可可-爱生活

[CL] DeepSeek-Prover-V1.5: Harne-20240817063506

爱可可-爱生活  · 微博  · AI  · 2024-08-17 06:35

正文

2024-08-17 06:35

[CL] DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search
网页链接
提出了DeepSeek-Prover-V1.5模型,通过预训练、监督微调、强化学习和蒙特卡罗树搜索,在Lean 4定理证明任务上取得了新的最优结果。






请到「今天看啥」查看全文