专栏名称: 爱可可-爱生活

知名互联网资讯博主北邮PRIS模式识别实验室陈老师

相关文章推荐

爱可可-爱生活 · 【Xyne：AI驱动的开源工作搜索与问答引擎 ... · 昨天

量子位 · 本科生颠覆姚期智40年前猜想！意外发现新型哈 ... · 昨天

黄建同学 · Tom ... · 2 天前

量子位 · 港大字节最新视频生成模型刷屏！网友直接RIP ... · 2 天前

爱可可-爱生活 · 【Aperture：可视化Stable ... · 2 天前

51好读 › 专栏 › 爱可可-爱生活

[CL] DeepSeek-Prover-V1.5: Harne-20240817063506

爱可可-爱生活 · 微博 · AI · 2024-08-17 06:35

正文

[CL] DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search

网页链接
提出了DeepSeek-Prover-V1.5模型，通过预训练、监督微调、强化学习和蒙特卡罗树搜索，在Lean 4定理证明任务上取得了新的最优结果。

推荐文章

爱可可-爱生活 · 【Xyne：AI驱动的开源工作搜索与问答引擎，让你的工作信息碎片-20250211214337

昨天

量子位 · 本科生颠覆姚期智40年前猜想！意外发现新型哈希表，数据搜索速度突破理论上限

昨天

黄建同学 · Tom Yeh教授的DeepSeek专门讲座视频↓（就是那个用e-20250210182243

2 天前

量子位 · 港大字节最新视频生成模型刷屏！网友直接RIP市场营销，Sora也不香了

2 天前

爱可可-爱生活 · 【Aperture：可视化Stable Diffusion注意力-20250210134112

2 天前

影视大魔王 · 道理我都懂，可为什么邓超叫彭于晏“爸”？

8 年前

相约新会 · 【美翻了】除了交山林场，罗坑又多一处赏樱胜地！就在……

7 年前

跟大厨学做菜 · 三高最怕的一种食物！击退血栓，强心脏...可惜很多人不知道

7 年前

三剑客 · 「看剑」战友有话说：休个假怎么了？

7 年前

摄影笔记 · 手机摄影，也要调光圈快门吗？ | 一点观点

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!