专栏名称: 橘子汽水铺
橘子汽水铺 by orange.ai。 AI创始人, AI投资人,AI产品经理都在关注的AI科技自媒体。 聚焦最有商业价值的AI资讯,分享一线的AI产品经理经验。
目录
相关文章推荐
军武次位面  ·  每日囧图丨我想知道女生那边写的是什么 ·  2 天前  
青眼号外  ·  2025,美妆“首店潮”加速! ·  昨天  
大庆晚报  ·  不要捡!不要捡!已有悲剧发生 ·  3 天前  
51好读  ›  专栏  ›  橘子汽水铺

深夜重磅!DeepSeek 新模型,多项指标超越 o1,即将全面开源

橘子汽水铺  · 公众号  ·  · 2024-11-20 20:54

正文

就在刚刚,DeepSeek 放出超重磅全新模型!

  • 模型名称:DeepSeek-R1-Lite 预览版

  • 新模型直接对标 OpenAI o1

  • 在数学、代码、复杂逻辑推理方面, 实际效果媲美 o1-preview

  • 使用强化学习训练,推理过程包含大量反思和验证

  • 思维链可达上万字 ,并且不藏着掖着,全部为用户展示

模型特色

这是第一次,我们能看到思维链的实际效果 ,是不是很有意思?


DeepSeek R1 Lite 模型在 AIME 、 MATH、Codeforces 指标中,竟然还超过了 o1-preview


DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。下图展示了模型在 数学竞赛上的得分与测试所允许思考的长度紧密相关。 红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关;相比传统的多次采样+投票(Majority Voting),模型思维链长度增加展现出了更高的效率。

模型体验

目前 DeepSeek-R1-Lite  模型已经上线到官网网站

打开「深度思考」即可体验 ,每天限量50次。

https://chat.deepseek.com/


大家可以多测测效果 如果这么快就能追平 OpenAI o1 preview 那 OpenAI 真的没什么壁垒

而且 o1 的价格辣么贵

开源会给它彻底打下来!

后续计划,完全开源!

这个模型这么强,然而它只是个前菜!







请到「今天看啥」查看全文