专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

DeepSeek 推理模型预览版上线，解密 o1 推理过程

深度学习自然语言处理 · 公众号 · · 2024-11-20 22:49

正文

今天，DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。

所有用户均可登录官方网页（ chat.deepseek.com），一键开启与 R1-Lite 预览版模型的超强推理对话体验。

DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。

该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

DeepSeek-R1-Lite 预览版模型在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，均取得了卓越的成绩，大幅超越了 GPT-4o 等知名模型。
下表为 DeepSeek-R1-Lite 在各项相关评测中的得分结果：

DeepSeek-R1-Lite 的推理过程长，并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。

“深度思考” 模式专门针对数学、代码等各类复杂逻辑推理问题而设计，相比于普通的简单问题，能够提供更加全面、清晰、思路严谨的优质解答，充分展现出较长思维链的更多优势。

上下滑动，查看更多

上下滑动，查看更多

推荐文章

SellerGuard · 低成本为亚马逊链接构筑一道保护防线，他们这样做！

昨天

SellerGuard · 低成本为亚马逊链接构筑一道保护防线，他们这样做！

昨天

数据何规 · 韩国通报DeekSeek调查进展

昨天

长江日报 · 离谱！武汉多个小区已出现，“回个家都难”

2 天前

长江日报 · 离谱！武汉多个小区已出现，“回个家都难”

2 天前

文案包邮 · deepseek完整版教程.pdf

2 天前

青岛日报 · 刚刚，DeepSeek回应！

3 天前

青岛日报 · 刚刚，DeepSeek回应！

3 天前

混沌巡洋舰 · 关于学习技艺的一些思考

7 年前

武了个汉 · 马拉松观赛现场上演摸金粽子追逐戏！这是莫斯尖板眼？

7 年前

厦门日报 · 别拦我！翔安新圩的这些手工美食，每种都好想吃~

7 年前

米筐投资 · 这次调控的还是房子？错！错！错！是预期！

7 年前

林奇 · 我的炒股神器来了

7 年前