专栏名称: 深度学习自然语言处理
一个从大三就接触NLP的小小NLPer,本公众号每天记录自己的一点一滴,每篇文章最后也有托福单词等新知识,学技术同时,也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇!
目录
相关文章推荐
数据何规  ·  韩国通报DeekSeek调查进展 ·  昨天  
文案包邮  ·  deepseek完整版教程.pdf ·  2 天前  
青岛日报  ·  刚刚,DeepSeek回应! ·  3 天前  
青岛日报  ·  刚刚,DeepSeek回应! ·  3 天前  
51好读  ›  专栏  ›  深度学习自然语言处理

DeepSeek 推理模型预览版上线,解密 o1 推理过程

深度学习自然语言处理  · 公众号  ·  · 2024-11-20 22:49

正文

今天,DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。
所有用户均可登录官方网页 ( chat.deepseek.com) ,一键开启与 R1-Lite 预览版模型的超强推理对话体验。
DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。
该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。

全面提升的推理性能

  • DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,均取得了卓越的成绩,大幅超越了 GPT-4o 等知名模型。

  • 下表为 DeepSeek-R1-Lite 在各项相关评测中的得分结果:

深度思考的效果与潜力

DeepSeek-R1-Lite 的推理过程长,并且包含了大量的反思和验证。下图展示了模型在数学竞赛上的得分与测试所允许思考的长度紧密相关。
  • 红色实线展示了模型所能达到的准确率与所给定的推理长度呈正相关;

  • 相比传统的多次采样+投票(Majority Voting),模型思维链长度增加展现出了更高的效率。

全面上线,尝鲜体验

登录 chat.deepseek.com ,在输入框中选择 “深度思考” 模式,即可开启与 DeepSeek-R1-Lite 预览版的对话。
“深度思考” 模式专门针对数学、代码等各类复杂逻辑推理问题而设计,相比于普通的简单问题,能够提供更加全面、清晰、思路严谨的优质解答,充分展现出较长思维链的更多优势。
  • 对话开启示例:

  • 适用场景与效果示例:


上下滑动,查看更多


上下滑动,查看更多

新的开始,敬请期待







请到「今天看啥」查看全文