杭州深度求索发布能挑战 OpenAI o1 的推理模型 DeepSeek R1

奇客Solidot · 公众号 · · 2025-01-23 22:45

正文

杭州深度求索在 MIT 许可证下发布了能挑战 OpenAI o1 的推理模型 DeepSeek R1。R1 系列模型包括 DeepSeek-R1-Zero 和 DeepSeek-R1，其最大版本有 6710 亿个参数，深度求索称在数学和编程测试中的表现与 OpenAI 的 o1 simulated reasoning(SR)模型相当。深度求索同时发布了六个规模较小的版本 DeepSeek-R1-Distill，参数规模从 15 亿到 700 亿，其中参数规模最小的版本能在笔记本上运行，完整版本则需要更多计算资源。深度求索称 R1 在 AIME（数学推理测试）、MATH-500（文字问题集）和 SWE-bench Verified（编程评估工具）中的表现优于 OpenAI 的 o1。

https://github.com/deepseek-ai/DeepSeek-R1

https://arstechnica.com/ai/2025/01/china-is-catching-up-with-americas-best-reasoning-ai-models/

NVIDIA GTC 2025 早鸟票折扣福利，免费加入NVIDIA初创加速计划即可享受

NVIDIA初创加速计划是NVIDIA为全球创业公司打造的加速平台，旨在为创新企业提供全方位的支持。在中国，已有超过千家创业公司加入，并获得融资机会、客户对接、路演展示、技术支持、市场推广，以及NVIDIA软硬件产品折扣等独家资源支持。现在免费申请加入，还有机会获得 GTC25 早鸟票折扣，点击链接或者扫描即可免费申请加入。

免费申请通道：https://jinshuju.net/f/SsRLbl?x_field_1=solidot