DeepSeek 正式开源 DeepSeek-R1 推理模型
#AI创造营#
#ai#
他们自己测出来跟O1正式版差不多
还自己蒸馏了几个小模型,成绩跟 O1-mini 差不多
遵循 MIT License,允许通过蒸馏 R1 训练其他模型
DeepSeek-R1-Zero 和 DeepSeek-R1 两个模型 660B 大小
通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区
最小的有才 1.5B,最大的 70B
DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。
同时DeepSeek-R1 训练技术全部公开: 网页链接
模型下载: 网页链接
他们自己测出来跟O1正式版差不多
还自己蒸馏了几个小模型,成绩跟 O1-mini 差不多
遵循 MIT License,允许通过蒸馏 R1 训练其他模型
DeepSeek-R1-Zero 和 DeepSeek-R1 两个模型 660B 大小
通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区
最小的有才 1.5B,最大的 70B
DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。
同时DeepSeek-R1 训练技术全部公开: 网页链接
模型下载: 网页链接