专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
中核集团  ·  中核集团一周要闻上新! ·  昨天  
中核集团  ·  卓越绩效大家谈⑥ ·  昨天  
兰州大学萃英在线  ·  图说 | 新学期,I'm ready! ·  昨天  
兰州大学萃英在线  ·  月台 | 吾心若安 何日非“年”? ·  2 天前  
四川大学  ·  川大新学期,昂扬起航! ·  昨天  
四川大学  ·  川大新学期,昂扬起航! ·  昨天  
51好读  ›  专栏  ›  歸藏的AI工具箱

DeepSeek 正式开源 DeepSeek-R1 推理模型#A-20250120212307

歸藏的AI工具箱  · 微博  ·  · 2025-01-20 21:23

正文

2025-01-20 21:23

DeepSeek 正式开源 DeepSeek-R1 推理模型 #AI创造营# #ai#

他们自己测出来跟O1正式版差不多

还自己蒸馏了几个小模型,成绩跟 O1-mini 差不多

遵循 MIT License,允许通过蒸馏 R1 训练其他模型

DeepSeek-R1-Zero 和 DeepSeek-R1 两个模型 660B 大小

通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区

最小的有才 1.5B,最大的 70B

DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。

同时DeepSeek-R1 训练技术全部公开: 网页链接

模型下载: 网页链接






请到「今天看啥」查看全文