专栏名称: 小众软件
除了让你的手机应用与众不同外,还能搜索小众软件已经推荐过的应用、热文。
目录
相关文章推荐
小众软件  ·  又来新开源字体了:中英文完美 ... ·  23 小时前  
APPSO  ·  折叠 iPhone 曝光:无折痕设计,为 ... ·  2 天前  
小众软件  ·  广告拦截工具 AdGuard 买断版限时 38 折 ·  3 天前  
APPSO  ·  实测 Manus :我用它生成了 10 ... ·  4 天前  
51好读  ›  专栏  ›  小众软件

国产新模型 DeepSeek-R1 发布,可商用授权,比肩 OpenAI o1 正式版

小众软件  · 公众号  · app  · 2025-01-21 21:00

主要观点总结

DeepSeek发布了最新的DeepSeek-R1模型,性能与OpenAI o1相当,采用MIT授权,可商业使用并支持模型蒸馏。该模型在数学、代码、自然语言推理等任务上表现优秀,并且提供API服务定价。模型蒸馏是一种将大型复杂模型的知识转移到小型简单模型中的技术。DeepSeek-R1可以在GitHub上获取,并且已经可以从HuggingFace下载。该模型可以在DeepSeek官网和App上调用,完成各类推理任务。

关键观点总结

关键观点1: DeepSeek-R1模型的发布

DeepSeek发布了最新的DeepSeek-R1模型,性能与OpenAI o1相当,可商业使用并支持模型蒸馏。

关键观点2: DeepSeek-R1模型的性能

DeepSeek-R1在数学、代码、自然语言推理等任务上表现优秀。

关键观点3: DeepSeek-R1模型的定价

DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元。

关键观点4: 模型蒸馏技术

模型蒸馏是一种将大型复杂模型的知识转移到小型简单模型中的技术,包括教师模型和学生模型的概念。

关键观点5: DeepSeek-R1模型的获取和使用

DeepSeek-R1可以在GitHub上获取,并且已经可以从HuggingFace下载。该模型可以在DeepSeek官网和App上调用,完成各类推理任务。


正文

DeepSeek 在昨晚 发布 了最新的 DeepSeek-R1 模型,性能比肩行业标杆 OpenAI o1,并且采用宽松的 MIT 授权,可以商业使用,允许模型蒸馏。@Appinn

省流版

1️⃣ 采用 MIT 授权,允许模型蒸馏。

2️⃣ 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版(如图1)

3️⃣ 蒸馏小模型超越 OpenAI o1-mini

4️⃣ 价格(如图2)

DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。

什么是模型蒸馏?

模型蒸馏(Model Distillation)是一种深度学习中的技术,旨在通过将大型复杂模型(通常称为教师模型)的知识转换为较小的简单模型(称为学生模型)中,从而实现模型的压缩和性能提升。

  • 教师模型 :这是一个经过充分训练的大型模型,通常在某个任务上表现优异,但计算资源消耗较大。

  • 学生模型 :这是一个较小的模型,设计上更轻量化,适合在资源有限的环境中运行。

DeepSeek-R1 在哪?

DeepSeek-R1 在 GitHub 发布,并且模型文件已经可以从 HuggingFace 下载

  • https://github.com/deepseek-ai/DeepSeek-R1

群里的小伙伴已经纯 CPU 跑起来了:

App 与网页

目前在 DeepSeek 官网和 App,打开“深度思考”模式,就可以调用最新版 DeepSeek-R1 完成各类推理任务了。







请到「今天看啥」查看全文