专栏名称: 橘子汽水铺
橘子汽水铺 by orange.ai。 AI创始人, AI投资人,AI产品经理都在关注的AI科技自媒体。 聚焦最有商业价值的AI资讯,分享一线的AI产品经理经验。
目录
相关文章推荐
四川大学本科招生  ·  寒假,川大的你,在哪里,有什么故事? ·  昨天  
四川大学本科招生  ·  寒假,川大的你,在哪里,有什么故事? ·  昨天  
兰州大学萃英在线  ·  年味变淡?我们何去何从 ·  2 天前  
浙江大学  ·  大换装!跟浙大一起迎接春天! ·  3 天前  
武汉大学  ·  武大 bot!没上春晚扭秧歌,但和省长握手了 ·  2 天前  
兰州大学萃英在线  ·  一夜鱼龙舞 ·  4 天前  
51好读  ›  专栏  ›  橘子汽水铺

DeepSeek R1 满血版云端部署指南

橘子汽水铺  · 公众号  ·  · 2025-02-04 16:57

正文

这个春节,DeepSeek R1 出圈,DAU 直接突破 1000 万,达到了 ChatGPT 的 23% 的水平。

春节假期都快过去了,DeepSeek 官网依然是各种「服务器繁忙,请稍后再试」,大家对 R1 的需求实在是太强太强了。

可以预料到的是,开工之后,企业客户对 R1 模型的需求也会爆发性增长,而在相当长的一段时间里难以满足,满满的都是商机。

好在 R1 是个开源模型,腾讯云在2月2号就支持了 R1 各个版本的一键部署。

今天就以腾讯云为例,为大家介绍一下 DeepSeek R1 满血版的云端部署指南。

不管是公司自用,还是为客户提供服务,都值得参考。

R1 满血版和蒸馏版的区别

首先要讲一下为什么 R1 会分为满血版和蒸馏版。

R1 满血版 ,就是 671B 版本,通过 RL 训练出来的,也就是 DeepSeek 官网提供的版本,模型能力达到了 o1 水平,模型部署的硬件要求也很高。

R1 蒸馏版 ,是1.5B到70B之间的数个版本,是 DeepSeek 为了研究 RL 泛化能力而基于 Qwen 和 Llama 的开源模型,用 SFT 蒸馏出来的版本,模型能力虽然不如满血版,但 模型指标上在同规模的开源模型里也是非常领先的。 而且蒸馏版的好处是对硬件要求要低很多,推理成本也低很多。

几个蒸馏版本模型的具体的指标见下表:

请大家根据自己的实际情况选择适合自己的版本。

DeepSeek R1 的部署流程

了解完 R1 满血版和蒸馏版的区别, 接下来让我们一起来看看具体的部署流程吧。

1.首先打开腾讯云TI平台

网址: https://cloud.tencent.com/product/ti

打开网址后,点击首页的【立即使用】

2.在点击之后就会跳到大模型广场,找到 DeepSeek 系列模型

3.打开 DeepSeek 系列模型之后,就会看到详细的模型介绍。

点击【新建在线服务】,开始创建服务。

(在模型介绍旁边,分别放了 R1 满血版和 R1 蒸馏版的体验入口。在部署之前,可以先通过这两个入口直接聊天,体验 R1 的不同版本的模型效果。)

4.在创建服务页面,要选择模型和算力配置

如果是部署蒸馏版 R1,比如 1.5B 版本,算力只需要选择中端GPU卡 12C44GB。机器可以直接选择“从TIONE平台购买”,然后选择“按量计费”模式。

如果是部署满血版 R1,由于其具有超大的671B参数规模,需要选择2台 HCCPNV6机型。

这里问了下客服,HCCPNV6 机型需要联系销售,才可以从腾讯云CVM处下单购买。然后,在 TIONE 这里选择“从CVM机器中选择”,并挂到平台上使用。


5.完成配置,开始调用

配置完成后,等几分钟,就能看到服务跑起来了,这时候就可以用调用部署好的模型服务了。

6.获取调用地址

点击调用,可以打开【服务调用】页面,可以看到【调用地址】,复制这个地址备用。

调用自己部署的 R1 模型

R1 模型部署完成后,我们就可以调用了。

接下来我们以 Cherry Studio 为例,看一下如何调用自己部署的模型,使用其他产品,如 ChatBox 的流程也是类似的。

1.首先,下载模型套壳软件

电脑端建议 Chery Studio

下载地址: https://cherry-ai.com/download

移动端可选择 ChatBox

下载地址: https://chatboxai.app/en#download

2.设置,添加服务提供商

点击左下角齿轮图标,打开设置,在模型服务最下方,点击【添加】按钮,填写名称,类型选择 【OpenAI】。

3.配置服务信息







请到「今天看啥」查看全文