关于 DeepSeek 组合使用的一点体会

Rick笔记 · 公众号 · · 2025-02-04 22:09

正文

请到「今天看啥」查看全文

蛇年春节前夕，DeepSeek以极快的速度火爆全网。DeepSeek创立于2023年5月，于2023年11月发布了第一个开源模型DeepSeek Coder，主要用于编程用途。2024年5月DeepSeek-V2上线，2024年12月DeepSeek-V3发布，即现在的671B模型。在过去很长的一段时间，DeepSeek主要是大模型价格战的发起者角色，并没有引起现在这么多的关注。

DeepSeek火爆全网的主因是，2025年1月20日发布的DeepSeek-R1，是绝大多数普通人所接触的第一款推理模型。2024年9月13日，OpenAI发布O1模型，这是第一个具备真正通用推理能力的大模型，但是只向pro用户开放，pro用户是200刀/月，尤其考虑到国内无法付费，因此绝大多数普通人并没有接触过O1。

因此推理模型DeepSeek-R1带给人们的很大的震撼，包括美国人，毕竟美国人每个月愿意负担200刀的也不多。有很多朋友反馈，春节期间每到晚上，DeepSeek就开始变的卡顿，有一种可能是是美国人开始大量使用了。

由于推理模型的特性，使得推理模型可以很大程度上，替代过去由人承担的Prompt工程的角色，这就使得将DeepSeek与其他大语言模型进行组合使用成为可能。

比如说，Github上最近有个项目getAsterisk/deepclaude或者ErlichLiu/DeepClaude，就是将DeepSeek与Claude结合起来，由DeepSeek对问题进行分析，并给出大纲和思路，然后由Claude来撰写。根据开发者的测试，这种简单的组合，其效果就超过O1和R1，显示出了大模型组合使用的效力。

但是很可惜，上述两个项目，都需要Anthropic的官方API，这是我们无法获得的，也就无法直接使用。

那么能否改成DeepSeek-R1 + DeepSeek-V3呢？这需要我们对Github的开源项目源码进行重写。笔者看了一下，前者是用Rust语言，后者使用Python，这都不是简单实现的。

不过还有一个便捷的解决方案，就是使用Coze或者Dify这种大语言模型（LLM）应用开发平台。以Dify为例，其模型设置部分，继承了各种主流大模型，包括OpenAI，Claude，DeepSeek，Gemini等，也可以使用本地部署的大模型，也可以使用SiliconFlow或者OpenRouter这种大模型API中转平台。

我们可以在Dify中可以搭建一个很简单的工作流，把DeepSeek-R1与Sonnet-20241022串联起来，就可以实现了deepclaude功能。

从输出结果看，我们以“美国额外加征关税对中国经济的影响”为题做测试，从结果看，首先输出DeepSeek撰写的大纲，然后是Sonnet撰写的文章，应该说，效果还是不错的。

另外，也有很多人提出，DeepSeek有大模型幻觉问题，为了使得使得结果更加精准，我们可以在DeepSeek和Claude之间加入一个GoogleSearch接口，相当于，DeepSeek给出提纲，GoogleSearch搜索文章，Claude基于搜索的资料撰写，就更精准，具体实现方式笔者就不赘述了。

总的来说，Dify这种平台，使得非计算机方向的人也可以便捷的搭建自己的大模型组合，我们可以自己设计提示词，自己设计流程，自己设计模块，自己调试流程，使得更个性化、性能更强大的专属大模型变成可能，想象力、创造力变得越来越重要。