蛇年春节前夕,DeepSeek以极快的速度火爆全网。DeepSeek创立于2023年5月,于2023年11月发布了第一个开源模型DeepSeek Coder,主要用于编程用途。2024年5月DeepSeek-V2上线,2024年12月DeepSeek-V3发布,即现在的671B模型。在过去很长的一段时间,DeepSeek主要是大模型价格战的发起者角色,并没有引起现在这么多的关注。
DeepSeek火爆全网的主因是,2025年1月20日发布的DeepSeek-R1,是绝大多数普通人所接触的第一款推理模型。2024年9月13日,OpenAI发布O1模型,这是第一个具备真正通用推理能力的大模型,但是只向pro用户开放,pro用户是200刀/月,尤其考虑到国内无法付费,因此绝大多数普通人并没有接触过O1。
因此推理模型DeepSeek-R1带给人们的很大的震撼,包括美国人,毕竟美国人每个月愿意负担200刀的也不多。有很多朋友反馈,春节期间每到晚上,DeepSeek就开始变的卡顿,有一种可能是是美国人开始大量使用了。
由于推理模型的特性,使得推理模型可以很大程度上,替代过去由人承担的Prompt工程的角色,这就使得将DeepSeek与其他大语言模型进行组合使用成为可能。
比如说,Github上最近有个项目getAsterisk/deepclaude或者ErlichLiu/DeepClaude,就是将DeepSeek与Claude结合起来,由DeepSeek对问题进行分析,并给出大纲和思路,然后由Claude来撰写。根据开发者的测试,这种简单的组合,其效果就超过O1和R1,显示出了大模型组合使用的效力。
但是很可惜,上述两个项目,都需要Anthropic的官方API,这是我们无法获得的,也就无法直接使用。
那么能否改成DeepSeek-R1 + DeepSeek-V3呢?这需要我们对Github的开源项目源码进行重写。笔者看了一下,前者是用Rust语言,后者使用Python,这都不是简单实现的。
不过还有一个便捷的解决方案,就是使用Coze或者Dify这种大语言模型(LLM)应用开发平台。以Dify为例,其模型设置部分,继承了各种主流大模型,包括OpenAI,Claude,DeepSeek,Gemini等,也可以使用本地部署的大模型,也可以使用SiliconFlow或者OpenRouter这种大模型API中转平台。
我们可以在Dify中可以搭建一个很简单的工作流,把DeepSeek-R1与Sonnet-20241022串联起来,就可以实现了deepclaude功能。
从输出结果看,我们以“美国额外加征关税对中国经济的影响”为题做测试,从结果看,首先输出DeepSeek撰写的大纲,然后是Sonnet撰写的文章,应该说,效果还是不错的。
另外,也有很多人提出,DeepSeek有大模型幻觉问题,为了使得使得结果更加精准,我们可以在DeepSeek和Claude之间加入一个GoogleSearch接口,相当于,DeepSeek给出提纲,GoogleSearch搜索文章,Claude基于搜索的资料撰写,就更精准,具体实现方式笔者就不赘述了。
总的来说,Dify这种平台,使得非计算机方向的人也可以便捷的搭建自己的大模型组合,我们可以自己设计提示词,自己设计流程,自己设计模块,自己调试流程,使得更个性化、性能更强大的专属大模型变成可能,想象力、创造力变得越来越重要。