专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

目录

相关文章推荐

新智元 · 「文心一言免费」引爆热搜，百度涨超10%！深 ... · 2 天前

机器之心 · 哥德尔-Prover超过DeepSeek-P ... · 2 天前

宝玉xp · Sam Altman 说会为 ... · 2 天前

新智元 · 8块A100，32B碾压DeepSeek ... · 3 天前

机器之心 · 8卡32B模型超越o1预览版、DeepSee ... · 3 天前

51好读 › 专栏 › 量子位

DeepSeek缝合Claude，比单用R1/o1效果都好！GitHub揽星3k

量子位 · 公众号 · AI · 2025-02-14 14:02

正文

梦晨西风发自凹非寺
量子位 | 公众号 QbitAI

让 DeepSeek代替Claude思考 ，缝合怪玩法火了。

原因无它：比单独使用DeepSeek R1、Claude Sonnet 3.5、OpenAI o1模型的 效果更好 。

先来看一段VCR：

再来看一个测评结果：

在代 码编辑基准 Polyglot Benchmark上，缝合模型效果小超o1-high和R1一头。

在这个测试中， R1扮演架构师 ，描述如何解决代码问题。

而 Claude扮演程序员 ，按要求生成特定的代码编辑指令，以便把改动应用到源文件中。

除此之外，实验过程中还得出还有几个有意思的结论：

o1与Claude Sonnet搭配 效果并不如单独使用o1。
使用R1或o1当架构师， Claude之外的其他模型当程序员 ，效果都不如单独使用R1或o1。
但 o1-preview和o1-mini当架构师 ，使用很多不同的模型当程序员都能提高组合的成绩。
使用R1的推理过程token效果 不如使用R1的最终输出token。

这样看来，R1和Claude Sonnet还真是一对绝配啊～

DeepClaude应用本身100%免费且开源，在GitHub上已揽获3k星星（当然API要用自己的）。

网友测试后总结到：Claude擅长撰写清晰、结构良好的文本和代码，因此它能将DeepSeek-R1的想法转化为精炼的回复。

DeepClaude作者之一对此有感而发：

AI智能体和智能体应用正在展示出一种“数字世界优先”的范式转变，智能系统正在成为主动的合作者，而不仅仅是被动的工具。

DeepSeek和Claude的混血儿

具体来说，DeepClaude是一个LLM推理API，通过Rust编写。

它提供了一个统一的接口，将DeepSeek R1的CoT逻辑推理能力和Claude的回复 在单一流中无缝衔接 。

开发者可以通过这个API同时调用两种模型的功能，还能完全掌控自己的API密钥和数据。

打造它的团队名为 Asterisk ，团队成员具有安全研究&CTF （Capture The Flag）背景，致力于利用AI让检查代码安全这事儿变得更加高效。

团队认为，DeepSeek R1的CoT深度推理甚至达到了LLM具有反省认知（metacognition）的程度，它能够自我纠正、思考不常见/极端/特殊的情况，并在自然语言中进行类似蒙特卡洛树搜索（MCTS）的推理。

不过R1在代码生成、创造力和对话技巧方面有所欠缺，Claude 3.5 Sonnet在这些方面表现出色，刚好可以作补充。

何不将两者结合起来？取两者之长，打造出DeepClaude～

对话中，Claude回应之前，系统会显示“ ”这样的预填充文本。

DeepClaude结合了这两种模型，具有以下特性：

托管API完全免费，允许用户使用自己的密钥，并将DeepSeek和Claude的流式API整合在一起，提供计算组合使用量和价格等便利功能。

代码是开源的，用户可以自由托管、修改和重新分发。团队表示它已经在Asterisk的生产环境中大规模使用，每天处理数百万token，至今尚未出现故障，只要不滥用就行。

One More Thing

你以为两个模型缝合就是极限了吗？

No no no

请到「今天看啥」查看全文

推荐文章

新智元 · 「文心一言免费」引爆热搜，百度涨超10%！深度搜索刚出炉用哪吒2秒测

2 天前

机器之心 · 哥德尔-Prover超过DeepSeek-Prover，陈丹琦团队造出当前最强形式化推理模型

2 天前

宝玉xp · Sam Altman 说会为 ChatGPT Plus 用户提供-20250213000306

2 天前

新智元 · 8块A100，32B碾压DeepSeek V3、o1-preview！普林斯顿北大首提分层RL推理

3 天前

机器之心 · 8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

3 天前

公路商店 · DADA门口的煎饼果子你们觉得好吃吗？

8 年前

中国知识产权报 · 互联网百科类服务方便好用，可是互联网百科的著作权该如何保护？

7 年前

中信建投证券研究 · 【地产】土地供给侧改革下的年中投资思考

7 年前

北京吃货小分队 · 在五道口,吃饭等于排队

7 年前

INSIGHT视界 · 她整容13次，隆鼻、抽脂、切胃：我挨的每一刀，都是生活的底气

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!