专栏名称: 知乎日报
提供最好的资讯评论,兼顾专业与趣味。
目录
相关文章推荐
知乎日报  ·  知乎会被 DeepSeek ... ·  21 小时前  
Quora文选英语  ·  老外说𝒉𝒊𝒕 𝒎𝒆 ... ·  昨天  
知乎日报  ·  知乎直答为什么接入满血版 ... ·  昨天  
知乎日报  ·  知乎直答接入满血版 ... ·  2 天前  
51好读  ›  专栏  ›  知乎日报

知乎会被 DeepSeek 取代吗?如今大火的几个大模型到底谁更聪明?

知乎日报  · 公众号  · 问答  · 2025-02-14 21:00

正文

点击上方卡片关注👆

近日 ,知乎 AI 搜索产品知乎直答正式接入「满血版」DeepSeek R1! 在社区优质内容、专业知识库基础之上,全面升级了推理能力,为你带来全新的 AI 搜索体验。

知乎会被 DeepSeek 取代吗?如今大火的几个大模型到底谁更聪明?一起来看看答主的回答吧。



知乎直答接入满血版 DeepSeek-R1,体验感如何?好不好用?


| 答主: 苏洋

早晨用知乎直答的时候,非常好用,模型回答爽快,逻辑靠谱!不过,此刻的直答应该负载压力很大,变的有些卡了,我建议等这两天的热度下去点,再使用体感会更好些。

能力验证,没有什么比实际应用更直观,我们用知乎直答来回答一个之前被邀请但没回答的帖子内容—— 知乎会被 DeepSeek 取代吗?

作为对比,我会将 ChatGPT Pro、Claude Pro、DeepSeek R1、朋友的 DeepSeek R1 满血版、腾讯云 DeepSeek 都贴上来作为对比。



知乎直答


首先测试的选手是知乎直答(2025 年 2 月 11 日晚上的卡顿版)


准备提问

打开直答后,在界面中勾选「深度思考」,启用 reason thinking 模式。

然后,对他提问,将上面测试问题中的题目和描述不做任何修改,直接粘贴到模型里。


等待回答

回答的过程中,能够看到首先会搜索相关的问题,然后将相关内容(社区用户投票出的好的结果)和来自外部的少量内容一起塞给模型。

点开内容详情,可以看到主要补充的内容都是站内的,也补充了一些站外的内容。


生成结果

我个人觉得回答的挺好的,给出了很多带例子的答案,相比模型很多时候空对空,让我觉得踏实不少。并且,能够帮助我快速「去水」掉上面各路答案中的「知识点」之外的内容,阅读效率上有了不少提升。


不足

我还挺想知道这些观点对应的答主是谁,能不能把他们 at 出来,有的好的观点的答主是值得关注,和期待他接下来的其他思考和分享的。以及,有一些我过滤掉的答主,能不能在总结的时候,去掉他的比较营销感的内容。


其他

去年的时候,大家觉得模型会单纯吸血知乎社区原有的生态和内容,现在看起来「补充提问」(AI 生成的建议问题,和下面的一键向人提问),应该也对知乎社区起到了输血作用,可以提供更高质量的问题。

问 AI 问完了,和人再确认下,总归可以更放心。



O1 Pro


这个对比有一些不公平,是个送分的 PK。

并不是说绝对模型能力,而是在没有知乎站内、站外相关内容补充的情况下(O1 Pro 没有搜索能力,只有「深入研究」能力)


准备提问

还是填入相同的问题,开启  thinking 模式。


得到回答

这次回答,没有触发思考模式(估计是有用户问过类似问题,被缓存了),它甚至还把思考的活儿又甩给了我...「你怎么看呢?」


加试一轮

再问一把

我个人感觉,回答质量还是蛮好的。



O3 Mini High(搜索启用)


因为 O1 Pro 没有联网功能,所以我们加试一位 OpenAI 的代表:O3 Mini High。

O3 只能启用推理或者强化思考。考虑到相关的知识更有价值,我们侧重启用搜索功能。


准备提问


等待回答

虽然也有思考,但是相比较深入研究,思考深度会浅不少(应付)


生成结果

生成结果而言,速度是非常快的,很多时候这类上下文少的简单观点问题,几乎都是秒级得到结果,这个应该就是 OpenAI 出生在算力富裕家庭的优势了,我们羡慕不来,那就和 DeepSeek 一样,优化基本功能,用「破卡也能出结果」。

点开来源信息,能够看到 OpenAI 或许应该给知乎交点钱,因为这一个回答就爬了知乎的内容大概二十次……


虽然拿到的知乎内容数量比知乎直答数据还多,但是因为拿不到内容的优质分(隐藏值),也不能获得更快的检索性能(走公网,缓存结果有限),所以在观点输出方面,结果是不如直答的。



Claude


Claude 和 O1 Pro 类似,这场 PK 注定是有很大劣势的,虽然模型性能很好,产品在用户意图识别方面也做的很棒。甚至现在的产品里,都有基于用户历史偏好来做内容产生。

但是,它和 O1 Pro 一样,没有联网能力。


准备提问

为了得到相对好一些的答案,我们选择了「啰嗦模式」,让它多费点 token,来详细点回答。


生成结果

生成非常的快,就结果而言,我觉得甚至没有 O1 Pro 好,就满满的 AI 感(中规中矩的没有错别字的版本)。



澎峰的 DeepSeek R1 异构满血版


这几天朋友老王他们加班上了新产品,和知乎直答一样,刚上线还挺快,现在估计已经因为很多人使用,导致输出有点一顿一顿的了。

他们用的是一堆人看不上的国产芯片来整的,我觉得能顺利跑起来,其实就很好了。反正你已经很卡了,不在乎再有点压力了吧(坏笑ing


准备提问

还是一样,把相同内容放进去,然后点击提交。


等待回答

看起来思考过程大差不差。就是现在有点卡,感觉不到舒爽的感觉...


生成结果

这个结果和上面的 O1 Pro、Claude 没有差别,都是靠模型基础能力,因为过程中没有补充任何知乎站内信息,更不会有补充内容携带权重,好坏示例的可能性,那么模型就只能自己发挥了,看运气抽卡。

这结果粗看,好像和直答还挺像(毕竟都是 deepseek ...),就是没有外部信息补充。


Deep Seek 原版


我是真的不想测试原版,原因大家也都知道...慢


准备提问

还是同样的事情,相同的问题,DeepSeek 官方能够开启 thinking 和 搜索能力,都点上。


等待回答

相比较三方,官方版本永远是思考最长的,有的人喜欢,有的人觉得没用,只有结果有用,我个人觉得看场景。情绪价值也好,思考启发也罢,或者就是新鲜劲,那看看模型自言自语蛮有趣的。

但是,你就是要结果的话,那么这块的展示可以隐藏掉的(Claude 设计了多种输出风格,也是如此,不是所有人都需要详细的模式)。



生成结果

DeepSeek 没有挑战爬知乎,引用了很多传统媒体来源的信息,所以风格和观点,基本都是「编辑体」。

模型生成结果其实还是不错的,但是吧,你看这个引用内容,你倒是挑挑再用啊!



腾讯云 Deep Seek 联网助手


我个人觉得直答也好,上面其他产品也好,界面看上去很舒服。
但在云控制台突然很突兀的这么设计和嵌入个 ChatBot 就 有点违和(UI 组件不一致)。


等待回答

和现在爆满的直答、老王版 DS速度差不多...因为这个排版设计,看起来有点费眼...(再次吐槽







请到「今天看啥」查看全文