专栏名称: 知乎日报
提供最好的资讯评论,兼顾专业与趣味。
目录
相关文章推荐
知乎日报  ·  做一个在历史上留下痕迹的人有多难? ·  9 小时前  
知乎日报  ·  知乎直答接入满血版 ... ·  9 小时前  
Quora文选英语  ·  老外说𝒐𝒖𝒕 𝒐𝒇 ... ·  昨天  
知乎日报  ·  知乎瞎扯|你捡过最大的漏是什么? ·  3 天前  
51好读  ›  专栏  ›  知乎日报

知乎直答接入满血版 DeepSeek-R1,到底好不好用?

知乎日报  · 公众号  · 问答  · 2025-02-12 21:00

正文

点击上方卡片关注👆

近日 ,知乎 AI 搜索产品知乎直答正式接入「满血版」DeepSeek R1! 在社区优质内容、专业知识库基础之上,全面升级了推理能力,为你带来全新的 AI 搜索体验。

知乎直答的 R1 体验到底如何?究竟好不好用?一起来看看答主的回答吧。



知乎直答接入满血版 DeepSeek-R1,体验感如何?好不好用?


| 答主: 桔了个仔

结论先行:

  • 知乎这波可谓是走对路子了,最好的开源推理模型,和中文互联网上最优秀的语料结合,让直答的专业能力大大增强。

  • 有人问和直接用 deepseek 有啥不一样?不一样之处在于,直答在参考来源上,给了知乎社区最高的权重,更偏向解决专业问题。

  • 面对复杂和小众问题,Deepseek R1 加持了也不一定好用,而且 R1 其实幻觉问题更严重,在使用结果时需要小心。不过我认为,其推理过程比结果更有价值。



测试 0:介绍一下我自己




测试 1:知乎上有哪些大模型话题优秀答主?列举 10 个,并模仿他们语气,来介绍一些 Deepseek R1 的亮点


先来个相对简单的问题吧。



不知道其他答主觉得风格对不对,但就我这段风格模仿,只能给个 80 分吧哈哈,不过它采用递进的方式,确实有点像我,我写东西就很喜欢递进。



但是写多了,容易露馅。例如我让它继续模仿我,它虽然写得挺好,但语气就更不像我了,至少我写技术文章时,基本不会一上来就「兄弟们」。




测试 2:写一个喂饭级的 DeepSeek 部署教程


简单的问题难不倒 R1,那就上点难度。

我年前写了一篇在安卓上部署 DeepSeek 的教程, 并在文末表示想在 ios 上试试部署。

刚好知乎直答接入 DeepSeek R1,那就用直答来帮助我写这个教程吧。



于是,我让给我写一个完整的喂饭级教程,怎么在苹果手机上部署并运行 DeepSeek R1 7B 开源模型

当然,一开始,知乎直答也和 DeepSeek App 一样,响应不过来了,看来知乎直答得赶紧扩容。



重新问了一遍,好了。



从上面标红的部分可以看到,它参考了很多知乎上的文章,包括我之前写的一篇文章,在参考来源第 7 条。



其最后给出的回答也是有理有据的,甚至给出了所需工具的下载链接,虽然链接不太对(第一个跳转到官网而非 App store,第二个 404),但名字对了,自己去搜一下就好了。



甚至还给出进阶设置。



过,App Store 上并没有名为 MLC LLM 的应用,如果要用,则需要自己从源代码中 build。 虽然 MLC LLM 网站上推荐了名为 mlc chat 应用,但这个应用不能导入外部模型。



不过,在我搜索应用的过程中,找到其他可以导入模型的 app,例如 LLM Farm,On-Device AI 等,大家可以试试。



测试 3:用 DeepSeek R1 和 In-Context Lora,制作四宫格漫画


出了个更垂直的题目考考直答。要它根据 DeepSeek R1 和 In-Context Lora,制作四宫格漫画



可以看到,它把知乎文章和回答作为主要参考来源,其中第一篇是我之前写的文章。


不过这篇文章写的是插画而不是四宫格漫画。我出这个问题,是想看看其举一反三的能力。

参考来源中,除了知乎,它也搜索了 CSDN,个人博客等各种数据。

DeepSeek 根据搜索结果,进行了如下思考过程。



可以看到,每一步都是对的。



总体来说思路是对的,不过很多细节都没优化好,例如怎么让 AI 生成四宫格,而不是四个大小不一的图片。

可以追问,让它再详细点。



但 ComfyUI 里面跑代码不方便,于是我可以继续问。



然而,正如社区发现的,DeepSeek R1 的幻觉问题还是挺严重的,例如红框部分,其实并没有 In-Context Lora 的插件,In-Context Lora 是一系列权重。

当然,你可以去纠正它。



但给出的回答依然还是有幻觉。



当然这个例子我测试的问题有点多,就不一一截图了。

这个例子表明,当你用一个不算很热门的技术框架时,而且其中涉及很多步骤时,R1 很大概率会出现幻觉,无法做出你想要的效果。



知乎热门文章

近 9 成国人乳糖吸收不良,为何牛奶还是如此普及?


为什么《哪吒之魔童闹海》能成为中国影史票房冠军?







请到「今天看啥」查看全文