-
知乎这波可谓是走对路子了,最好的开源推理模型,和中文互联网上最优秀的语料结合,让直答的专业能力大大增强。
-
有人问和直接用 deepseek 有啥不一样?不一样之处在于,直答在参考来源上,给了知乎社区最高的权重,更偏向解决专业问题。
-
面对复杂和小众问题,Deepseek R1 加持了也不一定好用,而且 R1 其实幻觉问题更严重,在使用结果时需要小心。不过我认为,其推理过程比结果更有价值。
测试 1:知乎上有哪些大模型话题优秀答主?列举 10 个,并模仿他们语气,来介绍一些 Deepseek R1 的亮点
先来个相对简单的问题吧。
不知道其他答主觉得风格对不对,但就我这段风格模仿,只能给个 80 分吧哈哈,不过它采用递进的方式,确实有点像我,我写东西就很喜欢递进。
但是写多了,容易露馅。例如我让它继续模仿我,它虽然写得挺好,但语气就更不像我了,至少我写技术文章时,基本不会一上来就「兄弟们」。
测试 2:写一个喂饭级的 DeepSeek 部署教程
简单的问题难不倒 R1,那就上点难度。
我年前写了一篇在安卓上部署 DeepSeek 的教程,
并在文末表示想在 ios 上试试部署。
刚好知乎直答接入 DeepSeek R1,那就用直答来帮助我写这个教程吧。
于是,我让给我写一个完整的喂饭级教程,怎么在苹果手机上部署并运行 DeepSeek R1 7B 开源模型
当然,一开始,知乎直答也和 DeepSeek App 一样,响应不过来了,看来知乎直答得赶紧扩容。
重新问了一遍,好了。
从上面标红的部分可以看到,它参考了很多知乎上的文章,包括我之前写的一篇文章,在参考来源第 7 条。
其最后给出的回答也是有理有据的,甚至给出了所需工具的下载链接,虽然链接不太对(第一个跳转到官网而非 App store,第二个 404),但名字对了,自己去搜一下就好了。
甚至还给出进阶设置。
不
过,App Store 上并没有名为 MLC LLM 的应用,如果要用,则需要自己从源代码中 build。
虽然 MLC LLM 网站上推荐了名为 mlc chat 应用,但这个应用不能导入外部模型。
不过,在我搜索应用的过程中,找到其他可以导入模型的 app,例如 LLM Farm,On-Device AI 等,大家可以试试。
测试 3:用 DeepSeek R1 和 In-Context Lora,制作四宫格漫画
出了个更垂直的题目考考直答。要它根据 DeepSeek R1 和 In-Context Lora,制作四宫格漫画
可以看到,它把知乎文章和回答作为主要参考来源,其中第一篇是我之前写的文章。
不过这篇文章写的是插画而不是四宫格漫画。我出这个问题,是想看看其举一反三的能力。
参考来源中,除了知乎,它也搜索了 CSDN,个人博客等各种数据。
DeepSeek 根据搜索结果,进行了如下思考过程。
可以看到,每一步都是对的。
总体来说思路是对的,不过很多细节都没优化好,例如怎么让 AI 生成四宫格,而不是四个大小不一的图片。
可以追问,让它再详细点。
但 ComfyUI 里面跑代码不方便,于是我可以继续问。
然而,正如社区发现的,DeepSeek R1 的幻觉问题还是挺严重的,例如红框部分,其实并没有 In-Context Lora 的插件,In-Context Lora 是一系列权重。
当然,你可以去纠正它。
但给出的回答依然还是有幻觉。
当然这个例子我测试的问题有点多,就不一一截图了。
这个例子表明,当你用一个不算很热门的技术框架时,而且其中涉及很多步骤时,R1 很大概率会出现幻觉,无法做出你想要的效果。