DeepSeek yyds!
芋道 24 年 7 月份,就完成了 DeepSeek 的接入:从 V1 => V2 => V3 => R1,真能感受到蜕变!
大家可以尝试下,我们 Java 开发者,也是可以玩转大模型的。
开源项目地址:https://github.com/stars/YunaiV/lists/yudao
最近,DeepSeek这款AI工具爆火国内外。
虽然许多人都开始尝试使用它,但有人吐槽说,没想象中那么牛。
其实问题不在工具,很多人的使用姿势就搞错了,用大炮打蚊子,白白浪费DeepSeek的强大功能。
接下来,我将为大家分享9个实用技巧,你会发现DeepSeek远比想象中更强大。
DeepSeek的三种模式
DeepSeek有三大适用模式:基础模型(V3)、深度思考(R1)、联网搜索。
1. 基础模型(V3)
基础模型(V3)是DeepSeek的标配,没有勾选默认就是基础模型。V3版自去年12月升级后,性能大幅提升,堪比业内顶尖模型如GPT-4、Claude-3.5等。
它的作用相当简单,回答日常的百科类问题,帮助用户快速获取信息。
不管是查询常见知识、处理简单的文本生成任务,V3都能迅速给出答案。它的优点就是高效、便捷,几乎没有什么门槛,适用于大部分场景。
尤其是在用户并不要求复杂推理、深度分析的情况下,V3就显得尤为合适。比如你只想问一个简单的问题,或者需要一个快速的解答,V3足够应付。简单、直接,是它的最大特点。
2. 深度思考(R1)
R1作为DeepSeek的深度推理模型,专门用来解决那些需要复杂推理和深度思考的问题。它处理的任务更具挑战性,比如数理逻辑推理、编程代码分析等。
R1模型有660B的参数,并采用了后训练+RL强化学习方法,擅长从多个角度分析问题,并给出经过严密推理后的解答。
R1决定是一位专家,能够为你提供精确、深刻的推理和分析。因此,如果你的问题涉及到复杂的推理,R1便是不二的选择。
3. 联网搜索
联网搜索模式是DeepSeek的AI搜索功能,基于RAG(检索增强生成),这一模式让DeepSeek不仅能依赖它自己的知识库,还能根据互联网实时搜索相关内容来回答问题。
换句话说,联网搜索不仅让模型能够回答2024年7月以后的问题,还可以利用网络上的最新信息来补充自己的回答。
如何对标其他模型?
DeepSeek的三个核心模式,能够与chatGPT对标,为我们提供更清晰的选择。
1. V3对标GPT-4o
DeepSeek的V3模型堪比GPT-4o,二者的设计理念和应用场景非常相似。V3采用了Moe架构,拥有671B的参数量,能够在百科知识领域提供快速响应。
2. R1对标o1
R1是DeepSeek的深度推理模型,和OpenAI的o1模型非常类似。二者都在处理推理、深度思考以及复杂逻辑问题时,展现出了非凡的能力。
R1采用了660B的参数,并且在强化学习和后训练方面表现出色。R1更擅长逻辑推理和复杂问题的解答,在这一点上,R1已经超越了o1模型。
知识库的更新时间
目前,DeepSeek的预训练数据已经更新到2024年7月。
但对于之后的新闻或技术动态,DeepSeek的联网搜索模式就显得尤为重要,它能够根据网络实时获取最新信息,弥补知识库的空白。
告别提示词
很多AI熟手可能会囤一堆提示词模板,但是,DeepSeek 完全不用准备提示词,只要简单明了地描述你的需求,DeepSeek 就能理解并给出精准的答案。
举个例子,如果你想让 DeepSeek 帮你写一段蛇年拜年祝福语,直接告诉它这个需求,它就能立刻生成多个风格的版本。
与DeepSeek的对话,尽量使用简单、直白的语言。越是接地气的表达,DeepSeek就越能发挥其最大潜力。
避免过于正式、结构化的表述,简单、直白、带点口语化的语言往往能够获得最自然、流畅的答案。
DeepSeek的理解能力非常强,不需要过多的引导,给它一个清晰的问题,它就能提供精准的答复。
“小学生”沟通技巧
与DeepSeek对话时,有时我们可能觉得AI的回答过于抽象。
这其实源于传统AI模型过于注重结构化表达,结果都是“八股文”的回答,我们可以借助DeepSeek的“小学生”沟通技巧。
可以给它一个提示:“我是一名小学生,请用小学生能听懂的话解释什么是大模型。”
通过持续追问,获取详细答案
运用持续追问的技巧,能够帮你快速搞清楚一个复杂问题,大致步骤如下:
例如,我先问DeepSeek:“如何写好提示词?”
对于如何提供上下文,我还是不明白,我可以继续追问DeepSeek。
最后我让DeepSeek把对话整理成详细的清单格式。
活用联网搜索
联网搜索是DeepSeek的一大亮点,它让模型在回答时不仅仅依赖预训练数据,还能实时从网络上检索最新的信息。
你可以问到2024年7月以后发生的事件,或者某些新兴技术领域的问题,DeepSeek都能通过联网搜索为你提供更准确、及时的回答。
例如,你问DeepSeek:“2025年春晚有哪些节目?”它可以在网络上找到最相关的资料,并结合大语言模型的能力生成确的回答。
但是,最近DeepSeek受国外网络攻击,联网搜索暂不可用了,尴尬~
上传附件功能
除了联网搜索,DeepSeek还支持上传附件功能,这为用户提供了更多个性化的体验。
通过上传附件,你可以将自己的私密资料、知识库、甚至是一些需要深度推理的材料直接交给DeepSeek,让它基于这些专有的文件进行分析和推理。
上传附件最多支持50个文件,每个文件最大100MB,数据量较大的文件,DeepSeek也能处理自如。
R1的三个开放特性
对于深度思考(R1)模型,DeepSeek做到了三个重要的开放特性,让R1不仅仅是一个“黑盒”模型,它的思维过程、训练技术和模型参数都是透明开放的。
1. 思维链全开放
R1的思维链是完全开放的,用户可以看到模型进行推理时的每一步逻辑。
这不仅是一个回答,而是一个完整的思考过程。通过这种方式,用户能获得最终答案,还能够理解AI是如何得出这个结论的。
2. 训练技术全部公开
DeepSeek采用了RL(强化学习)技术,通过极少的标注数据提高了推理能力。
所有的训练技术,包括模型的后训练过程和数据增强方法,都是公开的。
这让广大网友都能深入理解模型的训练过程,并且可以根据需要进行调整和优化。
3. 开源模型
DeepSeek还将R1的部分模型进行开源。虽然R1模型本身的参数高达660B,通常只有大公司才能使用,但DeepSeek也为社区提供了更小的开源模型,让更多的开发者和研究者可以使用。
最小的模型只有1.5B参数,适合个人开发者进行实验和开发。
这格局太顶了,帮助全球的开发者共同推动AI的发展。
以上9个技巧,希望能帮助你更好地使用DeepSeek。欢迎大家在评论区分享你的使用技巧,一起探讨、学习。