《
deepseek原理应用与实践》
2.deepseek极限潜能 - 多跳推理
最近几周自学deepseek原理+应用+实践,一些成果,和大家分享。
1. 小部分人会关心,
deepseek为什么这么流弊
;
今天和大家聊聊,deepseek的核心机制之一的
多跳推理
,以及如何优化我们的提示词,使得deepseek能够最大化发挥其多跳推理的潜力。
多跳推理,multi-hop reasoning,是模型将不同源中的信息关联,整合与推理的能力。
我们会发现:
比拼参数量的大模型,是无法从已有知识中得到提问的答案的
,但通过简单推理,将已有的多源信息关联,就能极大提升回答的质量。这就是多跳推理。
是不是这样?当我们面临一个新的问题时,如果我们脑中的信息没有直接答案,
我们就是通过多跳推理,通过信息的关联,一步步找到答案。
这对我们人来说简单,但对大模型来说就要了命了,信息量十分巨大,两个信息的关联,三个信息的关联,多个信息的关联,即使能够预处理,其计算量也是巨大的。
既然deepseek用了这个技术,我们如何能够最大化发挥deepseek多跳推理的优势呢?
通过提示词显性的告诉deepseek关联关系与关联步骤
,而不要让大模型在有限的深度思考里,浪费注意力去探索海量的关联关系。
good case:请帮忙
通过以下步骤
定位与修复异常代码:
2. 查看出错模块的日志信息,定位异常代码的源文件名,函数名
说到底,我们是如何思考与解题的,就
显性的用提示词告诉deepseek如何思考与解题
,这样能够:
1. 极大提升deepseek效率,
提升答案深度
;
3.
提升知识的准确性
,而不是让deepseek在有限的深度思考时间里自行探索;
1. 多跳推理能极大提升deepseek的回复质量;
3. 提示词通过显性告之deepseek关联关系与关联步骤,能够最大化发挥多跳推理的潜力;
一切的一切,
提示词只有适配了AI的认知模式,才能最高效的发挥最大的作用。
https://arxiv.org/pdf/2401.15391
原理与技术才是本账号的核心。
接下来准备再花一些时间,开一个新的系列,通过图文+短视频的方式,讲讲deepseek背后的原理,应用与实践。