专栏名称: 架构师之路
架构师之路,坚持撰写接地气的架构文章
目录
相关文章推荐
51好读  ›  专栏  ›  架构师之路

终于找到答案了!deepseek凭啥能给出这么丰富的答案 - 反事实推理(上)

架构师之路  · 公众号  · 架构  · 2025-02-18 11:50

正文

请到「今天看啥」查看全文


deepseek原理应用与实践》

7.deepseek极限潜能 - 反事实推理(上)

为什么deepseek的回答如此丰富,如此多维度?

今天和大家聊聊,deepseek核心技术(之一): 反事实推理


什么是反事实推理?

Counterfactual Reasoning ,它是一种通过 构建与事实相反的假设性情景,探索因果关系和潜在结果 的逻辑推理方法。


举个例子:

如果我是帅哥,短视频流量会怎样?

我是帅哥吗?不是,这个假设有违事实。

但基于这个假设,会怎么样呢?

探索一下其中的因果关系与潜在结果。


为什么说反事实推理对deepseek帮助极大呢?


其一,能突破数据量上限。


传统的大模型,比拼的都是数据量与参数量,需要大量的互联网数据。但互联网数据毕竟是有限的,最多把全网的数据都拿来训练,对吧?


有没有办法突破全网数据量上限呢?

有的,虚构数据,反事实推理模拟各种场景,来增强训练样本。


其二,助力因果发现,加强结果的解释性,关联性,因果性。


会有人问,虚构训练数据,那回复的置信度会打折扣吧?

与之相反,反事实推理有着严密的数学模型, 因果推断三层次模型 ,它由美国计算机科学家Pearl提出,是因果推理理论的核心框架。


因果推断有哪三层次?


第一层:关联,Association 。这一层关注 条件概率P(Y|X) ,是传统统计学和机器学习的主要关注点。


这一层能回答:是否具备相关性。

但无法回答:是否具备因果性。


举例,通过观察事实发现:

P(肺癌|吸烟) > P(肺癌|不吸烟)

推理得出:肺癌与吸烟相关

但无法推出:吸烟导致肺癌


第二层:干预,Aintervention。 这一层 关注P(Y|do(X)) ,即主动干预某一变量,观察对结果的影响。


这一层能够回答:如果怎么样(施加了干预),会怎么样。


举例,强制所有人抽烟,然后继续观察事实发现:

P(肺癌|do(吸烟=100%)) > P(肺癌)

P(肺癌|do(吸烟=100%)) != 100%

推理得出:

1. 吸烟会使肺癌概率上升;

2. 但吸烟不是导致肺癌的原因;


第三层:反事实, Counterfactuals 这一层研究假设性问题,关注xxoo(公式不会输入)。


这一层关注:如果采取了不同的行动,结果会如何。 这里面会用到 结构因果建模SCM,反事实计算,可识别性分析 等知识,不详细展开。

画外音:楼主没研究透,所以打马虎眼一笔带过(这一句发布时删除)。


举例:如果某吸烟者当初未吸烟,肺癌的概率会如何变化。


反事实推理在 责任判定 (例如:医疗事故归因), 个性化决策 (如果xx怎么样,如果xx怎样), 人工智能因果解释性 上有大量应用。


总之,通过反事实推理,deepseek能够更好地揭示变量间的因果链。


其三:避免单一输出,加强分析维度。


这一点用过deepseek的童鞋感受上应该都比较直观。

你看 ,deepseek的 回答丰富度极高

1. 构造假设,尝试多方案;

2. 多方案进行数据对比;

3. 差异归因;

4. 给出结论与建议;


总的来说,deepseek在 提示词优化引擎,因果推理模块,解释性增强模块,结论输出模块 … 等算法、策略、工程架构中都深度结合了反事实推理,其对deepseek的崛起功不可没。


反事实推理,对我们写提示词,获取更佳的回答质量有什么启示呢?

下一篇见。。


总结

1. 反事实推理是deepseek的核心技术(之一);

2. 反事实推理,是一种通过构建与事实相反的假设性情景,探索因果关系和潜在结果的逻辑推理方法;

3. 反事实推理,有着严密的数学模型,属于因果推断第三层次;

4. 反事实推理,能帮deepseek突破数据量上限,加强结果解释性,提升回复丰富度;


知其然,知其所以然。

思路比结论更重要。
补充阅读材料:
《因果推断三层结构
https://web.cs.ucla.edu/~kaoru/3-layer-causal-hierarchy.pdf
pdf,可下载, 只有一页,强烈推荐阅读!

==全文完==

20年,系列1(已完结):
架构师定会遇到的80个经典架构问题!

25年,系列4(图文+视频,暂定20讲)
《deepseek原理+应用+实践》:

最大化deepseek潜能 - 3大原则(1)

最大化deepseek潜能 - 多跳推理(2)

最大化deepseek潜能 - MOE(3)

最大化deepseek潜能 - 知识图谱激活(4)

最大化deepseek潜能 - 动态注意力机制(5)

最大化deepseek潜能 - 认知脚手架(6)


卧槽,宝藏号,有点东西, 日更 ,果断关注。
一键三连 ,让平台知道什么值得被推荐。







请到「今天看啥」查看全文