文/沧海一土狗
ps:4100字
说起第一性原理,不得不提埃隆-马斯克,最近这个词是因为他重新流行起来的,他认为,
我们运用第一性原理,而不是比较思维去思考问题是非常重要的。我们在生活中总是倾向于比较,对别人已经做过或者正在做的事情我们也都去做,这样发展的结果只能产生细小的迭代发展。
这段话对认识和思考世界的方法做了一个很有意思的区分:
第一性原理
的思考方法和
类比
的思考方法。
从马斯克的字里行间,不难发现,所谓的第一性原理思维方式就是演绎法。为了准确地理解马斯克的对比,我们可以借用数学的
“公理-定理”框架
。
公理是命题推导的
起点
,它不能被其他公理证明,只能来自于长期的经验归纳。能被其他公理和定理推导出来的命题,叫做定理。假设这个世界的
本质
是一系列公理+定理,那么,认识
现象
的方法有三类:
1、现象和现象之间类比,只能发现相似性,无法总结出规律;
2、对每一类现象都运用归纳法,总结出一系列规律;
3、以少数经过反复验证最靠谱的经验观察为起点,从公理到定理——通过演绎法来认识这个世界;
这三个方法分别叫做类比、归纳和演绎。
这三个方法并非割裂的,而是分层次的,
类比是归纳的基础,归纳又是演绎的基础,演绎统领这一切。
基于这样的层次划分,我们就能更清楚地表述马斯克的这段话了,不要把认知局限在类比或归纳的层次,要升维至演绎的层次。
由于类比和归纳都与现象有关,我们把这两种方法统称为
经验思考
。这篇文章的主旨是探讨经验思考的局限性。
侯世达是公认的认知科学大家,他在《表象与本质》一书中,花费了巨大的篇幅讨论类比。
他认为,
类比和归类是人类思考过程中非常重要的工具,但是一般是
下意识
进行
的,而且,
人们的归类是
模糊的
,经常可以有一些偏移滑动。
尽管类比是人类思考的工具,但是,下意识进行和模糊性使得我们对这一工具的操纵是极其有限的。因此,他不无深意地说了下面两段话:
类比从头到脚侵入了我们的思维,控制着我们与世界交互的方方面面。它如此紧密地控制着我们,
以至于我们只能以某种已知的方式进行思考。
尽管我们告诉自己,我们才是对类比发号施令的人,但事实刚好相反——
我们处在自己拥有的大量无意识类比的股掌之中。
这就像是一个有权有势的统治者,实际上是在顺从民心。
从侯世达那里,我们至少可以发现类比思考的三个局限:
1、无意识性;2、模糊性;3、场景依赖。
因此,类比思考仅仅适用于
作为思考的开端,并不适用于
做出最终的结论。
但是,我们人类又的的确确是一台台
类比机器
,时时刻刻都在匹配,我们痴迷于各种相似性,所以,对于类比工具一定要警惕。
丹尼尔-吉尔伯特是另外一位认知科学的大家,他在《哈佛幸福课》中讨论了人类想象未来的局限,他认为想象力有三个缺点:
1、下意识地填补或遗漏信息;
2、将现在投射到未来;
3、不知道一旦事情发生了,我们对事情的看法也会改变;
第二条缺陷的作用十分巨大,以致于我们的想象只能被牢牢地拴在
以现在为中心的轨道上
,永远无法真正的逃离。
文中,丹尼尔-吉尔伯特提了一个十分重要的命题,
人类是唯一会思考未来的动物。
在这里我擅自对这个命题做一个小小的拓展,
人类是唯一会思考未来的动物,但这种未来离“现在”很近。
事实上,思考未来和即时预测有十分大的区别。猴子的大脑和婴儿的大脑都能够将它们已经知道的东西(
过去
)同它们此时此刻看到的东西(
现在
)结合起来,并对即将发生的事情(
未来
)进行预测。
但是,猴子和小孩都无法思考未来——
前者没有能力,后者还没学会。
我们经常会问小孩一个问题:
你长大后想要干什么?
小孩子常常被这个问题搞糊涂,他们可能会给出“卖糖人”、“攀树人”之类的答案。成年人为此窃笑不已。
事实上,这帮小孩子很鸡贼地去回答了另一个问题
“你现
在想干什么”
。小孩子不知道自己以后想干什么,因为他们根本不懂“以后”是什么意思。然而,提问的成年人并不清楚这一事实。
当大人面临这一问题时,他想的是他毕业后要干嘛,跟一个什么样的人结婚,退休后住哪里。
小孩子还没有形成这个能力。这也就造成了另一个现象,我们总认为,自己小时候很开心,无忧无虑,成年之后多了很多忧愁。表面上看,这个描述符合事实。但背后原因十分反直觉,小孩子不具备思考未来的能力,也就还不具备忧愁的能力
——
不是缺乏忧愁的刺激因素,而是,缺乏忧愁的能力。
更进一步,按照所能思考未来的远近,我们能对各种智能体进行某种分类,如下图所示,
猴子可以预测十分近的未来,小孩子更远一些,成年人再远一些,更远就要
借助宇宙飞船了。
“现在”就像地心引力一样,牢牢地抓住了各种智能体的想法,只不过成年人能稍微跳得高一些。
作为成年人,我们的确可以嘲笑小朋友们的“卖糖人”、“攀树人”,并吃惊于小孩子的不着调。但是,翻开我们写的各种预测报告,我们仔细想想,
这些报告是不是也在回答“卖糖人”、“攀树人”?
所以,我们成年人并不比小孩子高明多少,五十步和一百步的区别。
在这里,我并不是让大家对人类的认知彻底地悲观,只是想让大家正视自身的缺陷。我们回答“卖糖人”和“攀树人”并不可怕,可怕的是我们拿着这样的答案
心怀傲慢
并沾沾自喜。
前面两节主要讲了认知主体的缺陷——
类比的局限和推断的局限,
现在我们再讲一下认知的客体——
现象
——所能制造的麻烦。
暂且抛开现象的
观测和收集
问题不说,即便是我们把现象抽象为数据,我们也可能被数据愚弄。
在统计学中,有一个很著名的数据现象,
叫辛普森逆转。
有一个很有意思的例子。一个观察者发现,在某一段时间有一个地方的高端住宅和普通住宅的平均价格都上涨了,但是,这个地方的
总体平均成交价格
却下降了。表面上看,这个反转看起来不可思议,实际上,它是因为在t+1期成交了更多的普通住宅,拉低了总体平均成交价格。
当然,辛普森逆转只是一个数据现象,所反映的是
抽样的问题。
还有一个更高阶的现象,
叫辛普森悖论。
这个悖论来自于分组数据。
我们都知道运动有益于健康。如果按照20、30、40、50的年龄段分组抽样,我们会看到运动时间和胆固醇水平存在明显的负相关关系。但是,如果我们把这4组数据混合在一起的时候,奇怪的事情发生了,我们会发现,运动时间越长胆固醇水平越高。
分组数据和混合数据得出的结论不一致!为什么如此呢?因为年龄同时影响运动时间(
年龄越大的人运动越多
)和胆固醇水平(
年龄越大的的人胆固醇水平越高
),制造了运动时间和胆固醇水平的正相关性。所以,年龄是胆固醇水平和运动时间之间的混杂因子。
要知晓运动时间和胆固醇水平之间的确切因果关系,必须控制住年龄。因此,分组数据得出的结论是对的,但混合数据得出的结论一定是错的,因为年龄制造了正相关性。
关于辛普森悖论还有一个著名的例子——
人类颅骨长度和宽度的相关性。
把男性和女性数据分开来看,颅骨的长度和宽度没有相关性,但是,把二者的数据混合到一起,二者就具备了微弱的相关性。
事实上,这个例子和运动量vs胆固醇的例子类似。性别是一个混杂因子,男的颅骨长度和宽度都较大一些。所以,性别会制造微弱的相关性。
按照分组数据,颅骨长度和宽度没有相关性;但混合数据灾难就出来了,我们会得出颅骨长度和宽度存在相关性的结论。
在这个
言必称大数据
的时代,人们倾向于认为数据万能,但事实并非如此。图灵奖获得者朱迪亚-珀尔在《为什么——关于因果关系的新科学》的导论里说道,
思维胜于数据。
每一门蒸蒸日上的科学都是在其符号系统的基础上繁荣发展起来的。
——奥古斯都-德-摩根
珀尔构构造了因果之梯,把认知能力分为三个层次:
观察能力、行动能力和想象能力。
尽管丹尼尔-吉尔伯特列举了人类想象能力的种种缺陷,但是,珀尔认为想象能力的层次远远高于观察能力的层次——
数据挖
掘。
为了真正地驯服数据,我们必须升级到
反事实
的层次,掌握因果关系,而不是永远地在相关性里打转儿。
只有真实地掌握了因果关系,我们才能画出因果图,辨别出性别是颅骨长度和宽度的混杂因子,
知道我们应该信任分组数据而不是混合数据。
否则,我们将会被别有用心的人愚弄,想让我们相信相关性的时候用混合数据,不想让我们相信的时候用分组数据。