【精读君曰】
在现实世界中,我们每个人都需要预测:想要深入分析未来、思考是否买股票、制定政策、提出新产品构想,或者只是计划一周的饭菜。
这样的思考能让我们受益。不幸的是,人们往往是糟糕的预测者。
如何能够做出更准确的预测?在这本浅显易懂、生动活泼的书中,作者泰洛克和加德纳认识到概率思维对准确预测的核心作用。无论你是政策制定者,还是任何想要非常严格地评估决定的合理性的人,《超预测》都是十分有用的指南。
十分钟读完《超预测》
本文已获授权转载,来源微信公众号十分钟读完一本书(ID:Read_a_Book_a_Week)
by 菲利普 • 泰洛克、 丹 • 加德纳
第一章 乐观的怀疑论者:为什么我们的世界需要预测
你我都是预测家。在考虑换工作、结婚、买房子、投资、推出新产品和退休时,我们的决定是以我们对未来的展望为依据的。这样的展望即是预测。
关于黑猩猩的笑话
我的研究所显示的是,在我提出的许多政治和经济问题上,专家预测的平均水平比瞎猜好不了多少。然而,“许多”并不代表全部。在仅需一年时间即可验证的超短期问题上,专家最容易做出准确判断,当他们试图预测更长时间之后的事情时,准确性就会下降,在3~5年的问题上,水平接近于掷飞镖的黑猩猩。
怀疑论者
可预测性存在难于逾越的局限性。当今科学家的知识远远多于100年前的同行们,拥有的数据处理能力也远胜于后者,可是对完美的可预测性的前景的信心却小得多。
我们生活在这样的世界:一个近乎软弱无能的人的行为可能对世界产生连锁效应,每个人因此而受到的影响不尽相同。在这样一个世界,认为任何人都可以深刻洞悉未来的观点会使人误入歧途。
乐观主义者
然而,意识到可预测性的局限性是一回事,否认所有预测,视之为徒劳无益的行为,绝对又是另一回事。不可预测性和可预测性艰难地共存于构成人体、社会和宇宙的复杂的关联系统中。某事物的可预测性如何,取决于三个因素:我们想要预测的内容,预测的时间远近,以及在什么情况下进行预测。
关于预测的预测
如果戴维 • 费鲁奇是对的(我是这么认为的),那么未来我们必须将基于计算机技术的预测与主观判断结合起来。所以,现在是严肃对待这二者的时候了。
第二章 知识的错觉:糟糕的预测与糟糕的决定
我们都是过快下结论,却过慢改变结论。如果我们不仔细分析这样的错误是怎样产生的,我们就会一错再错。这种止步不前的状态可能持续多年,或者一辈子。它甚至可能存在几个世纪,医学漫长而又心酸的历史就是写照。
盲人辨色
按照英国内科医生、作家德鲁因 • 伯齐(Druin Burch)的评论,“多数医学史极其可笑”。“它们详细描述了人们自认为合理的治病方法,但几乎完全没有论述这些方法是否正确。”
无知和自信常常被认为是医学界的特有形象。在外科医生、历史学家艾瑞 • 鲁寇(Ira Rutkow)看来,那些狂热地争论各种治疗手段和理论的价值的医生“就像是盲人争辩彩虹的颜色”。
让医学接受试验
随机对照试验的概念被医学界接受的过程极其缓慢,直到“二战”结束之后,医生们才第一次尝试严格的对照试验。他们获得了极佳的结果。
思考之思考
为了描述我们如何思考和决策,现代心理学家通常采用双系统模型,该模型将我们的精神世界分为两个系统。第二系统是我们熟悉的思维领域,它由我们选择的所有关注点构成。与之相反,第一系统不为人熟知。这片区域属于无意识感知和认知活动。
两个系统不是随意划分的。首先启动的是第一系统。它速度快,始终在后台运转。如果有人提问,而你马上知道答案,它就是从第一系统中弹出来的。第二系统负责审视这个答案。它经得起深究吗?有证据支持吗?这个过程需要时间和努力,所以做决定的标准流程是:第一系统首先得出一个答案,然后第二系统才能介入,审查第一系统的答案。
诱惑与转换
我们可以将这种无意识的、几乎完全不费力地思考世界的模式称为“大脑的默认设置”。“默认”意味着我们可以按下开关切换到其他模式。但是我们做不到。不论你是否喜欢第一系统,它总是在运转,嗡嗡作响,在意识的潺潺涓流下涌动,永不停息。
用视角来做比喻更合适。从我们醒来后目光越过鼻尖投向外部世界的那一刻起,光影和声音就会流进脑海,第一系统开始工作。这种视角是主观的,每个人具有独一无二的视角。只有你能从自己的鼻尖看见世界。既然这样,我们就称之为“鼻尖视角”(tip-of-your-nose-perspective)吧。
眨眨眼,想一想
直觉产生的是谬论还是真知灼见,取决于你是否生活在一个充满合理提示的世界,这些线索是你无意之中记录下来的,以备未来之需。然而,问题不是这么简单,我们常常难以知晓什么时候会出现足够的合理提示,让直觉发挥作用。即使条件明显成熟,谨慎仍然是明智的。
鼻尖视角可以创造奇迹,但也可能造成可怕的扭曲,因此,如果在做重大决定之前有时间思考的话,还是思考一下吧。而且,你还要做好准备接受这一事实:现在看起来明显正确的想法以后可能被证明是错误的。
第三章 一种评分系统:超预测是可以衡量的
判断预测正确与否比通常人们所想象的要困难许多,这是我吃尽苦头、从令人恼火的丰富经历中得到的教训。
“大毁灭…将会到来”
我冷眼旁观,开始怀疑:无论发生什么,这些专家都会熟练地淡化自己预测的错误,并且讲出一段历史,以表明他们一开始就预见到形势的变化。国家安全精英与生活在近代科学兴起之前的时代的知名医生们非常相似,那些医生也绝顶聪明,绝对守诚信。可是,鼻尖错觉可以愚弄任何人,即便是最高尚的人、最聪明的人也无法避免,也许,他们正是特别容易被愚弄的群体。
判断之判断
预测应当使用语意清晰的措辞和时间框架,应当使用数字。还有一件事至关重要:我们应该有许多预测。
综合分析吻合度和意志,我们就建立起一套计分系统,这套系统将全面反映我们对如何做一名出色的预测者的认识。有人说X事件的概率是70%,如果X事件确实发生了,则此人的分数将非常之高。但是,说X事件的概率是90%的人会拿到更高的分。再进一步,胆子大到正确预测X事件的概率为100%的人得到的分数最高。不过,骄傲自大的人一定会受到惩罚。这套系统所使用的运算方法由格伦 • W • 布莱尔(Glenn W.Brier)于1950年创建,因此我们将评分结果称为布莱尔得分。
数学的含义
记住,这项工作的整个目标在于判断预测的准确性,以便我们能够发现哪些因素在预测中发挥积极作用,哪些不发挥作用。为了实现这个目标,我们必须阐述布莱尔得分的意义,而这还需要两个要素:标准和可比性。
专家的政治预测
预测问题的时间框架范围从1年到5年再到10年,关注的话题也呈现多样性,都是从当日的新闻中提取出来的,有政治和经济的,也有国内国外的。我们的专家遇到的问题可能是他们在媒体或政府详细阐述过的任何议题,这意味着,专家们有时会被要求对其专业领域内的问题进行预测。尽管这种情况不常见,但我们有机会看看真正的主题型专家和头脑聪慧、知识渊博的外行相比,谁的预测准确性更高。
关于研究结果
现在我告诉你:专家预测的平均准确率大致和掷飞镖的黑猩猩相当。
有两组从统计学角度可以区分的专家:第一组成绩没能超过随机猜测,他们的长期预测甚至“出色”地输给了黑猩猩。第二组战胜了黑猩猩。那么,为什么一组专家的结果强于另一组呢?决定因素在于,他们如何思考。一组专家倾向于围绕大理念来组织思想,另一组由更加注重实际的专家组成。
我管大理念型专家叫作“刺猬”,更注重兼容并蓄的专家叫作“狐狸”。狐狸打败了刺猬。之所以狐狸能赢,不是因为它像胆小鬼那样,为求安全而在预测时给出60%或70%的概率,而刺猬则大胆地报出90%或100%的概率。狐狸的胜利,是吻合度和意志的双重胜利,他们具有真正的远见卓识,这是刺猬不具备的。
蜻蜓的复眼
多人集体预测的结果在准确性上向来强于小组普通成员的预测,而且经常准确性惊人。现在来了解狐狸如何做预测。他们运用多种分析方案,从多个来源挖掘信息。然后,他们整合信息,形成一个结论。总而言之,他们汇聚智慧。他们也许是独立工作的个体,但是他们的所作所为大体上与高尔顿的“群体”没有分别。他们整合不同视角及包含在其中的信息。唯一真正的区别是,整个过程只发生在一个大脑中。
来自数万个独特视角的信息流入蜻蜓的大脑,在那里合成超强视野,使得它可以同时看清几乎所有方向。长着蜻蜓复眼的狐狸是个杂交怪物,实际中当然不存在,只是一个比喻罢了,不过,它抓住了狐狸的预见能力强于带着绿光眼镜的刺猬的关键原因:狐狸集合各种视角。
第四章 超级预测家:准确预测靠的更多是能力而不是运气
对过程的问责:情报分析师被告知在进行研究、思考和判断时应该经过哪些步骤,并且要严格遵守这些标准。举例来说,考虑过其他假设吗?寻找过相反的证据吗?这些要求都是合理的。但是,预测的关键不是按部就班地完成“如何做预测”清单上的所有选项,而是要预见到未来。
抗拒万有引力,但是能坚持多久?
均值回归理论是检验运气对成绩的影响的必要工具。缓慢回归现象说明该活动的结果主要是能力导致的,而快速回归则是因为运气占据主导地位。
那么,超级预测家在年复一年的比赛中表现如何?这是关键问题。答案是,难以置信地出色。例如,第二年和第三年,我们看到反均值回归现象。它意味着,超级预测专家的成绩可能很少甚至完全没有运气的成分。
第五章 超级聪慧?内部视角、外部视角与其他视角
思维懒惰的人很难有希望追上终生学习的人。归根到底,真正重要的不是思考能力本身,而是使用它的方式。
费米方式
费米的理解是,通过分解问题,我们可以更好地区分已知和未知信息。因此,从黑盒子里取数字的方法,也就是猜数字法,并没有被排除。但是,我们要在日光下进行猜测,这样,我们可以检验它的合理性。最终结果一般比第一次听到这个问题时任何从黑盒子里蹦出来的估计值更加准确。
费米以预测准确著称。他很少处理甚至完全不处理信息,经常像这样做一些粗略的计算,然后得出某个数值。随后的评估表明,他的结果准确性非常高。
从外部视角开始
你可能感到疑惑,为什么首先要考虑外部视角。可以直接冲入内部视角,得出结论,再转向外部视角。那样做难道达不到同样的效果吗?很遗憾,是的,很可能达不到同样的效果。这是一种被称为“锚定效应”的基本心理学概念所导致的。
我们在做预测时,往往从某个数字开始,然后对它进行调整。这个初始数字被称为“锚”。它很重要,因为我们通常不会对其进行调整,这意味着错误的锚很容易产生错误的预测。更糟的是,我们极易选择错误的锚。
所以,一开始就考虑内部视角的预测者面临的风险是被一个也许意义不大甚至毫无意义的数字所影响。但是如果这位预测者从外部视角入手,他的分析就会从有意义的锚开始。更多的锚赋予他明显优势。
内部视角
要做到对内部视角进行合理分析,应该有针对性、有目标,因为这是调查,不是闲庭信步。
我们可以对这些基本要素分别展开研究,寻找正反两方面的证据,了解它们的真实程度,进而推断出该假设为真的可能性有多大。接着,我们依次探讨每个假设。
假设与反面假设相结合
确定外部视角和内部视角,并且使二者相结合,这还不是终点,而是好的开始。超级预测家不断寻找其他视角,整合到自己的视角中。
要求人们假设他们的初始判断是错误的,然后认真思考错误原因,接着做出新的判断,产生第二次预测,并与第一次相结合,仅仅做到这几点,就能大幅提高准确性,使得第二次预测就像是其他人的成果。此外,要求人们在几个星期之后再进行第二次预测,也能产生同样的效果。这种方法以“群体的智慧”这个概念为基础,被称为“内心的群体”。
还有一种更简单的获取其他视角的方法:微调措辞。
蜻蜓式预测
忘掉思考两次的老建议吧,超级预测家经常思考三次,甚至有时这只是进行深度分析前的热身。
对超级预测家而言,观念是要接受检验对假设,而不是要护卫的珍宝。
第六章 超级宽容?像华尔街的数字巫师一样
虽然超级预测家有时确实会运用自创的易于理解的数学模型,或者借鉴他人的模型,但这种情况很少发生。他们的大部分预测仅仅是认真思考和细致判断的结果。
第三种设定
关于可能性,阿莫斯认为,大多数人只有三种设定:“将会发生、不会发生和也许”。
石器时代的概率
三种意识设定造成的困惑是普遍现象。人们认为如果某件事情发生的概率为80%,那就表示它一定会发生。概率具有根深蒂固的反直觉天性,某件事发生的概率为80%意味着有20%的概率不会发生。
信息时代的概率
科学家以一种截然不同的方式谈论概率。他们喜欢不确定性,至少接受它,因为在关于现实世界的科学模型中,确定性是虚幻的。
如果一切都不确定,那么我可以得出结论,两种或三种意识设定有致命缺陷。是或否表示的是确定性,必须去掉。唯一保留的设定是”也许“,这是人们本能地想要避免的设定。
”也许“必须再细分为不同程度的可能性。一种方法是使用模糊的字眼,例如”很可能“或者”不大可能“,但是我们已经分析过,这会产生危险的歧义。正是由于这个原因,科学家才会偏好数字。这些数字应该在预测者掌控能力范围内进行合理的细分,也就是说,可以是10%、20%、30%……或者10%、15%、20%……或者10%、11%、12%……细分程度越高越好,但是颗粒度必须体现实际的差别,这意味着,预测概率为11%的结果实际发生频率确实比12%的结果低1%,比10%的结果高1%。这种复杂的意识设定是概率思维的基础。
对我们而言,概率思维与更容易出现在我们脑海里的两种或三种意识设定相比较,就像是两种完全不同的生物:鸟与鱼。它们建立在对现实的不同假设和不同处理方法的基础之上。熟悉其中一种思维方式的人可能会感觉另一种方式极其陌生。
超级不确定性
对不可简化的不确定性的认知是概率思维的核心,而评估不确定性是一项棘手的工作。为了完成这项工作,我们要利用哲学家所提出对“可认知的”不确定性和“偶然遇到的”不确定性的区分方法。所谓可认知的不确定性,指的是现在还不知道但至少理论上可知的不确定性。而偶然遇到的不确定性,指的是不仅现在不知道,而且是不可知的。
但是这到底意味着什么?
预测者越倾向于命中注定思想,预测的准确率越低。或者,从正相关关系来说,预测者越支持概率思维,准确率越高。
第七章 超级新闻迷?如何像蜻蜓的复眼一样敏锐
超级预测的方法与数学画(色块画)的画法不同,但是超级预测家经常用与之相似的方法来处理问题,我们任何人都可以学习这种方法,即:将解决问题的过程分解为若干部分。尽可能明确区分已知信息和未知信息,认真考虑所有的假设。借鉴外部视角,把问题置于比较视野下,淡化其特殊性,同时将其作为广泛的同类现象中的特例进行处理。然后,通过内部视角分析问题的特殊性。此外,还要研究自己的观点与其他人的观点有哪些异同,特别是要注意预测市场和其他吸取群体智慧的办法。综合所有视角,形成自己的判断,要像蜻蜓的复眼一样敏锐。最后,尽可能精确地表述你的简介,运用细分概率作为结论。
预测不同于彩票。彩票是这样的:买了,没中,扔掉,继续买,直到中大奖。而预测是建立在现有信息基础上的判断,如果信息发生改变,预测也要相应地变动。
过犹不及
让你脱颖而出的做法是,正确判断微妙的信息,进行相应的调整,这样你才能比别人更快猜出最终的结果。
预测者完成初始预测后,面临两种危险。一是没有给予新信息足够的重视。这是反应不足。二是对新信息反应过度,过度解读它的意义,调整预测的幅度过大。
明托队长
现在我们掌握了胜利公式:大量的小幅更新。依此行事,你很快就会在预测比赛中取得佳绩,对吗?我倒是希望这么简单。不过,它不是能打开所有锁的万能钥匙。有时使用这种方法恰恰适得其反。
我理解有人渴望找到防止错误的规则来保证结果不出问题,这是刺猬型评论员及其错误的确定性对我们的致命吸引力的根源。这里没有什么魔法公式,只有明白无误的规则和诸多告诫。超级预测家知道这些规则,但也明白,运用它们需要细致入微的判断。他们宁愿违反这些规则,也不想交出一份简单粗糙的预测。
第八章 永远的贝塔:超级预测家是如何炼成的
成长型思维模式:相信自己的能力主要是努力的结果,自信可以通过“成长”达到愿意努力工作和学习的状态。要成为一流的超级预测家,成长型思维模式必不可少。
总是在颠覆
“总是在颠覆”的约翰 • 梅纳德 • 凯恩斯有一个没有被颠覆的信念,那就是他可以做得更好。失败并不意味着他的能力已到极限,而是意味着他必须努力思考,然后再一次尝试。“尝试、失败、分析、调整,再次尝试”,凯恩斯永不停息地重复着这些步骤。
凯恩斯的高度是大多数人都达不到的,但是上述过程,“尝试、失败、分析、调整,再次尝试”,是所有人的基本学习方式。
尝试
要学会预测,就必须尝试预测。阅读预测相关的书籍不能替代实践经验。我们需要“隐性知识”,这种知识只能来自千辛万苦得来的经验。
失败
不是所有的实践都会提高技能,必须是合理的实践。你需要知道应该注意哪些错误,最佳的实践到底是哪些。有效的实践还需要明确的、及时的反馈。
分析和调整
一个问题无论何时结束预测,超级预测家都会敏锐地想出提高预测水平的方法,一如他们能够敏锐地判断出之前自己的表现如何。通常,事后剖析要像考虑初始预测时那样认真仔细、勇于自我批判。
韧劲
韧劲是对长期目标的充满激情的坚持不懈,即便面对挫折和失败也不退缩。它与成长型思维模式一起成为个人进步的潜在的力量。
第九章 超级团队:从愚蠢团队到智慧团队
团队有可能产生可怕的错误,也可能做出敏锐的判断,并且共同完成仅靠个体无法完成的工作。管理者关心的往往只是正面或负面结果,其实他们需要关注两方面结果。
组团还是不组团?
最终,我们选择组建团队来开展研究,这有两个理由。其一,在现实世界中,未经过与他人讨论就进行重要预测的情况很少见,因此,在现实中想要更好地理解预测,就需要用团体思维更好地理解预测这门技术。其二,好奇心。
超级团队
超级团队是怎样做到如此出色的?他们的诀窍,一是避开极端的团体思维和互联网论战;二是培养这样的微型文化:鼓励队友怀着尊重对方的心态相互质疑,敢于承认无知,大胆请求帮助。
第十章 领导者的两难抉择:如何成为超级领导者
这看起来像是严峻的困境。领导者必须是预测者,同时也是领导大家的人,可是,似乎其中一个角色成功所需的因素会阻碍另一个角色的成功。
毛奇的遗产
在战争中,一切都不确定。战场需要会思考和独立行动的战士,他们可以巧妙地、果断地、大胆地利用任何局势,他们知道,胜利有赖于每个人的努力。
我喜欢艾森豪威尔
“大胆行动应该是正确行动,如果行动本身是错误的,就不能称为大胆行动。”领导者“必须制订正确的行动计划,然后大胆执行”。领导者的平衡能力达到什么水平决定了他们的组织能够在多大程度上成功建立超级团队,这些团队又可以在整个指挥系统复制这种平衡艺术。
企业的任务导向指挥系统
我们让员工知道我们希望他们能够实现的目标,但是—这个但是非常重要,我们不告诉他们如何实现这些目标。
特殊的谦卑之心
保持明智的谦虚的人认为,现实世界极其复杂,认清事物真相始终是一项永恒的挑战,所以人类的判断一定错误百出。
补充
无法理性应对不和谐声音的预测者在与他人对抗的过程中可能会犯下最严重的预测错误:低估对手。道德和能力之间没有必然的联系。
第十一章 真的如此出类拔萃?黑天鹅事件也可以预测
某些超级预测家如此擅长通过第二系统来纠正思想,例如冷静下来从外部视角看待问题,以至于这些技巧已经成为习惯。事实上,它们现在已是第一系统的一部分。这听起来也许有些奇怪,但它并非不可思议的过程。
黑天鹅出现
也许我们没有证据证明超级预测家可以预见“9 • 11”恐怖袭击那样的事件:但是我们确实有一大堆证据表明他们可以预测下面这样的问题:如果塔利班拒绝交出奥萨马 • 本 • 拉登,美国会威胁动用武力吗?塔利班会同意美国的要求吗?本 • 拉登会在美国入侵前逃离阿富汗吗?通过这样的预测可以预见“ 9 • 11”恐怖袭击之类的事件的结果,而这些结果正是构成黑天鹅事件的要素,如果超级预测家能够达到这种水平,我们就可以预测黑天鹅事件。
求同存异
我们所生活的世界只是从大量可能世界中以近乎随机方式出现的。细细思量历史如何演变出无数不同的结果,现在又如何孕育无数不同的未来,就像思考银河系中无知的1000亿颗行星和宇宙中已知的1000亿个星系一样,让我们产生了深层次的谦卑之心。
通过巨大努力,至少在某些真正重要的发展趋势上,人们可以得出准确的预测。诚然,面对万事万物的庞大体系,人类的预见能力微不足道,但我们完全不必去嘲笑之,因为我们的生命本身就是这样微不足道。
第十二章 接下来做什么?我们可以做得更好
对无限未来的模糊预测没有意义。不清晰的概念永远不可能被证明错误。只有当我们的想法被明确地证明错误、我们无法再否定这一点时,我们才会调整自己的世界观模式,形成对现实世界更清晰的认识。预测、评估、修正,这是改进预测的最确定的路径。
“谁—谁”现状
“谁—谁”从字面上看,这是列宁所说的下面这个句子的简写:“谁来统治谁?”争论和论据只是可爱的装饰品,真正重要的是无休止的斗争,大家都想成为第一个谁,而不是第二个。这种观点认为,预测的目标不是看清未来,而是增加预测者本人及其所在集体的利益。
不过,在放弃努力之前,请记住,列宁的观点有些武断。诚然,人们希望获得权力,但是他们所珍视的不只是权力。这一点会产生重大影响。
变革
从这个更广泛的视角来看,基于数据的预测并非从石头缝里蹦出的猴子。它是传统决策方式向着定量分析的广泛而又深远的变革的又一次体现。
当然,这项改革举措很可能在极短时间内就无法继续推行下去。不过,这仍然是了不起的可喜变化。长期而言,历史终归会站在我们一边的。
人文主义者的反对
数字是好东西,并且有用,但是我们必须注意不要过分迷恋它们。
但是,不要认为,因为得分系统需要微调,所以它算不上大的进步。请想想饱受诟病的消费者信用等级系统。几十年前,信用评分还未出现时,信贷员随意决定是否给你贷款,你的命运取决于能否让他们想起某个熟人,他们前一晚的睡眠质量如何,或者,他们是否刻板地认为你是“混日子的黑人”或“不负责任的女性”。信用评分也许绝非完美,但也是巨大进步。同样,虽然我不能宣称我的得分系统完美,但它在判断预测者的能力方面也是一次重大进步。
重要的问题
这样看来,大问题显然可以分解成许多小问题。如果我们提出了很多相关的小问题,最终就能得出大问题的答案。
最后一个点子
当“凯恩斯主义者对阵紧缩派”这样的争论出现时,主要人物可以借助得到信任的第三方的帮助,共同努力来确定他们的分歧所在以及哪些预测能够有效地检验他们的分歧。关键在于精确性。一方面,紧缩派认为某项政策会导致通货膨胀;另一方面,凯恩斯主义者认为不会。但是,通货膨胀会达到什么程度?评估标准是什么?持续多长时间?讨论的结果应当是一个将模糊性降至绝对最小值的预测问题。
我们要做的就是认认真真地给预测评分。
↓点击直达200人共学的成长日课