Source: epuber.com
假设你走进了一所大学,遇到了一位学生。
你和他聊了一会儿,发现他比较害羞,和你交谈时不大习惯和你对视,还有一点拘谨。
现在让你猜,这位学生更可能是一个数学系博士生,还是一个商学院学生呢?
大部分人会猜测他更可能是数学系博士生。
原因很简单,一般来说,和商学院学生比起来,数学系博士生更可能会害羞和拘谨。
这看起来是合理的,但我们习惯性地忘掉了另一个重要的信息:一个大学里,一般有多少数学系博士生,有多少商学院学生呢?
事实上,大学商学院学生的数量往往是数学系博士生的10倍以上。所以即便在数学系博士中80%的人更可能害羞和拘谨,在商学院学生中只有10%,那么这位学生是商学院学生的概率仍然大于是数学系博士生。
这里涉及到一个概率论里的定理:贝叶斯定理。相信大部分人都听说过。
后验概率 = 先验概率 x 调整因子
这个公式其实不难理解:我们对一件事发生的概率判断,会随着我们掌握新的信息,而做出调整。
先验概率是你进入一所大学遇到一位学生,他恰好是数学系博士生的概率,也就是数学系博士生在全校学生中的比例。
但你不久后发现,这位学生有些害羞和拘谨,这时你根据新的信息加入「调整因子」,重新对这位学生是数学系博士生的概率做推断,得到后验概率。
再举另一个例子。
假设你去医院检查,被诊断出患有一种罕见的绝症,医院声称现有技术对于该疾病检测准确率为 99%。你是否应该认为你有99%的概率真的得到绝症呢?
事实并非如此,如果这个罕见绝症在正常人群的发病率只有千分之一的话,那么通过计算你会发现你实际上真正患有这种疾病的概率只有9%。
在上面这两个例子中,我们都能看到一种偏见:我们有时候容易高估最新信息的影响,而忽视先验概率。准确的认识到这一点能够避免很多判断失误。
另一种偏见
那么反过来,我们是否会有时候高估先验概率的影响呢?
我有一位好朋友,是一位专注价值投资的基金经理。他在大约三年前,翻过中国一家叫「安琪酵母」的上市公司的年报。
这家公司当时的年报很差,过去的两年里利润一直在下滑。此外,这家公司还是一个地方的国企,绝大部分股份并不在管理层手中。所以他当时的结论是:一家管理混乱,业绩差的国有企业,没有太多投资价值。
然而,之后的3年里,这家公司的利润翻了近3倍,股价翻了4倍多。
先验数据是我们根据历史统计数据得到的一些基本观点,但有时候也会成为我们的「刻板印象」,我们必须要学会根据最新的证据,动态地调整。
贝叶斯模型与超预测
上面这两种偏见确实常见,但不是我写这篇文章的原因。贝叶斯推断在我们生活中更多的应用反而不是计算概率的数字,而是它背后的思想。我叫这个思维模型为「贝叶斯模型」。
下面我想聊一下贝叶斯模型在不同领域的应用。
2011年,著名的心理学和社会学家,宾夕法尼亚大学教授菲利普·泰洛克与美国与美国情报机构合作,发起了“精准预测项目”。
在随后的4年里,累计超过两万名普通人参与了这一项目,他们对许多复杂的全球性问题进行了为期半年到一年期的预测,比如——
结果是,这个「精准预测团队」在近80%的问题上,预测准确度都高于可以接触到机密数据的专业情报分析师和学术界的竞争对手。
这个项目里表现突出的超级预测家,在2012年美国总统大选中不仅预测对了奥巴马战胜罗姆尼,还预测对了所有50个州两人的胜负结果。一个都不错。
这些超级预测家都有什么共性呢?菲利普·泰洛克在《超预测》一书中着重讲了这一点。下面这张图,是一位顶尖超级预测者的观念更新方式。
我们看到顶尖超级预测者们开始于一个基础概率(先验概率),然后根据新的信息,不断地动态小幅度调整、迭代自己的预测结果。
菲利普·泰洛克在《超预测》一书中解释到: