太阳肯定从东边升起而不是从西边升起,苹果成熟后肯定往下落而不是往上落,没有人会对这样的事情有疑问。如果天文学家告诉我们,公元2061年哈雷彗星会再次接近地球,也没有人会质疑这个结论。
上面说的都是确定性事件,是什么就是什么。但对于随机事件,借用塔勒布在《随机漫步的傻瓜》中的话来说:我们都是概率盲。也就是说,对于随机事件,人们往往有着这样或者那样的认知偏差。
我们先看一个例子。
某个人去体检化验,想知道自己有没有得癌症。
根据对全体人群进行统计,患有癌症的人群中,95%的人化验结果为“阳性”
没有患癌症的人群中,95%的人化验结果为“阴性”。全体人群中,有0.5%的人患有癌症。
现在问题来了,如果这个人化验的结果是“阳性”,那么他患有癌症的可能性有多大?
好多人脑子里第一反应是:既然患有癌症的人95%化验结果为“阳性”,而没有患癌症的人群中,95%的化验结果为阴性,那么一个人化验结果为“阳性”,他就有95%的可能性患有癌症。
其实,这是一个错的离谱的估计。
那么正确的结论是什么呢?我先说出答案,后面再详细讲解数学推导过程。
正确结论是:这个化验结果为阳性的人,患有癌症的概率只有8.7%,远远没到直觉认为的95%。
大跌眼镜吧?
下面再通过几个例子来看看概率盲们是怎么样对随机事件估计和应用的。
1. 对概率的估计
1)双色球
双色球是中国福利彩票的一种玩法。规则是:从编号为1-33的红色球中选6个号码,从编号为1-16的蓝色球中选1个号码,7个号码全都选对了就可以得大奖了,一般大奖的奖金是500万。那么中大奖的概率是多少呢?
可能好多彩民都是这么算的:红色球33个选对6个,那么选对概率是6/33=18%,蓝色选对的概率是1/16=6%,全选对的概率是0.18*0.06=1%。有1%的概率中大奖,我多买几次,总能中大奖吧?
其实,这样算概率就错的离谱了。33个选6个,可能性是C(33,6)种组合,结果是1107568。再加上蓝色球的16种可能性,一共的可能性是17721088(一千七百七十二万一千零八十八),也就意味着中大奖的概率是一千七百多万分之一。
但是彩民们大部分都算不清楚这个帐,对这种小概率事件的概率估计经常错的一塌糊涂,可能都差了好几个数量级。不光是彩民买彩票容易把概率估计错,对于其他小概率事件的估计,人们往往也错的离谱。
2)航空意外险
好多人坐飞机前,习惯买一份航空意外险,花20块钱,“万一”飞机失事,保险公司会赔200万。看到没有,这个“万一”就是许多旅客心中认为的飞机失事的概率,一万分之一。
但实际上飞机失事的概率是多少呢?根据国际运输航空学会的统计,飞机失事的概率小于五百三十万分之一。也就是说,一个人天天坐飞机,也需要1.45万年才能碰到一次空难事故。每530万个旅客购买了航空意外险,保险公司会收到1.06亿元,其中1个遇难了,保险公司赔200万,还能剩1亿多。所以说,保险公司就是利用了旅客对概率错误的估计而盈利的。
3)酒驾和开车看短信
人们有时对小概率事件的估计偏高,有时又对大概率事件的估计又会偏低。大家都知道酒驾容易发生车祸,但偏偏就有许多酒驾者不当回事,认为自己的驾驶技术高超,不顾自己和其他人的生命安全。据统计,全国每年因酒驾发生交通事故而死亡的人数超过2500人。
另外,开车时看短信(微信)发生事故的概率比正常驾驶高23倍,甚至远高于酒驾。从看清楚手机短信到抬头看路需要2秒钟,车速如果是60公里每小时,2秒钟可以开33米,再加上刹车,一般车至少要跑个五六十米。五六十米的距离,什么事故都能发生。所以,千万不要低估这样的大概率事件。
2. 对后验概率的估计
人们除了对一些事件原始概率容易错误估计外,对于发生某些事件后,对概率的重新估计(也称为后验概率)也容易发生错误估计。
1)赌徒谬误和热手效应
所有的赌徒都知道,某个六个面的骰子掷出“4”的概率是1/6。但如果赌徒们发现,某个骰子在12次赌局中有3次掷出了“4”,这时赌徒阵列就会分化:一派会认为既然出现“4”的次数比它“应该”出现的次数多(12次“应该”出现2次“4”),那么后期就会更小概率的出现“4”;另一派会认为,既然出现“4”的次数多,那么以后还会更大概率的出现“4”。
其实,12次赌局出现3次“4”,根本说明不了任何问题,未来出现“4”的概率还是1/6。这两类赌徒各自都犯了错误,第一类叫“赌徒谬误”,第二类叫“热手效应”。(大家如果感兴趣,我以后还会开专贴来讲这些错误)
有些“资深”彩民,往往根据过去的双色球号码“走势”来预测未来的双色球号码,不是陷入了“赌徒谬误”,就是沉迷于“热手效应”。事实上,每次开出的双色球号码都是完全随机的,和过去的号码没有一点关系。
2)小概率事件原理
我们假设骰子是均匀的,在这个前提下,前面掷出了几点,和后面将会掷出几点没有一点关系。但要注意一点,在这个前提下,如果发生了小概率事件,我们就需要进行反思,甚至可以推翻原来的前提。
还是前面的例子,如果观察发现掷了12次,12次全部都是出现“4”,那么下一次出现“4”的概率是大于1/6,还是小于1/6,还是等于1/6?
有些人会认为第13次肯定不会再出“4”了(赌徒谬误)。有些人会认为前面的和后面的没有关系,第13次出“4”的概率还是1/6(骰子均匀)。其实,连续12次都掷出“4”,这是一个小概率事件,概率为1/6^12=4.6*10^(-10)。这样的小概率事件居然发生了,就足以推翻原来的前提,从而得出新结论:骰子不是均匀的。
所以,我们可以基于这个新结论,认为这个骰子特别容易掷出“4”。所以,第13次掷出“4”的概率应该远大于1/6。
在概率论的知识体系中,假设检验是根据随机事件进行判断的常用手段。而小概率事件原理,是支持假设检验的理论基础。
3)贝叶斯公式
如果知道一些事件的发生概率,当新证据出现时,如何更新这样的概率呢?那就是贝叶斯公式:
P(B/A)=P(A/B)*P(B)/P(A)
其中:
P(A)为A事件发生的概率;
P(B)为B事件发生的概率;
P(B/A)为A事件发生条件下,B事件发生的概率;
P(A/B)为B事件发生条件下,A事件发生的概率;
如果对贝叶斯公式不理解,只是凭感觉来估算概率,那么也会得到错的离谱的估计。
现在回到文章开头的例子。
事件A表示:化验结果为“阳性”
事件A'表示:化验结果为“阴性”
事件B表示:患有癌症
事件B'表示:没有患癌症
根据对全体人群进行统计,结论是:
P(A/B)=0.95,表示患有癌症的人群中,95%的人化验结果为“阳性”
P(A'/B')=0.95,表示没有患癌症的人群中,95%的人化验结果为“阴性”
P(B)=0.005,表示全体人群中,有0.5%的人患有癌症
正确的做法是:这是一个条件概率的问题,我们想求得P(B/A)的概率。
利用贝叶斯公式之前,我们先要求P(A)的概率,即全体人群中检验结果为“阳性”的概率,需要用到全概率公式:
P(A)=P(A/B)*P(B)+P(A/B')*P(B')
其中P(A/B)=0.95,P(B)=0.005,P(A/B')=1-P(A'/B')=0.05,P(B')=1-P(B)=0.995
带入公式,得出P(A)=0.0545
最终用贝叶斯公式计算出:
P(B/A)=P(A/B)*P(B)/P(A)=0.087
也就是化验出阳性的人只有8.7%的可能性患有癌症。
从这个例子可以看出,如果不用贝叶斯公式,而只凭直觉估计概率,真的可以称为“概率盲”了。
3. 对概率的应用
有些人看到别人买彩票中大奖了,或者看到别人赌博赢钱了,感觉自己也不比他们差,也就开始买彩票或者赌博。最终的结局不用我说了,基本都是持续的在亏钱。
而另一些人,听别人说封闭式基金封转开折价套利不错,鼓足勇气做了一次,刚好碰到大盘下跌,亏损了。这些人就开始抱怨这个品种不好,发誓再也不碰封闭式基金了。这样的人,就和我前面讲的赌场老板儿子的段子一样,看到了某次亏损,就吓破了胆,根本不从全局考虑问题。
这两类人共同的特点就是:只见树木,不见森林。要想把概率应用好,一定要明白,概率只有对大量数据才会起作用,对小样本数据往往不起作用。要正确的在投资中把概率用好,一定要以“大数定律”为基础,持续地参与期望收益为正的游戏。
投资是一辈子的事情,绝不能因为某次错误的决策盈利了而持续做错误决策;也不能因为某次正确的决策发生了亏损而停止正确的决策。
每篇文章,欢迎个人转载。转发一下,帮助更多的朋友在投资道路上取得进步。其它公众号转载时,请联系我助理的微信yuanxh_xjtu进行白名单设置。
往期回顾:
“学好概率思维”系列篇
学好概率思维(1)——聊聊“幸存者偏差”
学好概率思维(2)——聊聊“收益、损失与波动”
学好概率思维(3)——聊聊“黑天鹅”
学好概率思维(4)——聊聊“大数定律”
学好概率思维(5)——聊聊“盈亏同源”
“做好资产配置”系列篇
做好资产配置(1)——投资要有大局观
做好资产配置(2)——做多元投资,吃免费午餐
做好资产配置(3)——理解收益与风险(上篇)
做好资产配置(4)——理解收益与风险(中篇)
做好资产配置(5)——理解收益与风险(下篇)
做好资产配置(6)——黄金应该怎么配置?
“投资纲领”系列篇:
在股市这个大赌场里,你想做赌徒还是赌场老板?
股市赚钱的三种驱动力
投资中的确定性与随机性
“散户为什么总亏钱”系列篇:
散户为什么总亏钱(1)——聊聊股票高送转
散户为什么总亏钱(2)——聊聊“股神”
散户为什么总亏钱(3)——聊聊杠杆
散户为什么总亏钱(4)——股票套牢后怎么办?
散户为什么总亏钱(5)——过度自信怎么治?
散户为什么总亏钱(6)——客户的游艇在哪里?
“投资工具”系列篇:
投资工具介绍(1)——如何让活期存款的利息暴增100倍——现金管理工具介绍
投资工具介绍(2)——凯利公式