专栏名称: 待字闺中

深度分析大数据、深度学习、人工智能等技术，切中实际应用场景，为大家授业解惑。间或，也会介绍国内外相关领域有趣的面试题。

被放弃的“概率权”

待字闺中 · 公众号 · 程序员 · 2017-02-01 20:32

正文

“我开始思考，什么是应该放弃的次要的东西，放弃了它我才能集中精力追求最重要的。而归根结底，只有一件事对我来说是最主要的：那就是和你在一起。”--安德烈·高兹

如上，一道”简单”的选择题。你按红色按钮？还是绿色？

这道题比想象中有趣，我试着回答一下:

1、根据期望值理论，绿色按钮价值5千万；

2、很多人仍然愿意选拿到确认的100万，因为他们无法忍受50%几率的什么都拿不到；

3、换而言之，假如一个人无法承受“什么都没有”，那么右边的选择就相当于“你有50%概率得到一个亿，有50%概率死掉”。你当然无法承受死，何况高达50%几率；

4、开放地想，假如你拥有这个选择的权利，你可将右侧价值五千万的选择权卖给一个有承受力的人，例如两千万（甚至更高）卖给他；

5、继续优化上一条，考虑到增加“找到愿意购买你该选择权利的人”的可能性，你可以只用100万（低首付）卖掉这个权利，但要求购买者中得一个亿时和你分成；

6、再进一步，你可以把这个选择权做成彩票公开发行，将选择权切碎了零售，两块钱一张，印两亿张。头奖一个亿。对比5，风险更低，收益更大；

7、鉴于6的成功商业模式，开始募集下一笔一个亿作为头奖，令其成为一项生意。

8、按照P/E估值，募集20亿，公开上市，市值100亿。

从100万到100亿，让我们研究一下背后的数学原理。

经济学里有三个著名的风险决策理论：期望值理论，期望效用理论，展望理论。

1970年代，卡内曼和特沃斯基系统地研究展望理论。长久以来，主流经济学都假设每个人作决定时都是“理性”的，然而现实情况并不如此；而展望理论加入了人们对赚蚀、发生机率高低等条件的不对称心理效用，成功解释了许多看来不理性的现象。

基于以上理论基础，我想探索几个有趣的话题：

1、反人性的“每一步都按照整体最优概率做决策”，是传统意义上成功人士的第一秘密；

2、穷人将自己的“概率权”廉价卖给了富人，概率权是更隐蔽、更大笔的剩余价值剥削（并不代表我认同剩余价值的概念）；

3、当下热门的人工智能，就是依靠每一步都独立、冷血的计算最优概率，从而战胜人类。例如阿尔法狗；

4、然而，非理性，冲动，有可能成为人类最后的堡垒。（我以后会单独写这个）

先过一遍基础概念。

期望值理论（智者的基本决策工具）

根据期望值理论，100%几率得到5000万，和50%几率得到一个亿，是一回事情。

贝叶斯定理，是聪明的决策者使用频率最高的简单公式之一。

说明：“用亏损的概率乘以可能亏损的金额，再用盈利概率乘以可能盈利的金额，最后用后者减去前者。这就是我们一直试图做的方法。这种算法并不完美，但事情就这么简单。”（By巴菲特）

举例a：（来自高盛前CEO鲁宾的传记）

“在两家公司宣布合并后，乌尼维斯的股票交易价为30.5美元（合并宣布前为24.5美元）。

这意味着如果合并事宜谈妥的话，来自套利交易的股价上涨可能3美元，因为乌尼维斯公司每股股票将会值33.5美元（0.6075×贝迪公司每股股票的价格）。

如果合并没有成功，乌尼维斯公司的股票有可能回落到每股大约24.5美元。我们购进的股票有可能下跌6美元左右。

我们把合并成功的可能性定为大约85%，失败的可能性为15%。在预期价值的基础上，股价可能上涨的幅度是3美元乘以85%，而下跌的风险是6美元乘以15%。

3美元×85%=（可能上涨）2.55美元

-6美元×15%=（可能下跌）-0.9美元

所以，预期价值=1.65美元

这1．65美元就是我们希望通过把公司30.50美元资本搁置三个月所得到的收益。这就算出了可能的回报率为5.5%，或者以年度计算的话为22%。比这样的回报率再低一些就是我们的底线。我们认为不值得为了低于20%的年回报率而支付我们公司的资本。 “

鲁宾特别解释道，这就是他每天要做的事情，看起来似乎是赌博，而且的确也经常会输掉。但他要确保的，是大多数时候赚钱。

举例B：（来自《黑天鹅》作者）

塔勒布在投资研讨会说：“我相信下个星期市场略微上涨的概率很高，上涨概率大概70%。”但他却大量卖空标准普尔500指数期货，赌市场会下跌。他的意见是：市场上涨的可能性比较高（我看好后市），但最好是卖空（我看坏结果），因为万一市场下跌，它可能跌幅很大。

分析如下：假使下个星期市场有70%的概率上涨，30%的概率下跌。但是如果上涨只会涨1%，下跌则可能跌10%。未来预期结果是：70%×1%+30%×（-10%）=-2.3%，因此应该赌跌，卖空股票盈利的机会更大。

如芒格所言，巴菲特每天做的，都是算这个简单数学问题。与其说是一种数学能力，不如说是一种思维模式。知道容易，做到极难。

概率有时候显得“反直觉”。

举例C：

一辆出租车在雨夜肇事，现场有一个目击证人说，看见该车是蓝色。已知：1、该目击证人识别蓝色和绿色出租车的准确率是80%；2、该地的出租车85%是绿色的，15%是蓝色的。请问：那辆肇事出租车是蓝色的概率有多大？

答：该车是绿车但被看成蓝车的概率是（0.15×0.8），该车是蓝车且被看成蓝车的概率是（0.15×0.8），所以该车真的是蓝车的概率是（（0.15×0.8）/【（0.85×0.2）+（0.15×0.8）】=41.38% ）。即，该车更可能是绿色的。

会不会和你的大脑直觉有些差异？我们的大脑做工虽然非常令人惊叹，但在有些数学直觉方面，显得非常稚嫩。

然而，期望值理论无法回答，为什么红色按钮价值低到100万，仍然有很多人选择？

期望效用理论（野心或者恐惧）

丹尼尔·伯努利在1738年的论文里，以效用的概念，来挑战以金额期望值为决策标准，论文主要包括两条原理：

a、边际效用递减原理：一个人对于财富的占有多多益善，即效用函数一阶导数大于零；随着财富的增加，满足程度的增加速度不断下降，效用函数二阶导数小于零。

b、最大效用原理：在风险和不确定条件下，个人的决策行为准则是为了获得最大期望效用值而非最大期望金额值。

回到文头的案例。选择红色按钮，立即变现100万，放弃价值5000万的选择权，一方面是因为“满足于”100万，就其财富而言，100万已经带来数量级的变化，而再多一个数量级也想象不到；另一方面，是想规避绿色按钮50%的归零风险。对归零的恐惧感，远大于多拿到4900万的期望。

确切说，选择红色按钮，交织着“期望效用理论”与“前景理论”的综合作用。

前景理论

《别做正常的傻瓜》引用因前景理论获得诺奖的卡尼曼的总结：

a、在得到的时候，人们都是风险规避的；

b、在失去的时候，理性者是风险规避的，“正常的傻瓜是”是风险偏好的；

c、理性的决策者对得失的判断不受参照点的影响，而“正常的傻瓜”对得失的判断往往根据参照点决定；（例如理性决策者不会非要等到回本才抛掉一只应该抛掉的股票）

d、正常的傻瓜通常是损失规避的。

如同行为经济学所研究的，社会、认知与情感的因素，会令人作出不那么“理性”的选择。

例如，财富的基数，作为参照点，极大程度上决定了人们去按红色和绿色。

也有例外。

扎克伯格不过是中产家庭出身。他仍能在公司成立两年的困难阶段，拒绝了雅虎的10亿美元收购。

就像snapchat数年后拒绝了扎克伯格的30亿美元收购要约。

这便是硅谷的精神之一。仅靠发财梦，很难驱动太大的事业。

财富观、雄心壮志、年轻，让他们按下了成功概率远低于50%的绿色按钮。

曾经和一位老兄聊天，他说，我们最缺的，其实就是有个老爸告诉自己你很牛逼。

为何书香门第或者财富世家会一出一大串牛人，除了基因，资源，可能还有以下原因：

1、有足够高的参照点，不会被小利益勾走，更能承受风险（其实是低概率的），从而捕获高回报；

2、身边一群人的示范效应；

3、被点燃的内心激励。

他们比平常人更不容易“廉价”甩卖自己的概率权。

被放弃的概率权

1、贫富差距的关键决策点上，“穷人”放弃了自己的概率权益；

2、所谓赢家的秘密就是，坚持按照优势概率行事，哪怕屡屡受挫也不更改人生下注的原则；

3、买彩票是最为昂贵的关于概率选择权的自暴自弃，所以被称为收智商税。

钱多的话就价值投资，钱少的话就赌一把。--这可能是投资领域最被广泛实施的愚蠢。

小概率的事情很难实现，看起来反而容易；大概率的事情则显得路途遥远，其实到达目的地的可能性要大得多。

放弃自己的概率权，选择舒适的小概率，其实是在用自己本来就微薄的资源，去补贴“成功者”。

为什么聪明人无法赢得赌局？

假如人生是一场概率游戏，假如我们的一连串选择决策决定了最终结局，那么，聪明人貌似该有“先天优势”。而事实并非如此。

概率来自赌博。帕斯卡和费马对赌博奇特结果的兴趣，引发他们提出了一些概率论的原理，从而创立了概率论。

以赌场玩家“不输”概率最高的21点为例，赚钱的秘密是：

1、选一个“友好”的赌场（相当于选对行业）；

2、对玩儿法基本功滚瓜烂熟；

3、如电影《决胜21点》般数牌；

4、在优势概率下，加大下注；

5、不管结果如何，始终如一地执行以上策略，情绪不波动。

聪明人能够做好1-4。

但是对于“反人性”的5，是许多聪明人的弱点。

谷歌技术团队与职业棋手，联合研究了阿尔法狗对李世石的棋谱，从中能看到“人工智能”在进行这项人类最难智力游戏时，到底是如何思考的。

阿尔法狗几乎会在每一手棋时，都计算自己的赢棋概率。即：对它而言，每一个决策点都是独立的，阿尔法狗都会冷静的寻找“当下”的最大获胜概率。

如本文前面所提及的鲁宾、塔勒布、巴菲特，他们差不多都是一个人肉阿尔法狗，坚持按照概率行事，经常看起来是“反直觉、反人性、反舒适”的。

绝大多数聪明人，还没有这种智慧，以及伟大的行事方式。

如何不贱卖选择权？

许多人生选择题，除了abcd，还可能有一个“其它”选项。

对了对付德国人的密码机，图灵决定“以机攻机”，然而领导不批预算，并喝令他服从上级命令。图灵同学灵机一动问：你的上级是谁？随后给丘吉尔写了封信搞掂十万英镑。

我可以按红色，也可以按绿色，意味着我拥有选择权。我可否有另外的变现渠道呢？

第三条路，出卖选择权，将其卖给VC和PE，是利用资本的风险喜好与承受力，分享了100万与5000万之间的价值地带。

有趣的是，财富世界为一穷二白的年轻人留下了一个暗门。他们并不因自己渴望100万而非得错失5000万。他们只需要更广阔的视野。

这是当下社会财富的创造与分配核心驱动力之一。亦为资本的美妙之处。

对于“选择权”的决策思想与行动模式，决定了最终的财富食物链。

人生选择有限

人生有很多个选择时刻，不能总是被“概率”和“最优”驱使。

就像《怒海争锋》里，杰克船长暂时放弃追杀敌船，选择停靠小岛，满足船医梦寐以求的达尔文式科学考察。

想起一个朋友，夫妻选择将创业和置业延后，将时间留给成长中的孩子。

许多美好事物和美好时刻，都是因为一些“不计算”的选择。

当然，最好我们手上有足够的、靠阿尔法狗概率计算法赢得的筹码，供自己去挥霍，或是帮助那些没有人生赌场权的人。例如盖茨的慈善基金。

也许选择本身比财富更重要。如果说时光是最宝贵的财富，比时光还有限的人生选择呢？

我想起1995年毕业后独自去广州，遇到一位师长，他见我有些无师自通的灵性，不吝在旁人面前赞“这是天才少年”。（时光总是嫌老爱幼，迄今为止尚未有人称我是天才中年。）

他注册自己公司的时候，头疼选名，于是说：不如就叫“选择”。

于是这公司成为我加入的第一间公司，其名字蕴含着广泛的人生隐喻：

“选择有限”公司。