几年前,参加过一个团队拓展游戏。
培训师把我们一群管理层分成两组,分别安排在两间对门的小会议室里,告诉我们游戏规则:
两组分别代表两家公司。需要选出一位组长,他就是最终下决策的CEO;
游戏共有10轮,每一轮,两家公司分别选择「偷袭」或是「合作」。
如果都选择偷袭,则都不得分;如果都选择合作,则都得2分;如果一家选择偷袭,另一家选择合作,前者得3分,后者得-1分;
胜利条件:最终得分比对方高,且不低于8分;
游戏过程中双方不得沟通,但有3次谈判的机会,可以各派出一个人去谈判。
好了,你可以思考一下:如果是你玩这个游戏,在这10轮之中,你会采用什么样的策略?
学过博弈论的朋友,应该一眼就能看出来,这是一个「囚徒困境」的升级版。
什么是囚徒困境?
假设有两个犯了案的囚徒,被警方单独审问,警方开出的条件是:
指认对方。那么对方将判刑5年,;
沉默。那么对方将无罪释放;
但如果自己沉默的同时,对方指认自己,那么对方将无罪释放,而自己将判刑10年,作为包庇的惩罚。
可以看到,对两位囚徒而言,最好的做法是都沉默,这样双方都能无罪释放。但是,如果遭到对方的背叛,自己就将面临10年刑罚;反过来,如果选择指认,运气好的话可以无罪释放,运气差的话,也不过是5年而已。
所以,尽管存在最好的情况(都沉默),但两位囚徒最终一定会选择互相指认对方,从而都判刑5年。
这里,囚徒们作出的决策,就是鼎鼎大名的纳什均衡。
它阐述了这一点:在信息没有充分沟通的情况下,双方都从自己角度出发,选择自己的优势策略(在实例中,就是「指认对方」),反而会得到一个「不好」的结果。
这是一个很违反直觉,但在生活中普遍存在的现象。
最常见的例子,就是广告战。
市场上,企业面临着「打广告」和「不打广告」两种策略。最好的策略,当然是大家都不打广告,好好做产品。这样,可以节省大量的广告开支。但是,如果自己不打广告,别人打了,自己就会蒙受损失;同样,别人不打广告,自己打,就能获利。
所以,最终的情况,一定会演变成「所有企业都在打广告」。效果得不到提升,还白白投入了大量开支。
回到囚徒困境。这里面的关键是什么呢?是猜疑链的存在。
第一,囚徒与囚徒之间难以沟通,「我们一起选择沉默吧,这样大家都可以无罪释放」这个想法,无法传递给对方。
第二,即使双方建立共识,也无法保证对方是否会背叛自己。毕竟,对于对方来说,选择「背叛」,风险永远是比「合作」更低的。
这是一个关乎人性和信任互利的决策。
回到最开始的游戏。
这个游戏跟囚徒困境有什么差异呢?很显然,是两点:
第一,这个游戏有十轮。也就是说,「无法沟通」这一点被打破了。双方完全可以在前几轮的较量中,用自己的决策来传递信息,进而影响对方的决策。
第二,这个游戏有下限条件。这非常符合实际:如果一个市场里,所有企业都在互相攻讦,忽视了对市场的占领,最后的结果就是两败俱伤。
如果没有下限,显然,最好的策略就是十轮都选择「偷袭」,这样自己一定不会输。只要对方选择了一次「合作」,自己就赢了。
但是存在下限,就给合作和信任留下了空间。
显然,一味「偷袭」,是绝对到不了8分的 —— 除非对方连续3次犯晕,选择「合作」。在这里,「活下去」就变成比「打败对手」更重要的事情。
如何确保自己能拿到8分?
先互相攻击,再合作,还是先合作,再对决?
是追求双赢,大家都拿8分,还是伺机给对面致命一击?
如果自己处于劣势,是委曲求全,还是两败俱伤?
如何利用好3轮沟通的机会?
是麻痹对面,还是释放善意、寻求共同发展?
这些,都是需要严肃讨论的问题。
不妨可以想想,如果是你,你会作出什么样的选择?你会如何说服其他人,支持你的决策?
讲一下我们玩的进度吧。
一开始,我们打算释放善意,未料对方以偷袭回敬,于是开局落后。几轮后,对方发现这样永远拿不到8分,于是开始试探着想要合作。几轮下来,我们反而扳回了优势。
后来,利用沟通机会,在我和对面组长的促成下,双方签订了协议,约定共同合作。
到了最后一轮,组里分化成了两派。一派表示,对方一定会选择偷袭,所以这一轮我们撕毁协议,也选择偷袭,这样大家都不得分;但另外一派坚决认为,既然已经签订了协议,就要遵守协议精神,反正就算我们落败,也拿到了8分,已经有了最基本的保障。
最后的结果是什么呢?其实也不重要了。整个游戏的过程,揣摩,分析,决策,说服,谈判,才是最有意思的。
为什么讲这个故事呢?是因为,前几天看到一个网站,叫做 The Evolution of Trust,用互动游戏的形式,探讨了这个问题。
它构造的博弈是一样的:
每一轮,你可以选择欺骗或是合作。选择前者,你没有损失;选择后者,你损失1枚金币,对方得到3枚金币。
如果双方都选择合作,则各自净获得2枚金币;都选择欺骗,则没有损失也没有获利;一人选择欺骗,另一人选择合作,前者获得3枚金币,后者损失1枚金币。
你会如何作出决定呢?
在这里,我们把作出决定的方式,叫做「策略」。
例如,有人可能会想「不管对方怎么做,我每一轮都要欺骗」;也有人可能会觉得「我坚信合作互惠是对的,我每一轮都要选择合作」。这就是两种策略:前者永远欺骗,后者永远合作。
如果把不同的策略放到一起混战,在经历足够长的时间之后,什么样的策略会取得优胜?
这个网站假定了这么几种策略:
1)狐狸:无论对方选什么,永远选择欺骗;
2)兔子:无论对方选什么,永远选择合作;
3)猫:第一轮选择合作,后面每一轮,都模仿对方上一轮的选择;
4)猎人:选择合作,直到对方出现第一次欺骗,从此以后,每一轮都选择欺骗;
5)侦探:前四次按照合作、欺骗、合作、合作的顺序。如果这四次里面,对方出现了一次欺骗,从第五次起,就按照猫的策略操作;如果对方一次欺骗都没有(大概率是兔子),就按狐狸的策略操作;简而言之,就是欺软怕硬。
它的规则是这样的:
假定有100个人玩这个游戏,把这5种策略,随机分配给100个人,每人使用一种策略;
所有人的初始状态是0枚金币;
游戏从1号开始。任意两个人之间,都玩10局游戏(1-2,1-3,1-4……1-100,2-3,2-4……2-100,以此类推),记下最终每个人的金币数量。
所有人都玩过一遍之后,找出金币最少的5个人(超过5个则随机挑出5个),把他们剔除出游戏,剩下95个人;
找出金币最多的5个人(超过5个则随机挑出5个),复制他们的策略,新增5个人,补足100个;
重复步骤3-5。
好了,如果上面的叙述比较模糊,可以多看几遍。
在这样的规则下,猜一猜,哪种策略最终存活下来的人数最多?
狐狸,兔子,猫,猎人,还是侦探?
作出自己的猜测后,再往下看。
想好了吗?我要公布答案了。
答案蛮有意思。
如果任意两个人之间,游戏局数较少(比如2局、5局),最终获胜的将会是狐狸。
但如果游戏局数较多(10局、20局),最终将会是猫统治全世界。
为什么呢?
原因很简单。狐狸是一个低风险低收益的策略,它可以保证不败,但难以保证获利。而对于猫来说,如果局数较多,就给合作互惠留下了更大的空间 —— 只要多遇到几次愿意合作的人,双方就都能「凭空」得到更多的金币。
具体的模拟过程,可以点击「阅读原文」,体验一下。
后面还给出了一些其他推论,比如「游戏过程中出现意外,怎么办」「是否把对方的欺骗当成意外来宽恕」等等,也很有意思。
实际上,这个游戏和结论,是美国政治学家阿克塞尔罗德,在其著作《合作的进化》中提出的。
他组织了一场竞赛,邀请一批科学家,设计了14个程序。每个程序使用一种策略,与其他程序各进行200次对局,循环5次。最终,一共进行了12万次对局。
最终获胜的策略是什么呢?就是猫。更广为人知的名字是「Tit for tat」,以牙还牙。
根据竞赛结果,大多数程序的得分在200-600之间,而以牙还牙的平均得分是504。也就是说,这个策略的结果,十分接近「永远合作」了。
这可以给我们许多启示。
《合作的进化》提到过一个案例:一战期间,英德双方对峙,但在最前线的一些战区,却出现了双方军人和平相待,擅自「休战」的行为。
书里写道:
每到天黑之后,军需官带着食品上来了,食品摆开后由从前线下来的小组取走。我想敌人大概也是这么做的。这样的事悄悄地做了几天之后,这些取食品的小组变得不在乎了,在回去的路上还有说有笑的。
到了圣诞节,引起司令部不满的友善行为更加扩大了。在之后的几个月,不时有人用叫喊或信号来安排直接休战。一个目击者这样写道:
在一个防区中早上8点到9点被认为是神圣不可侵犯的「个人时间」。一些插上旗作为标志的地方,被认为是双方狙击手不能打扰的范围。
这种现象之所以发生,是因为双方都知道这几点:
如果双方都开火,结果就是两败俱伤;
如果双方都不开火,大家都可以活下来;
如果一方率先开火,可能会遭受对方更猛烈的报复。
在这种「基于回报的策略」影响下,甚至发生了这样的情况:
突然一阵炮火打来,但没有造成伤亡。这时双方跳下土墙,我们的士兵开始骂德国人。这时立即有一个大胆的德国人跳上土墙,大声喊道:我们很抱歉,但愿没有人受伤,这不是我们的错,这是该死的普鲁士炮兵干的。
这说明什么呢?
在特定的情况下,只要双方拥有一致共识,并且基于足够长的时间,信任和互惠甚至可以在敌人之间产生。
那么,如何才能产生信任呢?
或者说,在前述的游戏里面,要想最终存活下来,需要满足什么条件呢?
简单来说,就是「以牙还牙」 —— 这就是最基本的原则。
它包含这么四点:
1. 释放善意
竞赛结果揭示了这么一种现象:所有得到高分的策略,都有一个共性 —— 它们都是善良的。
亦即,它们总是以「合作」开始,并且永远不会首先背叛对方。
道理很简单:背叛只能保证短期获利,一旦遭遇报复,双方就将两败俱伤。而一开始释放善意,遇到同类的几率更高,与对方建立信任互惠合作关系的可能性也就更高。
另一点是,彼此友善的个体之间,能够结成一个紧密的群体,双方都从这个群体中得益。由于这个群体是稳定的,故而也是难以被入侵和破坏的。
2. 给予反馈
释放善意,并不意味着愚蠢。如果你的善意遭遇背叛,理性的方式是给予警告,而不是一味退让。
「以牙还牙」的策略优异在哪里呢?它能够用一种最简单的方式,辨别其他人中,哪些是有可能合作的,哪些是无法合作的,并且选择跟前者建立联系,跟后者进行对抗。
一方面,它能够用更高的收益瓦解「背叛者」的群体;另一方面,当它受到外来的攻击时,也能够以正面回击的姿态保护自己。
3. 坦诚相待
跟很多人的想法相反,在这场竞赛中,算计越多的程序 —— 试图诱导对方相信自己、试图欺骗对方等,得到的往往是低分。
这是因为,这样思考的人,很容易犯一个错误:对方并不愚蠢,不会任由你欺负。当你设下陷阱欺骗对方时,也许对方看不透你的行为,但它能够知道「你是危险的」,因此,它会采取保守的姿态面对你。
这就导致了,很多时候,算计过多,效果就跟「永远欺骗」一样,在尝到最开始的甜头之后,遭遇到的是闭门羹。
相反,坦诚相待,一个最大的好处,就是对方很容易理解你。在这个基础上,能够降低对方的戒备,提高稳定感,更有效地建立联系。
4. 不要冲动
现实生活中,绝大多数时候,是非零和博弈。就像前面讲过的团队拓展游戏:分数可以有高低,但双方都能保证拿到8分,也就是能够「活下去」。这未必不是一个可以接受的结果。
很多时候,与其玉石俱焚,不如退一步,为自己争取最后一线机会。
这需要的,是非常理性和冷静的心态,不受之前的挫折、失败和背叛影响。
永远记住,理性人不考虑沉没成本,不考虑过往的恩怨,只考虑边际收益。
用一个狼人杀场景来举例。
你是狼人,现在是夜晚,场上剩下一个第三方,一个猎人,你非常讨厌第三方,不想让第三方赢,那么,你应该刀谁?
刀第三方?如果这样做,第二天猎人出局,开枪带走你,结果就是流局,场上无人获胜。
理性的做法,是刀猎人。这样,猎人出局,开枪。有50%的可能性带走你,但也有50%的可能性带走第三方。
如此,你才可能有一线胜机。
当然啦,这些只是在游戏模拟下的结果,现实生活中是否也是如此?
不知道。但我希望是。
至少,这样的话,这个世界会更有希望一些。: )
THE END
- 晚 安 -
我是 Lachel,可以叫我 L 先生
互联网经理人、高效管理达人
知乎 9 万关注、25 万赞作者
LinkedIn / 36 氪 / 插坐学院特约作者
很高兴认识你 :)