文/谭校长
最近deepmind和哈佛大学的研究人员合作,在nature上发表了一篇论文。主题是关于对人脑的多巴胺算法的研究,研究的结论认为,人脑中存在着跟现代AI的分布式强化学习非常类似的机制。
强化学习是现代人工智能的一个分支,简单的理解就是说通过奖励和惩罚来强化行为,通过这种机制,机器可以学习各种复杂的行为,如下围棋,打星际争霸等等。
之前我在专栏中讲过,人的奖励主要是通过多巴胺这种快乐激素的分泌来进行的,我也提到过通过对老鼠等哺乳动物的研究,
人类早就发现多巴胺分泌的算法是一种预期算法。
是简单的说,只有在得到的回报超出预期的时候,多巴胺才会大量分泌,给人很大的快乐。如果你得到了某个成果,但是这个成果是在你的预期之内的,其实这个时候多巴胺会分泌得很少。这就是为什么,一个人可能工资很高,但是他在拿到工资的那一刻并不会有多么兴奋。因为这都是在他预期之内的。
结合这个独特的多巴胺算法,今天我来讲一讲投资中的胜率和赔率。
什么是胜率和赔率呢?比如你跟别人玩抛硬币的游戏,你每次都猜正面,如果你赢了就赢1元钱,输了也输一元钱。在这个游戏中,你的胜率是50%(硬币出正面的概率是50%),你的赔率是1:1。
先请你思考一个问题。在股票市场能够让你觉得超预期的,也就是说能够促使你的多巴胺大量分泌,让你特别快乐的是些什么事情?
举个例子,你用10元的成本买入一只股票,本来预期它能涨到12块就不错了,结果遇上了某个突发题材,接连涨停板一下子涨到了20块,这个涨幅大大超出了你的预期。你会非常的爽,这个爽的背后就是你的多巴胺大量的分泌。
再举个例子,你在朋友的劝导下第1次进入股票市场,本来想着作为新人能够不赔钱就好了,结果你运气好一进来就遇到大牛市,不管买什么都涨,一年的时间,你的本金就翻了一倍。年终回顾的时候你觉得特别爽,因为这大大超出了自己的预期。
你有没有发现一个有意思的地方?我举的两个例子都是赔率超出预期的例子,事
实上在投资中我们所遇到的超预期的事件,绝大部分都是赔率超预期带来的,而不是胜率超预期。
这是为什么呢?这背后是什么样的逻辑根据呢?
我们之所以很少遇到胜率超预期的投资事件,是因为在大部分时候,我们在作出投资决策的时候,内心都默认自己的胜率是比较高的。
很简单,你从市场的3000只股票中,精挑细选出了最爱的那一只,买入了,在买入的那一刻,你内心往往会假设自己这一次决策的胜率是非常高的,没有90%,估计你也认为有80%。当然需要说明的是,你内心自认为的这个胜率是一个主观胜率,并不是客观事实。
这就构成了一个非常有意思的现象,也许从长期来看,你经过统计发现,自己投资决策的胜率其实只有50%。但是每一次做决策的时候,在主观上你都认为自己的胜率超过60%、70%,甚至更高。原因很简单,如果在决策的时候你就能认识到自己的胜率不高,你根本就不会做这个决策,你不会扣扳机。
这种主观胜率跟客观胜率之间的偏差是如此之大,如此普遍,几乎成了一个普世性的现象,我给它取了一个名字叫做胜率幻觉。
因为胜率幻觉的存在,我们主观上大大高估了自己投资决策的胜率,这个预期已经很高了。所以在想要在现实中再实现胜率超预期就比较难了,这就是为什么我们所遭遇的超预期往往都是赔率带来的。
而我们前面已经分析过了,只有超预期的事件才能真正为我们带来多巴胺的大量分泌,我们带来快乐的奖励,而人的天性当然会追求快乐,
那么这个时候我们就会天然的去追求超预期的赔率。
说到这里也许你就能够恍然大悟,为什么在股票市场以及其他金融领域,很多人都倾向于去冒过高的风险,这背后就是多巴胺的生物算法驱动着他们去追求超预期的赔率。
为了追求这个超预期的赔率,他们宁愿去冒过高的风险。
看到这里也许你会感叹一声,
哪有什么自由意志,我们都不过是生物算法的驱使下的木偶而已。
然后我们再来看,在散户之间最普遍的一个现象——追涨杀跌。为什么那么多的人喜欢追涨杀跌,哪怕亏损也乐此不疲呢?
追涨意味着什么?追涨意味着人们偏好那些近期涨幅巨大的股票。近期涨幅巨大意味着历史的赔率高,也就是说,人们喜欢那些历史赔率高的股票,为什么呢?基于简单的惯性外推,人们会倾向于认为历史赔率高的股票在未来的赔率也高,
所以追涨杀跌的本质依然是,人类的多巴胺生物算法决定了,他想去追求未来的超预期的高赔率。
不过可惜的是,这个逻辑链条中有一个巨大的bug——历史的高赔率并不能线性外推,成为未来的高赔率,这个逻辑链条之间是断裂的。
当人们追涨杀跌的时候,买入的那些历史赔率高的股票,但是很可能这样的股票在未来的频率会变低,甚至变成负数,这就是很多人在追涨杀跌中亏损的原因。根本的原因有两个,第一个是人脑中的多巴胺算法的驱使,第二个原因是这个链条中一个巨大的bug。
事实上,在市场的很多阶段,未来赔率高的股票往往不是过去赔率高的股票。而恰恰是过去经过了充分下跌,风险充分释放之后的股票,未来的赔率会显著地提高。但这一点是反直觉的,甚至也是有点反人性的,很多人并不能清醒的认识到这一点。
总结一下,今天我们解析了人脑中的多巴胺算法,由此推导出了在投资领域,人总是会不由自主的追求超预期的高赔率,由此宁愿去冒不必要的风险,以及做出种种非理性的行为。那么这一点能给你带来什么样的启示呢?欢迎你在留言区留言。
谭校长一千零一夜:星空下的投资进化论
谭校长的朋友经常评价说,在中国如果有人能把投资,跨学科思维模型以及写作三件事情很好地结合起来,那么他一定是最佳人选之一。
这个评价让他有点洋洋自得,但也心生惶恐。他时常觉得,自己写作的速度跟不上思维的速度。于是终于某一天他下了一个决心:从2019年5月27日开始,往后十年,第一个小目标是在公众号的专栏写到一千零一篇(知识星球保持交易日每日更新)。
于是就有了“谭校长一千零一夜“这个栏目。
今天是2020年1月18日,星期日,你看到的是这个栏目的第
116
篇。