8月31日,
数据工坊沙龙第5期
完结撒花,本期沙龙以 “数中自有黄金屋” 为主题,邀请了中信建投基金市场部经理马欢和数可视研究员李岚和大家分享,两位分享嘉宾分别以“用数据帮你理财”和“用数据思考”为主题。公号将分为上下两期来发布沙龙内容,下面是李岚的分享回顾:
数据可视化大师汉斯·罗斯林的新书(中文版)出版啦!新书开头用13道题目来测试大家眼中的世界,这套题目,罗斯林曾经拿给很多CEO、专家、学者测试,至今没有一人全部答对。来挑战一下吧:(题目答案在本文留言区)
如果请动物园的大猩猩来回答,ABC三个选项,1/3的概率答对,它们至少可以答对4道题目!然而,80%的人的正确率不及大猩猩。我第一次回答的时候,只对了2道题目。
更加神奇的是,大猩猩是随机选择答案的,但我们会倾向于选择那些“世界变得更糟糕”的选项。
为什么我们对于世界的认知还不如一只大猩猩呢?
我们有哪些思维误区,使得我们情绪化的作出决策,我们又该如何用数据思考呢?
当我们用一分为二的思维来看待世界的时候,似乎世界上就只剩下贫穷国家和富裕国家,而中等收入国家这个概念貌似不会出现在我们的思维中。事实上,
全世界75%的人口生活在中等收入国家。
把事情一分为二,这似乎成为了我们的本能。当罗斯林给瑞典顶尖大学的学生做测试题的时候,也有很多人选择了A,他们的反应是,发展中国家的人们很难像发达国家的人们这样生活啊。
(制作动态气泡图:
http://hanabi.data-viz.cn
)
如果时间倒退到1965年,按照收入和人均寿命来看,不同国家之间的确会有一个gap,经过近60年的发展,国家之间gap在缩小。如果我们的思维停留在之前的思维上,会为我们的决策产生误导,谁也不会用60年前的GPS来导航呀。
如何避免一分为二的误区呢?罗斯林给大家了三个 don't do that:
虽然说,平均数是我们常用的统计工具,但是只看平均数会让我们产生一种一分为二的错觉,书中的案例:男生和女生之间的分数看上去有一个gap,但实际上,他们分数的分布却有很多重叠之处。
提问:世界上有多少穷人和富人呢?回答:
大部分都不是穷人也不是富人。例如,罗斯林在视频中讲到了,最富的人和最穷的人只占了很小的比例,而我们有时候习惯性把注意力放在极端值上,忽视了庞大的中间群体的存在。
视频链接:https://www.gapminder.org/answers/how-many-are-rich-and-how-many-are-poor/
假设我们在飞机上看地面上的房屋和汽车,看上去他们的大小是差不多的,但实际上他们的差距很大。我们对于世界的认识,容易受到生活的环境的限制,当我们看待收入低于我们的人群的时候,往往容易忽略不同低收入人群之间生活的差异,比如有的人有摩托车,有的人只有自行车;有的人可以穿拖鞋,而有的人却根本没有鞋子可穿。
1800年,人均寿命只有31岁,当时人类面临饥荒,儿童的死亡率也相对较高。200年间,人类经历了战争和自然灾害,而媒体选择性报道会放大坏事情的影响力。(好消息不是新闻,我们总听到坏消息)
即使有坏事的发生,并不意味着世界在变坏。
书中列举了16件坏事的趋势在下降,比如说儿童死亡率,而这个指标不是孤立的,因为,儿童死亡率的下降说明,医疗水平的提升,母亲受教育的水平也在上升。另外,16件好事的趋势在上升,比如,更多的新电影和新音乐。
一位6岁孩子的身高在1.3米左右,如果她一直保持这样的生长速度,那么在她在大一那年可以长到4米高。听上去很好笑,人的身高不会一直保持直线上升,但是,我们也经常进入直线思维的误区。比如说这道题目:
今天全世界有20亿儿童,他们的年龄从0到15岁,那么根据联合国的预测数据,到2100年,全世界会有多少儿童?
直线思维会很容易让我们选错。
人口的增长从一种失衡状态变成了平衡,
100年前,一个家庭5个孩子,但这5个孩子有可能会因为疾病而夭折;一百年后的今天,平均一个家庭有2个孩子,并且这两个孩子可以健康长大。
如何控制直线思维呢?事实上,事物的演变方式有多种,比如,除了直线之外,还有驼峰曲线和s型曲线:
驼峰曲线(x轴代表不同收入的国家,y轴代表百分比)
s型曲线(x轴代表不同收入的国家,y轴代表百分比)
根据罗斯林调查,大多数金融投资从业者的回答是A,他们基于自己的偏见作出的选择,会让他们失去投资疫苗的机会。
即使我们有大量数据,我们对大数据的解读也会受到偏见的影响。例如,咨询师Tricia Wang在2009年受雇于诺基亚,在中国调研年轻人使用手机的习惯时,她意识到了中国年轻人对于智能手机的热爱,他们会花一半的工资购买iPhone。但诺基亚并不相信她的结论,因为她的结论并不基于一个庞大的样本,也不符合任何既有的模型,之后诺基亚发生了什么大家也很清楚了。
数据很多时候会回答我们when, where, what, who的问题,但是很少回答我们how,几乎不会回答why的问题,
这个时候就需要我们结合定性访谈等方式来发掘答案啦。
大家有感兴趣的话题,欢迎留言,下次沙龙可以聊一聊你关心的
往期回顾