在数据团的上一篇文章《该如何面对这个残酷的世界?》中,我们编写了计算机程序,对不同机制下的社会财富分配进行了情景模拟。不过,由于真实社会远比模型假设要复杂,模拟结果仍有诸多不完善之处。
今天,我们就用某理财类app和某大型网购平台的用户个人数据来看看,相对真实的社会财富分配是什么样的?
在这张图上,绘图区的上半部分是每个用户的财富值排名(不同的颜色代表不同财富值的人口),下半部分是一张中国地图。每一根线条,都连接着一位用户的财富排名及其所在地。如此,我们就得到了财富值的地域分布。
从这张图上,我们可以清楚地看到,顶级富人是很少的(红色),且顶级富人集中的地区只在于北上广深;次一级的富人(橙色)在一线城市和多个二线城市有密集分布;中产和穷人则在全国各地都有分布。总的来说,越是富人、分布越集中;越是穷人、分布越分散和平均。
看完地域分布,我们再来看看财富与年龄的关系。
可以看到,财富值在不同年龄段人口的分布也是极不均衡的。
不同年龄和性别组的人,网购习惯有什么不同吗?为了探究这种变化,我们使用了某大型电商平台在2016年5月-11月的用户行为数据。
我们把网购用户按性别和年龄分为若干组,分别统计了每组的网购行为(网购行为又分为购买、收藏两种)。可以绘制出每组人每天的网购行为曲线:
(说明:红色为女性组,青色为男性组。横轴为月份,纵轴为人均日均购买或收藏的商品数量。彩色线条为购买量,灰色线条为收藏量。)
把这张图拆解来看,我们可以得到许多信息。比如,每组人购买和收藏商品的习惯不同。
我们以正方形的面积大小代表商品数量的多少。其中,购买量为实心填色的正方形,收藏量为空心虚线的正方形。如果虚线正方形面积大于填色正方形,说明该组人收藏的商品比购买的要多;如果填色正方形面积大于虚线正方形,则说明购买比收藏的商品要多。
可以看到:
从青年到中年到老年,是一次从囊中羞涩到有钱任性,再到精打细算的历程。
对于囊中羞涩或者精打细算的用户来说,最关注的事情莫过于打折。而在各种打折促销活动中,“双11”无疑是最为浓墨重彩的一笔。
我们统计了这半年中每个月卖出的商品数量,用方块代表商品。哪个月卖出的商品多,它对应的方块就多:
可以看到,11月卖出的商品数量,几乎等于前5个月的总和!而双11当天的销量,是平日销量的100倍还要多!
有没有觉得很震撼?
震撼到你的,是双11,还是我们的图表呢?
要如何做出这样的图表呢?欢迎长按二维码,加入数据达人培养计划课程,和我们一起玩数据~也可以点击“阅读原文”,查看更多可视化作品。