专栏名称: 城市数据团
用数据认识世界 | 用数据改变未来
目录
相关文章推荐
数据派THU  ·  TimeMOE: ... ·  昨天  
数据派THU  ·  使用PyTorch从零构建Llama 3(附代码) ·  4 天前  
CDA数据分析师  ·  【实战】利用BI工具搭建贷款经营看板 ·  2 周前  
大数据文摘  ·  当代年轻人,在AI实现婚纱照自由 ·  1 周前  
51好读  ›  专栏  ›  城市数据团

如何用有趣的可视化方式来表达不同人群的网购特征?

城市数据团  · 公众号  · 大数据  · 2017-08-04 22:31

正文

在数据团的上一篇文章《该如何面对这个残酷的世界?》中,我们编写了计算机程序,对不同机制下的社会财富分配进行了情景模拟。不过,由于真实社会远比模型假设要复杂,模拟结果仍有诸多不完善之处。


今天,我们就用某理财类app和某大型网购平台的用户个人数据来看看,相对真实的社会财富分配是什么样的?




在这张图上,绘图区的上半部分是每个用户的财富值排名(不同的颜色代表不同财富值的人口),下半部分是一张中国地图。每一根线条,都连接着一位用户的财富排名及其所在地。如此,我们就得到了财富值的地域分布。


从这张图上,我们可以清楚地看到,顶级富人是很少的(红色),且顶级富人集中的地区只在于北上广深;次一级的富人(橙色)在一线城市和多个二线城市有密集分布;中产和穷人则在全国各地都有分布。总的来说,越是富人、分布越集中;越是穷人、分布越分散和平均。


看完地域分布,我们再来看看财富与年龄的关系。




可以看到,财富值在不同年龄段人口的分布也是极不均衡的。


不同年龄和性别组的人,网购习惯有什么不同吗?为了探究这种变化,我们使用了某大型电商平台在2016年5月-11月的用户行为数据。


我们把网购用户按性别和年龄分为若干组,分别统计了每组的网购行为(网购行为又分为购买、收藏两种)。可以绘制出每组人每天的网购行为曲线:


(说明:红色为女性组,青色为男性组。横轴为月份,纵轴为人均日均购买或收藏的商品数量。彩色线条为购买量,灰色线条为收藏量。)


把这张图拆解来看,我们可以得到许多信息。比如,每组人购买和收藏商品的习惯不同。




我们以正方形的面积大小代表商品数量的多少。其中,购买量为实心填色的正方形,收藏量为空心虚线的正方形。如果虚线正方形面积大于填色正方形,说明该组人收藏的商品比购买的要多;如果填色正方形面积大于虚线正方形,则说明购买比收藏的商品要多。


可以看到:

  • 女性的收藏商品数和购买商品数都始终高于男性。男性的商品购买量始终高于收藏量,女性的商品收藏量始终高于购买量。

  • 商品收藏量与购买量的关系随着年龄变化。青年群体收藏了远多于他们实际购买的商品,中年群体购买了多于收藏量的商品,老年群体(尤其是老年女性)的收藏与购买数量则趋于平衡。


从青年到中年到老年,是一次从囊中羞涩到有钱任性,再到精打细算的历程。

对于囊中羞涩或者精打细算的用户来说,最关注的事情莫过于打折。而在各种打折促销活动中,“双11”无疑是最为浓墨重彩的一笔。


我们统计了这半年中每个月卖出的商品数量,用方块代表商品。哪个月卖出的商品多,它对应的方块就多:



可以看到,11月卖出的商品数量,几乎等于前5个月的总和!而双11当天的销量,是平日销量的100倍还要多!


有没有觉得很震撼?


震撼到你的,是双11,还是我们的图表呢?


要如何做出这样的图表呢?欢迎长按二维码,加入数据达人培养计划课程,和我们一起玩数据~也可以点击“阅读原文”,查看更多可视化作品。