平时见得最多的也许是柱形图了,但我个人最喜欢的却是散点图。在讲散点图之前,我先阐述一个不太严谨的个人观点。我认为,所有的数据图表都可以分为两类,
一类是偏重于展示,一类是偏重于研究
。如何理解?偏重于展示的图表,往往是将某个指标所蕴含的信息更为直观地表达,即该类图表中获取得的信息,是可以直接应用于业务决策的。比如某公司全国各省的销售员人均销售业绩的柱形图,孰高孰低被展现得很明显,那么哪些地区需要努力,或者哪些地区需要裁员,就可以进行决策了。
偏重于研究的图表,往往是显现出指标间的某些隐藏的关系,从图中得到的信息往往需要进一步的研究,才能落地为具体的业务判断或执行策略。比如某公司人均销售业绩与员工离职率的散点图,你或许能看到两者存在某种数学关系,但你并不能获得显性的结论,而是需要通过进一步的研究,比如回归建模,才能提取出这种关系。
研究型的图表就像一扇门,经常能帮助我们打开另一番天地,获得的信息价值也更高;但相对的,也有更高的风险,许多时候你投入很多时间,获得的结论却没有价值。
散点图最核心的价值在于发现变量之间的关系,千万不要狭隘地将这个关系理解为线性回归关系。指标间的关系有很多,如线性关系、多项式关系、指数关系、对数关系等等,当然,没有关系也是一种重要的关系。最基本的散点图我们来看一个典型的散点图,下图展示了一家外卖配送公司配送员人均负荷(一天需送掉的订单量)与订单的准时送达率。
散点图的
基本元素就是点
,即通过两个变量(纵坐标轴和横坐标轴)的数值,将点打在图表对应的位置上,通过散点的分布,来观察两个变量之间的相互关系。通过上图我们就能直观地看到,人均配送负载和订单的准时送达率是负相关的关系,即人均配送负载越高,准时送达率越低,而人均配送负载越低,则准时送达率越高。我们通过添加一条趋势线,来使得这个关系更为明显。
对于一家外卖配送公司,这个结论似乎是一个常识,当一个人一天要配送的订单越多,则他就越难准时将所有订单送到。其实,这个逻辑未必是成立的,真正的解读是:如果订单是循序渐进,在时间分布上平缓地递交给配送员,那么单再多,配送员能一单单送完,则超时率是依旧平稳地;但实际情况并非如此,外卖配送需求都是在高峰时间段脉冲式增长,这就导致配送压力大时,配送员同时承接了多个订单,这就导致了手头总有一部分订单会因为绕路配送而超时,这才导致了如下散点图上的反映。
其实散点图的制作只需要三部操作:1.点出散点图制作控件;2.选择数据;3.调整图表参数首先点击“插入”选项卡下的“图表”模块,在左边的图表选择项中,选择“XY(散点图)”,暂时先选择第一种类型,后面的几种类型会慢慢介绍。如图2-2,点击“确定”按钮后,就会生成一个空的散点图。如图2-3,右键点击图形,选择“选择数据”,就会出现如图2-4的数据源选择框,在这里点击“编辑”按钮,进入如图2-5显示的“编辑数据序列”界面。在“编辑数据序列”这个界面当中,我们需要设置三个数据,第一个是图标标题,你可以选择某个单元格,会出现对你选中单元格的绝对引用参数;第二个是X轴上要显示的指标,你可以操作鼠标在Excel表中圈选,也可以自己输入绝对引用语句;第三个是Y轴上要显示的指标,方式与第二个相同。