专栏名称: Excel图表之道
畅销书《Excel图表之道》同名公众号。作者@刘万祥ExcelPro,专注于专业有效、简单实用的商务图表沟通之道,帮助您用Excel制作出具有杂志级品质的商业图表。
目录
相关文章推荐
完美Excel  ·  使用deepseek自动合并“复杂的”Exc ... ·  3 天前  
完美Excel  ·  deepseep+Python实现自动合并E ... ·  2 天前  
Excel之家ExcelHome  ·  WPS接入DeepSeek,无需配置,完全免费 ·  2 天前  
Excel之家ExcelHome  ·  筛选状态下算乘积,还不会的打屁屁 ·  2 天前  
Excel之家ExcelHome  ·  WPS表格中的这些特色函数,爱了 ·  3 天前  
51好读  ›  专栏  ›  Excel图表之道

九种地理可视化方法,我们只能帮你到这了|沙龙分享

Excel图表之道  · 公众号  · Excel  · 2017-05-20 19:10

正文

这是极海王帅老师在镝次元数据传媒实验室在线沙龙分享的内容整理,介绍的GIS行业地理信息可视化,对于商业活动中地理数据可视化也有借鉴意义,经获得授权转载。


编者推荐:

地图大数据的可视化受到了越来越多的重视。作为地理大数据应用的最后一步,地理空间的可视化,不仅仅是为了好看,还是为了将空间分布上的规律更加直观的展示出来,同时挖掘更加深层次的信息。

地理大数据的可视化有多少种类型?今天的文章会一一告诉你。



本期嘉宾

GeoHey 极海 高级数据工程师 王帅

地理空间可视化,能量超乎想象

1831年,霍乱第一次传播到英国,出现上万人死亡。当时的医生约翰·斯诺就在地图上用黑杠标注死亡的案例。最终发现,死亡的病例,大多数围绕在这个公共的水井旁,也就是地图中红点的位置。这张地图为当时政府揭示了霍乱的来源。

地理空间的可视化,不仅仅是为了好看,而是为了将一些空间分布上的规律更加直观地展示,挖掘出更深层次的信息。


在线地图的秘密,一片两片三四片


瓦片地图其实就是互联网地图后台的工作原理,将一整张地图切成一块块小的地图,就像屋顶上的瓦片。我们在查看的时候就是一级一级的、像金字塔一样去缩放。

下面这幅图片就是缩放流程,“4”是代表他的级别;“55” 是代表它的行号,然后“23”是代表它的列号。将这样一个一个256×256的小图片存在这样一个位置里面。

这是一张谷歌地图,如果打开浏览器的开发者模式可以看到,谷歌地图具体的渲染方法就是最基本的点线面的渲染。里面的图片都是一张张256x256的图片,然后每张图片会根据不同的地物,渲染不同的颜色或者形状。像“面”可能就渲染成有一种颜色,“线”就渲染成黑色,“点”就由不同的样式去填充信息。


九种地理数据可视化,只能帮你到这了

接下来我们来对每一种可视化的方法一一进行讲解。


单值图


单值图比较简单,就是将一种数据统一渲染成同样颜色、形状或者大小。比如说左面这个是全国肯德基店铺的分布,右面这个是全球机场航线以及机场位置的数据。其中航线是用白色进行渲染,机场的位置是用绿色进行渲染。这种可视化比较简单、直观,能看出一些位置在空间上的分布的信息。

类别图


类别图,顾名思义就是根据不同的类别进行不同颜色的渲染或者一些根据不同的形状、大小的进行的渲染。像下图左上角这个图,Tom、Dick和Harry就是根据不同的属性,渲染成不同的颜色。

我们再来看看左下角这幅纽约的声音地图,其实这幅地图是将不同的街道主要的声音赋给不同的颜色,也就是不同的类别。与上面的可视化方法一样,只不过是对线条进行渲染,其他原理上都是一样的。通过图例可以看到,主要就是交通、自然、人声和音乐几种声音。

中央公园那个区域,明显都是绿色,也就是自然的声音。大桥与陆地的连接处,多数以交通的声音为主。这样一幅可视化的结果非常漂亮,就是用了可视化的方法中的类别图。

然后右面这幅图,是根据不同的村庄的尾字进行渲染的,比如说河西村就是以“村”结尾,南辛庄就是以“庄”结尾。那这个图就是大家可以看出来。每个村庄的名字都会被渲染成不同的颜色。其实,这个就是整个分类图的一个大致的思想。


渐进图

渐进图也可以称作数量图,就是根据一个字段的数字赋予不同的颜色,比如说大于零的赋予一个颜色,大于一百二十八的赋予一个颜色,不同的间隔赋予不同的颜色。

怎么确定间隔?常用的四种方法是:

•   等间隔;

•   等数量;

•   自然分段;

•   标准偏差。

等间隔,根据数据的总体的分布,比如说,你的数据范围是零到一百,那么要分成五段。那么零到二十就是设置成一个颜色,二十到四十设置一个颜色,以此类推。

等数量,如果数据有一百个,那么前二十个设置成一个颜色,后二十个设置成一个颜色,再后这又设置成一个颜色。

自然分段,是保证各个类别内部的方差最小,类别与类别之间的方差越大越好。

标准偏差,指偏离数据的标准差多少个,比如说偏离一个、两个、三个,一段一段地赋予不同的颜色。

类别图和渐进图,有类似的地方。如果数据是数值型的,且数据跨度非常大,比如从1到10000,而且里面有小数,那么就尽量用渐进图;如果数据量都是一些字符型的分类,那么可以考虑用分类图。


这个图是2010年乡镇级别尺度的全国人口普查密度,用的是自然分段法。可以明显看到北京、珠三角、长三角、四川上盆地以及河南等地方的人口密度非常的大。

右边是“条条大路通罗马”渐进图,右面是我根据左面这个复现了一个“条条大路通北京”。

其实制作方法也比较简单,就是在全陆地上平均地撒上一个点,然后去求你这个撒的点的起点到终点的最短路径。然后经过的路段越多,那么它的数量就越多,这样累计起来你每一段路,经过了多少个起点,有多少个起点经过就会有一个数字。

求出每条道路经过的起点数量之后,我们就可以根据上面讲到的几种分类方法。比如,自然分段还是等间隔、等数量对它渲染不同的粗细。


气泡图


气泡图,根据每一个属性,以及值的大小,数值越大,那么气泡圆圈越大,这幅图是每个省份的GDP的一个气泡图,广州、江苏以及山东的气泡会大一些。


混合图

混合图也叫blending mode,最出名的当属这幅Facebook的地图。这是Facebook在2011年发布的全球用户关系图。

这个与我们前面讲到的单值图(飞机航线)不同在于,虽然渲染的颜色是蓝色的,但是在美国欧洲这些用户非常多的地方,颜色是非常亮的。

怎么做出这种高亮的效果? 其实就是一个叠加的作用,可以看到右面列了几个公式,一个是Normal,就是你输的两条线或者两个点,然后谁在前面,谁在上面就呈现出谁的颜色,就像刚才那个飞机航线图。那么要想做到这种高亮的效果,那就是可以用一个Screen或者Multiply去做一个运算操作。就说比如说这个Multiply,a和b乘起来做一个输出,在对其进行渲染,那么这部分就会高亮很多。

上面这幅图就是村庄尾字图,这个是以村结尾的图也是用了Screen的效果。然后可以看到在东部沿岸会有一些发白的地方,就说明的村庄分布非常的多。


热力图

热力图,左边的这个图是全国肯德基的分布,右面这个是用热力图渲染的效果。其实大家可以明显的看出来越聚集的地方,那么热力图就显得越亮。然后,点越少的或者越稀疏的地方,聚集的程度也就说颜色,可以设成绿色。

热力图最大的一个作用是可以突出一个点聚集的程度,点聚集得越多,那么热力就高。点聚集地越少,那这地方热力就越低。


聚合图

聚合图,左面的其实就是一个点,然后右面聚合之后的结果。聚合的方式有多种多样,可以是像图中所示的正六边形,也可以做正方形的聚合。

在聚合之后,我们就可以对它就里面的数量运用刚才的渐进图对它进行渲染不同的颜色。

例如上面这两幅图,左面是科比的命中率投篮统计,然后右面是库里的投篮统计。六边形的大小代表投篮的次数。颜色越红代表命中率越高,可以看到科比在中距离出手次数要比库里多,然后库里在三分线外出手次数以及命中率都是非常的高的。


时态图

时态图有两种呈现方式,一种是不将前一祯的数据抹掉,然后下一祯数据继续往上放,这个OSM Ten Years这个就是属于这种情况。


零六年到一五年的一个数据的全球分布情况,可以看出从零六年到一五年就是每一年的变更情况数量也越来越多。

这是第二种大数据可视化的方法就是将前一祯的数据慢慢隐藏,然后下一祯数据出现,这样就会出现一个尾巴的效果。比如下面这个上海的出租车轨迹数据。


边捆绑


捆绑图。左面是美国的一个人口迁徙图。然后比如说从一开始洛杉矶到纽约就只有一条直线,这样看起来会错综复杂,那么我们需要加这个线进行捆绑,就会出现右面这六种不同的捆绑效果。







请到「今天看啥」查看全文