专栏名称: Excel图表之道
畅销书《Excel图表之道》同名公众号。作者@刘万祥ExcelPro,专注于专业有效、简单实用的商务图表沟通之道,帮助您用Excel制作出具有杂志级品质的商业图表。
目录
相关文章推荐
完美Excel  ·  使用VBA添加图表 ·  3 天前  
Excel之家ExcelHome  ·  一分钟搞定:最高、最低和平均值 ·  4 天前  
Excel之家ExcelHome  ·  快速分析用得好,年薪三万还嫌少 ·  3 天前  
完美Excel  ·  解决因时间引起的求和问题 ·  6 天前  
Excel之家ExcelHome  ·  CSV格式文件的正确打开方式 ·  1 周前  
51好读  ›  专栏  ›  Excel图表之道

九种地理可视化方法,我们只能帮你到这了|沙龙分享

Excel图表之道  · 公众号  · Excel  · 2017-05-20 19:10

正文

这是极海王帅老师在镝次元数据传媒实验室在线沙龙分享的内容整理,介绍的GIS行业地理信息可视化,对于商业活动中地理数据可视化也有借鉴意义,经获得授权转载。


编者推荐:

地图大数据的可视化受到了越来越多的重视。作为地理大数据应用的最后一步,地理空间的可视化,不仅仅是为了好看,还是为了将空间分布上的规律更加直观的展示出来,同时挖掘更加深层次的信息。

地理大数据的可视化有多少种类型?今天的文章会一一告诉你。



本期嘉宾

GeoHey 极海 高级数据工程师 王帅

地理空间可视化,能量超乎想象

1831年,霍乱第一次传播到英国,出现上万人死亡。当时的医生约翰·斯诺就在地图上用黑杠标注死亡的案例。最终发现,死亡的病例,大多数围绕在这个公共的水井旁,也就是地图中红点的位置。这张地图为当时政府揭示了霍乱的来源。

 

地理空间的可视化,不仅仅是为了好看,而是为了将一些空间分布上的规律更加直观地展示,挖掘出更深层次的信息。


在线地图的秘密,一片两片三四片


瓦片地图其实就是互联网地图后台的工作原理,将一整张地图切成一块块小的地图,就像屋顶上的瓦片。我们在查看的时候就是一级一级的、像金字塔一样去缩放。

 

下面这幅图片就是缩放流程,“4”是代表他的级别;“55” 是代表它的行号,然后“23”是代表它的列号。将这样一个一个256×256的小图片存在这样一个位置里面。

 

这是一张谷歌地图,如果打开浏览器的开发者模式可以看到,谷歌地图具体的渲染方法就是最基本的点线面的渲染。里面的图片都是一张张256x256的图片,然后每张图片会根据不同的地物,渲染不同的颜色或者形状。像“面”可能就渲染成有一种颜色,“线”就渲染成黑色,“点”就由不同的样式去填充信息。


九种地理数据可视化,只能帮你到这了

接下来我们来对每一种可视化的方法一一进行讲解。


单值图


单值图比较简单,就是将一种数据统一渲染成同样颜色、形状或者大小。比如说左面这个是全国肯德基店铺的分布,右面这个是全球机场航线以及机场位置的数据。其中航线是用白色进行渲染,机场的位置是用绿色进行渲染。这种可视化比较简单、直观,能看出一些位置在空间上的分布的信息。

 

类别图


类别图,顾名思义就是根据不同的类别进行不同颜色的渲染或者一些根据不同的形状、大小的进行的渲染。像下图左上角这个图,Tom、Dick和Harry就是根据不同的属性,渲染成不同的颜色。

 

我们再来看看左下角这幅纽约的声音地图,其实这幅地图是将不同的街道主要的声音赋给不同的颜色,也就是不同的类别。与上面的可视化方法一样,只不过是对线条进行渲染,其他原理上都是一样的。通过图例可以看到,主要就是交通、自然、人声和音乐几种声音。

 

中央公园那个区域,明显都是绿色,也就是自然的声音。大桥与陆地的连接处,多数以交通的声音为主。这样一幅可视化的结果非常漂亮,就是用了可视化的方法中的类别图。

 

然后右面这幅图,是根据不同的村庄的尾字进行渲染的,比如说河西村就是以“村”结尾,南辛庄就是以“庄”结尾。那这个图就是大家可以看出来。每个村庄的名字都会被渲染成不同的颜色。其实,这个就是整个分类图的一个大致的思想。


渐进图

渐进图也可以称作数量图,就是根据一个字段的数字赋予不同的颜色,比如说大于零的赋予一个颜色,大于一百二十八的赋予一个颜色,不同的间隔赋予不同的颜色。

 

怎么确定间隔?常用的四种方法是:

•   等间隔;

•   等数量;

•   自然分段;

•   标准偏差。

 

等间隔,根据数据的总体的分布,比如说,你的数据范围是零到一百,那么要分成五段。那么零到二十就是设置成一个颜色,二十到四十设置一个颜色,以此类推。

 

等数量,如果数据有一百个,那么前二十个设置成一个颜色,后二十个设置成一个颜色,再后这又设置成一个颜色。

 

自然分段,是保证各个类别内部的方差最小,类别与类别之间的方差越大越好。

 

标准偏差,指偏离数据的标准差多少个,比如说偏离一个、两个、三个,一段一段地赋予不同的颜色。

 

类别图和渐进图,有类似的地方。如果数据是数值型的,且数据跨度非常大,比如从1到10000,而且里面有小数,那么就尽量用渐进图;如果数据量都是一些字符型的分类,那么可以考虑用分类图。


这个图是2010年乡镇级别尺度的全国人口普查密度,用的是自然分段法。可以明显看到北京、珠三角、长三角、四川上盆地以及河南等地方的人口密度非常的大。

右边是“条条大路通罗马”渐进图,右面是我根据左面这个复现了一个“条条大路通北京”。

 

其实制作方法也比较简单,就是在全陆地上平均地撒上一个点,然后去求你这个撒的点的起点到终点的最短路径。然后经过的路段越多,那么它的数量就越多,这样累计起来你每一段路,经过了多少个起点,有多少个起点经过就会有一个数字。

 

求出每条道路经过的起点数量之后,我们就可以根据上面讲到的几种分类方法。比如,自然分段还是等间隔、等数量对它渲染不同的粗细。


气泡图


气泡图,根据每一个属性,以及值的大小,数值越大,那么气泡圆圈越大,这幅图是每个省份的GDP的一个气泡图,广州、江苏以及山东的气泡会大一些。


混合图

混合图也叫blending mode,最出名的当属这幅Facebook的地图。这是Facebook在2011年发布的全球用户关系图。

 

这个与我们前面讲到的单值图(飞机航线)不同在于,虽然渲染的颜色是蓝色的,但是在美国欧洲这些用户非常多的地方,颜色是非常亮的。

 

怎么做出这种高亮的效果? 其实就是一个叠加的作用,可以看到右面列了几个公式,一个是Normal,就是你输的两条线或者两个点,然后谁在前面,谁在上面就呈现出谁的颜色,就像刚才那个飞机航线图。那么要想做到这种高亮的效果,那就是可以用一个Screen或者Multiply去做一个运算操作。就说比如说这个Multiply,a和b乘起来做一个输出,在对其进行渲染,那么这部分就会高亮很多。

上面这幅图就是村庄尾字图,这个是以村结尾的图也是用了Screen的效果。然后可以看到在东部沿岸会有一些发白的地方,就说明的村庄分布非常的多。


热力图

热力图,左边的这个图是全国肯德基的分布,右面这个是用热力图渲染的效果。其实大家可以明显的看出来越聚集的地方,那么热力图就显得越亮。然后,点越少的或者越稀疏的地方,聚集的程度也就说颜色,可以设成绿色。

 

热力图最大的一个作用是可以突出一个点聚集的程度,点聚集得越多,那么热力就高。点聚集地越少,那这地方热力就越低。


聚合图

聚合图,左面的其实就是一个点,然后右面聚合之后的结果。聚合的方式有多种多样,可以是像图中所示的正六边形,也可以做正方形的聚合。

 

在聚合之后,我们就可以对它就里面的数量运用刚才的渐进图对它进行渲染不同的颜色。

 

例如上面这两幅图,左面是科比的命中率投篮统计,然后右面是库里的投篮统计。六边形的大小代表投篮的次数。颜色越红代表命中率越高,可以看到科比在中距离出手次数要比库里多,然后库里在三分线外出手次数以及命中率都是非常的高的。


时态图

时态图有两种呈现方式,一种是不将前一祯的数据抹掉,然后下一祯数据继续往上放,这个OSM Ten Years这个就是属于这种情况。


零六年到一五年的一个数据的全球分布情况,可以看出从零六年到一五年就是每一年的变更情况数量也越来越多。

 

这是第二种大数据可视化的方法就是将前一祯的数据慢慢隐藏,然后下一祯数据出现,这样就会出现一个尾巴的效果。比如下面这个上海的出租车轨迹数据。


边捆绑


捆绑图。左面是美国的一个人口迁徙图。然后比如说从一开始洛杉矶到纽约就只有一条直线,这样看起来会错综复杂,那么我们需要加这个线进行捆绑,就会出现右面这六种不同的捆绑效果。

 

那具体的捆绑方法可以把两条线想象成两个星球。星球与星球之具有引力,离得越近的两条线,它们的引力越大,那么就会慢慢的将所有的线聚集在一起,就会形成像右面这种各式各样的效果。


常用的可视化工具有哪些?

可视化工具主要分成三种:一种是桌面工具,比如QGIS,第二种是在线的线上工具,可以在浏览器里直接操作,比如极海的GeoHey平台,再有就是前端工具,需要写代码,比如 D3、Echarts。

 

右面这个Awesome GS的列表,是我在Github上建的一个仓库,涉及的很多常用的技术软件以及工具,包括一些新闻以及优秀的可视化站点。

地球投影简介

地球是个球形,但平时看到的地图都是二维平面,那么这个怎么来的呢?从视频中直观的看,就是把地球抛开,然后抛成一瓣一瓣的,再将两端拉升,最后缝合起来,就成为我们平时看到这种地图。这种投影方式叫做墨卡托投影。大家平时用的百度、google以及高德都是采用这种方式。

 

越往北的地方,越往两极的地方,圆圈越大代表他的形变越大,可以看到这个人的头像也会出现很大的形变。然后在赤道上面他的圆圈就是小,说明形变最小。

左面这张图片是中国大陆拖到俄罗斯的位置上,可以看到我国的边界发生了一个比较大的形变,然后板块面积也变得非常的大。就是投影变形。右面这个图就是将美国、印度以及我国放到非洲这个尺度下的一个效果,可以看到这三个国家大概就相当于非洲的一个面积。


问答环节

Q:地理数据的输入一般是哪种格式的文件?

A:地理数据输入的文件格式最常用的是shpfile、geojson、kml等。这些格式的文件都会保存地理信息以及它们的投影相关的信息,像QGIS、ArcGIS在这些软件里面都可以很方便的读取这些数据。

 

Q:请问您平时做数据化都用哪些工具?

A: QGIS和极海的可视化平台,QGIS是属于功能更加丰富。但是需要更多的专业知识水平。上手起来,也可能会比较难。极海的平台是网页版,只要一个账号就可以使用,也不需要你安装,使用起来比较简洁方便。

 

Q:时态轨迹数据一次性获取后展示?还是动态获取?

A:时态数据。我刚才发的例子是一个先获取之后再进行展示的,当然你也可以实时的接入这个数据流,比如说阿里在双十一做的全球交易的一个动态效果就是实时获取和实时接入。

 

Q:在合理的范围内,请比较一下QGIS、ARCGIS。

A: QGIS是因为它是开源的,目前我用它主要是做数据处理和可视化。相对于ArcGIS来说,QGIS他的分析功能比较弱。ArcGIS有一堆的工具包可以用,它的分析功能空间分析功能要比QGIS要好很多。如果你是一般使用的话,那推荐你是用QGIS,毕竟是开源免费的。

 

Q:D3在做可视化视频的时候有什么优缺点?

A:D3做可视化,因为它是一个覆盖很全很广的工具,然后在地图这方面,可画的内容会偏少一些。然后在数据量升到一定级别的时候,可能会出现卡顿现象。