专栏名称: 小猿猴GISer
GIS遥感交流学习
目录
相关文章推荐
杭州网  ·  她们,官宣喜讯! ·  14 小时前  
杭州网  ·  她们,官宣喜讯! ·  14 小时前  
丽水在线  ·  丽水16名女青年参加!好样的 ·  2 天前  
丽水在线  ·  丽水16名女青年参加!好样的 ·  2 天前  
女神汇  ·  理想的恋爱模式: ·  4 天前  
女神汇  ·  没见过面的相亲男说我神经病?太下头! ·  4 天前  
彬彬有理  ·  婚后分房睡,坦言已衰老,她还好吗? ·  3 天前  
51好读  ›  专栏  ›  小猿猴GISer

论文推荐|“隐形紧身衣”式的空间扫描窗口

小猿猴GISer  · 公众号  ·  · 2024-11-27 18:40

正文

对于一个空间点数据集,热点是指密度显著高的点聚集区域。热点识别为解决城市问题提供了重要的参考,例如,在频繁发生入室盗窃的地区,识别高风险区域有助于判断是否需要部署更多警力;或者在疾病暴发时,通过定位病例密集区域,可以帮助确定可能的传染源。因此,开发有效的热点识别方法至关重要。在现有的热点识别方法中,空间扫描统计是最为有效和便捷的方法之一,因此被广泛使用。其原理是通过使用不同大小的窗口扫描研究区域,并根据窗口内外点的数量检测异常密集的区域。目前使用的扫描窗口主要分为两类:(1)基于规则形状的窗口,如圆形、椭圆形、矩形和环形等(图a);(2)由不同预划分子区域组合而成的窗口,如行政区划(图b)。然而,这两类窗口都存在一个共同的问题: 窗口形状预先固定, 不可避免地会在窗口内包含一些噪声点 (如图中红色高亮的灰点所示),导致热点识别的精确度下降。 为解决此问题,本研究提出了一种“隐形紧身衣”式扫描窗口。该窗口能够“隐形”地精确贴合热点区域的边界 ,从而提高热点识别的准确性(图c)。

1

研究方法

本节首先阐述了利用空间扫描统计方法识别热点的基本原理,随后详细介绍了“隐形紧身衣”式窗口的构建方法。

空间扫描统计

空间扫描统计方法是一种经典的热点识别方法,其核心思想是通过扫描窗口遍历整个研究区域,比较窗口内外点的分布情况,构建对数似然比统计量(Log-Likelihood Ratio, LLR),以识别具有显著高密度的热点区域。

为扫描窗口 内的点数、 为研究区内的总点数、 为研究区内点的密度、 为窗口的面积,那么,在假设点的分布服从均质泊松过程的情况下,扫描窗口 的对数似然比计算如下:

将所有窗口的 LLR 按降序排列,并根据需求依次选择若干窗口作为热点区域。

“隐形紧身衣”式的扫描窗口

传统扫描方法使用固定几何形状(如圆形、椭圆形或子区域的组合)的窗口,这可能导致窗口形状与实际热点形状不符,进而影响热点的识别精度。为了解决这一问题,“隐形紧身衣”式窗口旨在更紧密贴合热点的实际形状,从而提高热点提取的精度。 在公式(1)中 均为已知变量,因此,唯一需要估算的变量是扫描窗口的面积 。基于此, 本研究的思路是通过估计热点区域的面积,构造出“隐身紧身衣”窗口,并藉此计算得到LLR,最终提取出热点区域

“隐形紧身衣”式窗口的面积估算主要包括以下三个步骤(图1)。

(1)剔除噪声点

如图1a,我们首先使用圆形扫描窗口进行大致定位,随后基于最邻近距离剔除窗口内的噪声点:若某点的一阶邻近距离大于基于泊松分布累积分布函数计算的距离阈值,则判定为噪声点并剔除;否则保留为聚集点。

(2)估计聚集点的密度

如图1b,剔除噪声点后,剩余的聚集点的密度同样可以利用一阶邻近距离对其密度进行估计,公式如下:

其中, 为点 的一阶邻近距离, 为窗口内剩余聚集点的个数。

(3)反推窗口面积

如图1c,我们将圆形窗口内聚集点所占区域近似为“隐形紧身衣”窗口,因此聚集点所占区域的面积即为“隐形紧身衣”窗口的面积。利用聚集点数目 和上一步中估算的密集点密度 反推“隐形紧身衣”窗口的面积:


图1 “紧身衣”式扫描窗口的面积计算过程

3

模拟实验

为验证所提方法的有效性,我们设计了五个包含不同形状热点的模拟数据集,并分别使用我们的方法(TWScan)、传统的基于椭圆窗口的扫描方法(EllipticScan)、基于密度的经典聚类算法(DBSCAN)、基于融合显著性检验的改进后的DBSCAN算法(Sig. DBSCAN)进行热点提取。







请到「今天看啥」查看全文