本研究提出了一种整合多源数据的空心村识别框架。如图1所示,该框架由三个核心模块构成:(1)数据预处理模块,主要完成遥感影像和村景图片的裁剪与几何校正、夜间灯光数据的时序化处理、数据增强操作以及多源数据的空间配准;(2)多源数据融合网络构建模块,通过从Google高分辨率遥感影像中提取村庄的宏观空间特征,从村景图片中获取微观建成环境特征,并结合夜间灯光数据捕捉人类活动强度的时序变化特征,进而实现多源特征的深度融合;(3)模型对比与精度评估模块,通过系统比较单源数据模型、两两组合数据模型以及多源数据融合模型的性能表现,并开展消融实验,全面评估模型的有效性与鲁棒性。这一框架通过多层次特征提取与融合,为空心村的精准识别提供了系统化的解决方案。
数据预处理
本研究以500×500米的网格作为基本分析单元,基于各县行政边界生成规则网格,并通过栅格映射技术将离散的村景图片点数据转换为规则网格,同时过滤缺乏村景图片的网格区域。村景图片数据通过志愿者采集获取,重点关注住房、基础设施等农村核心要素。为确保数据质量,研究团队实施了多阶段质量控制流程,包括自动化筛选、标准化处理(涵盖尺寸调整、色彩校正和裁剪等操作)以及人工审查,从而保证数据的可靠性与一致性。基于生成的网格,对Google高分辨率遥感影像进行裁剪,并排除自然景观占比过高的网格区域。此外,将夜间灯光数据与农房密度数据进行空间叠加分析,仅保留农房密度大
于1的夜间灯光值,并整合2022年1月至2024年1月的月度数据构建时间序列数据集。
在空心村定义方面,本研究将人口流出率超过50%的村庄界定为“空心村”(HV),低于50%的则定义为“非空心村”(None-HV)。同时,将行政村分类标签映射至网格单元,根据网格在各行政村内的面积占比确定其归属关系。考虑到村庄内部的高度异质性和空心化现象的复杂性,研究进一步结合遥感影像(RS)和村景图片(VVI)进行综合判断:RS主要用于反映宏观尺度的土地空心化特征,而VVI则提供微观层面的人类活动痕迹。标注工作由两名地理学专业研究生独立完成,若出现分歧则由第三名标注者进行仲裁。
为提升模型的泛化能力,对RS和VVI数据进行了数据增强处理,包括随机旋转、翻转以及亮度、对比度等参数的调整;对夜间灯光时序数据则采用动态时间规整(DTW)技术进行增强。最终,数据集按7:3的比例划分为训练集和测试集,其中训练集的20%用于验证以优化模型超参数。
多源数据融合网络构建
村景图片从人类视角捕捉建成环境信息,直接反映人类活动模式,为微观尺度的土地和人口空心化提供重要线索。通过分析建筑物破损程度、道路状况和公共设施维护情况,可推断人类活动是否存在。然而,由于村景图片采集方式分散,数据缺乏固定序列和一致性,传统序列依赖模型(如RNN或LSTM)难以适用。为此,本研究引入Set-Transformer模型,通过其自注意力机制全局捕捉图像间的特征关系,从而提取关键语义信息,实现对村庄特征的全面表征。
遥感影像则从高空视角捕捉村庄的物理环境信息,尤其适用于土地空心化分析,能够清晰展示村内旧房的分布格局以及外围新建农房的空间特征。研究将网格内每张遥感影像统一缩放至224×224像素后输入ResNet18模型,并引入卷积块注意力模块(CBAM),通过通道注意力和空间注意力机制突出关键特征,提升模型对土地空心化特征的识别能力。
夜间灯光数据作为村庄电力使用和夜间活动的重要指标,直接与人口密度和人类活动强度相关。空心村的典型特征是在节假日期间夜间灯光无明显变化,而非空心村则通常在
春节等传统节日期间表现出显著的灯光强度增加,这反映了返乡人口的活动特征。为有效捕捉夜间灯光数据的时序特征,本研究采用长短期记忆全卷积网络(LSTM-FCN)模型,结合LSTM的时间建模能力和FCN的局部特征提取能力,识别季节性变化和周期性模式,并检测局部突变或异常,从而全面反映村庄人类活动的动态变化。
模型对比与精度评估
为验证多源数据融合在空心村识别中的有效性,对比了单源数据、两两组合数据以及多源数据融合模型的预测结果差异,并评估了不同村景图片特征融合方法(均值池化、Vision-LSTM和Set-Transformer)以及多源数据融合策略(直接拼接和基于Mixer的注意力融合)对模型性能的影响。模型性能通过总体准确率(OA)、F1分数、Kappa指数、精确率和召回率等指标进行评估,确保模型的有效性和鲁棒性。
图
1
空心村识别框架
图
2
展示了四个样本县中空心村与非空心村在建成环境上的差异。
左侧图像展示了空心村和非空心村的典型遥感影像,其中空心村的旧房数量较多。中间图像为
村
景图片
,空
心村的公共空间维护较差,房屋破旧。右侧图像为夜间灯光时序数据,表明空心村的
灯光值在全年几乎保持不变,而非空心村则
表现出季节性变化