专栏名称: GISer last
GISer last 公众号 主要以分享互联网数据资源为主。也分享过GIS、FME等技术教程方法。我个人对于大数据资源、可视化制作、地图制图等方面有很大兴趣,也会分享个人的一些应用和教程。
目录
相关文章推荐
Foodaily每日食品  ·  费列罗收购Power ... ·  3 天前  
每天学点做饭技巧  ·  拯救你的睡眠!睡前喷一喷。 ·  2 天前  
日食记  ·  节后刮油菜谱,少油少盐还很鲜。 ·  3 天前  
每天学点做饭技巧  ·  林志颖现在为什么不让Kimi露脸了?看到他1 ... ·  3 天前  
无锡博报生活  ·  地铁直达!无锡这里太好吃了! ·  3 天前  
无锡博报生活  ·  地铁直达!无锡这里太好吃了! ·  3 天前  
51好读  ›  专栏  ›  GISer last

BSTVC|时空异质视角下影响因素分析、关键驱动因素识别与动态预测的新工具

GISer last  · 公众号  ·  · 2025-01-25 21:36

正文


2025年新春之际, HEOA-华西健康医学地理课题组 为您献上一份科技厚礼!随着蛇年钟声的渐渐敲响,我们隆重推出全球首创的 BSTVC(贝叶斯时空变系数建模)R包 ,免费供您使用。这不仅是一个开源工具,更是开启时空异质性视角下地理数据分析与挖掘新世界的大门,助力您的基础与应用科学研究,让复杂的数据分析变得轻松而精准,为您的科研之路添砖加瓦!

BSTVC包提供了一个完整统一的“全地图”地理建模框架来精准捕捉具有时空差异的变量关系,旨在揭示多源解释变量对目标变量的时空异质影响机制,即时空非平稳效应,进而大幅提升时空预测精度 包简洁易用,既能满足专业人士的深度需求,又降低了贝叶斯复杂建模的门槛,使更广泛的用户群体能够轻松应用先进的贝叶斯局域时空回归分析方法,解析和解释复杂的时空面板数据。适用于涉及地理时空数据分析的各类自然与人文科学领域,包括但不限于公共卫生、医学地理、环境健康、卫生经济和社会医学等学科(Song and Tang, 2025)。


1

BSTVC R 包:

解锁时空异质性奥秘的地理建模利器

1.1 R包功能特色

•  面向多种目标变量 支持三种主流目标变量类型:连续型(log-Gaussian似然先验)、二分类(logistic似然先验)和计数型(Poisson似然先验),满足不同分析场景的需求。

•  探测时空异质影响机制 通过拟合时空回归系数,揭示解释变量(X)与目标变量(Y)之间的局域时空差异,深入分析“因地制宜、因时制宜”的规律,探索时空异质性带来的影响机制。

•  明确时空驱动因素 在识别时空异质影响机制的基础上,通过计算时空可解释百分比,明确关键时空驱动因素,为地理时空归因提供有力证据。

提升时空预测精度 考虑局域变量关系的时空异质性能够显著提高模型拟合度和预测精度,旨在服务时空缺失值填补、时空平滑和未来预测等任务。

提供多维 模型评价 提供贝叶斯模型的全面评估,包括模型拟合度、复杂度与预测精度等指标,帮助用户全面了解模型性能。

丰富的可视化输出 :同步提供多种时空可视化工具和代码,帮助用户直观理解模型结果,增强数据分析的可解释性,推动您的应用研究创新。

1.2 R包统计机理

时空异质耦合分析 同时考虑了基于两个地理学定律的时空异质性和时空自相关,并在同一框架内结合时间和空间维度进行耦合分析。这种方法是当前地理数据分析中最全面、精准且具有最强证据力的分析理念,远超传统的非空间分析、单一空间或时间分析,以及时空分离分析方法。

BSTVCR 包作为时空异质耦合分析的前沿最新工具,其统计机理如下。

贝叶斯时空变系数(Bayesian Spatiotemporally Varying Coefficients,BSTVC) 模型 是一类基于贝叶斯统计内核的局域时空回归分析方法(Song et al., 2019; 2020; 2022),其显著优势在于,利用“全地图”单独建模框架对所有局部回归系数的时空变化进行统一拟合,从而能够精准捕捉解释变量对目标变量的时空异质性影响,即揭示时空非平稳性。BSTVC系列模型(目前包括STVI、STIVI、STVC、STIVC 四类子模型)为揭示目标变量的复杂时空动态变化和时空影响机制提供了强有力的工具(Song et al., 2022)

贝叶斯空间变系数(Bayesian Spatially Varying Coefficients,BSVC) 模型 是BSTVC模型的空间维度精简版,仅用于识别具有空间异质性的变量关系,即空间非平稳效应。其优势在于集成了BSTVC的 “全地图” 单独建模框架,保证了拟合的局域空间回归系数具有直接可比性。空间非平稳和时空非平稳是地理学第二定律的重要内涵。此外,无论是BSTVC还是BSVC,在拟合非平稳性的时候,均考虑了基于地理学第一定律的时空自相关和空间自相关特征。

时空方差分割指标(Spatiotemporal Variance Partitioning Index,STVPI) 基于 BSTVC/BSVC建模结果,通过量化并比较不同时空异质影响因素的可解释百分比(时空贡献度/时空相对重要性)来明确关键时空驱动因素(Song et al., 2022; Wan et al., 2022)。与当前主流的依赖 绝对评价指标 进行因子重要性排序的方法不同,STVPI是一种 相对评价指标 ,因此能够为地理时空归因提供重要的先验依据(Wan et al., 2022)。

1.3 BSTVC建模优势

“全地图” 单独建模框架 该框架通过完整统一的贝叶斯层次建模机制,确保了局部时空回归系数的直接可比性,同时具备极强的拓展性,能够应对更复杂的实际应用挑战。正是由于该框架的设计,才使得计算相对时空贡献度(STVPI)成为可能。相比之下,在频率统计体系下,类似的分析通常采用“局部分开建模” 的方式,即针对每个地图单元单独建模后再进行组合,可能引发一系列问题,例如不同小模型之间的可比性不足。

直接评估 不确定性 无论是目标变量的局域预测,还是时空回归系数的局域拟合,BSTVC都能直接输出参数的不确定性评估结果,包括两种贝叶斯可信区间(50%和95%),以宽窄区间形式呈现。而在频率统计方法中,受限于统计机理,类似的分析无法评估不确定性。

缺失值友好 :即使目标变量Y存在较多时空缺失值,或解释变量X存在少量缺失值,也不影响时空非平稳效应的识别。而在频率统计方法中,类似的分析通常不支持缺失值。

更多空间权重矩阵的支持 不仅支持基于距离的和k临近的空间权重矩阵,还支持10邻接矩阵来刻画数据中的空间自相关效应。而在频率统计方法中,类似的分析通常不支持10邻接矩阵(小样本问题)。


2

R包安装

2.1 从 GitHub 上安装包

目前此包仅支持从GitHub 上进行本地安装。

# 使用 devtools 包安装install.packages("devtools")  # 首先安装 devtools 包devtools::install_github("songbi123/BSTVC") # 安装 BSTVC 包# 使用 remotes 包安装install.packages("remotes") # 首先安装 remotes 包remotes::install_github("songbi123/BSTVC") # 安装 BSTVC 包

2.2 安装主要依赖包

如果上一步安装`BSTVC`包失败,请在`INLA`包安装成功之后再进行`BSTVC`包的安装。

## 安装 INLA 包,更多信息访问 https://www.r-inla.org/download-install##  或使用旧版本的 INLA,您可以下载 INLA R 包的压缩包到本地再进行安装  options(timeout = 300) # 将超时时间延长到 5 分钟 install.packages("INLA",repos=c(getOption("repos"),INLA="https://inla.r-inla-download.org/R/stable"), dep=TRUE) load.org/R/stable"), dep=TRUE)

2.3 加载BSTVC包

library(BSTVC)


3

案例展示:

利用BSTVC函数构建局域时空回归模型

3.1 数据准备及处理

第一步:导入时空面板数据与检查。 加载R包的示例数据文件(表格及地图数据两类),需要注意的是用于建模的表格数据应调整为 时空面板格式 (即长数据格式),以支持时空面板数据分析。此外,还需要检查数据表格中关键字段(即表示每个空间单元的唯一值字段)的排序是否 与地图数据中关键字段的排序完全一致 ,不一致会造成最终结果不正确。针对此情况,可以调用包中的data.check()函数检查排序。

第二步:解释变量预处理。 在进行回归建模之前,处理解释变量(X变量)是一个至关重要的步骤。建议对X变量进行 标准化处理 ,有助于衡量各个变量对模型的贡献大小,并能有效提升计算效率。

3.2 BSTVC建模

BSTVC 包中提供的主要建模函数为BSTVC()函数,即贝叶斯时空变系数(Bayesian STVC)建模。该函数的参数主要有8个,具体参数描述如下:



formula: 模型公式 ,基本格式为 Y ~ ST(X1 + X2 + X3) 。在BSTVC 函数中,所有解释变量X必须放在ST()符号内,表示这些解释变量同时具有 空间和时间的非平稳性

data: 一个数据框,时空面板数据格式包含模型中所用的所有变量。若数据涉及多个时间截面,必须采用 时空面板数据格式

study_map: sf 格式数据,是 shapefile(shp)格式的 地图数据

Time: 字符串,用于指定数据框data中的 时间字段

Space: 字符串,用于指定数据框data 中代表 空间单元的唯一值字段

response_type: 字符串,指定 建模数据的类型 ,目前可同时支持三种应用场景:“continuous” 代表Y变量为连续型数据;“binary”代表Y变量为二分类型数据,即0表示不发生,1表示 发生;“count” 代表 Y 变量为计数型变量。

threads: 线程数 ,默认为 6,可自行设置。

•   spatial_matrix: 空间权重矩阵 ,默认为 10 邻接矩阵,同时支持用户自行构建部分空间权重矩阵。



基于连续型Y变量构建BSTVC模型,示例如下:

##BSTVC 函数建模 ——连续型# 连续型时空数据建模,Y 变量为连续型数据,示例数据中使用 HR(每个区县的谋杀率)字段进行建模# 指定时间字段为"Year",空间字段为"FIPS",设置 response_type 参数为"continuous"# 默认 spatial_matrix 参数为空,即 10 邻接矩阵model_1 <- BSTVC(formula = HR~ST(DNL+UE+FP+BLK+GI), data = Florida_NAT, study_map = Florida_Map, Time = "Year", Space = "FIPS", response_type = "continuous", threads = 6, spatial_matrix = NULL

3.3 BSTVC输出结果及可视化

BSTVC函数输出的结果共包括6个部分,具体输出部分描述如下:


3.3.1  模型的贝叶斯评价

图1 所示,模型的贝叶斯评价包括模型名称(包含建模起始时间用于区分不同模型)、DIC、LS、WAIC、运算时间等指标。其中,DIC、WAIC 表示模型拟合度,eff(DIC评价的模型复杂度) 和pd2(WAIC评价的模型复杂度)表示模型复杂度,LS表示预测精度。具体而言,DIC和WAIC值越小表示模型拟合度越好,eff和pd2值越小表示模型复杂度越低,LS值越接近0表示预测精度越高。


图1 贝叶斯模型评价结果:模型拟合度、复杂度、计算时间和预测精度



3.3.2  目标变量的时空预测

对于数据中目标变量Y的所有缺失值或非缺失值,局部预测结果中都会输出预测值,以及预测值的贝叶斯宽窄可信区间,用于直接评价不确定性。

图2 通过散点图的形式,直观地对比目标变量Y的原始值与模型预测值之间的关系。此外,基于这些局部预测结果,可以进一步计算和分析其他常用的预测精度指标,如R2(决定系数)、RMSE(均方根误差)等,以全面评估模型的性能。代码详见帮助文档。

图2  目标变量Y 的原始值与预测值的散点图:可进一步计算R2、RMSE等预测评价指标。



3.3.3  时空贡献度评价

时空方差分割指标(Spatiotemporal Variance Partitioning Index,STVPI) 旨在量化并比较不同时空异质影响因素的可解释百分比(Wan, et al., 2022)。STVPI的显著优点是能够 识别相对贡献 ,与绝对贡献排序的主流方法(如随机森林、SHAP等)形成对比。此外,STVPI还能 直接评价其不确定性 ,通过计算贝叶斯宽窄可信区间来提供更准确的结果。

时空贡献度结果共包括5个部分,即: 模型可解释度与残差、空间总贡献百分比与时间总贡献百分比、每个解释变量的空间贡献百分比、每个解释变量的时间贡献百分比和每个解释变量的时空贡献百分比

时空贡献百分比是时空贡献度结果的重要部分。在帮助文档的犯罪地理学案例中( 图3 ),DNL在所有变量中时空贡献度最大,位于首位,其次是UE,然后是FP和BLK,这两个变量的时空贡献度相近,最后是GI,其时空贡献度最小。这一排序不仅揭示了各变量在模型中的重要性和解释度,也为后续地理归因研究和预测因子优化提供了关键先验知识。

图3  时空贡献度多维评价的组合图:包括模型与残差、全部时间非平稳与全部空间非平稳、每个解释因子在时间维度、空间维度和时空维度的贡献百分比差异。



3.3.4  时间回归系数(时间非平稳)

BSTVC 模型不仅可以计算时间回归系数来刻画变量关系的时间异质性,还可以估算出每个回归系数值的贝叶斯宽(95%)、窄(50%)可信区间,用于直接评价结果的不确定性。

图4 汇总了五个不同解释变量(DNL、UE、FP、BLK、GI)在四个不同年份(1960、1970、1980、1990)的时间回归系数及其宽窄置信区间。各变量的时间回归系数在不同年份保持一致,可以认为这些解释变量在所考察的时间范围内对目标变量的影响是持续且稳定的。

【备注】在帮助文档中所列举的案例,其涵盖的时间跨度相对较短。若采用更长的时间序列进行研究,能够使时间回归系数的拟合结果更为精准和收敛,但相应的计算复杂度(内存需求)以及所需的运算时间也会显著增加。

图4  时间回归系数(时间非平稳)森林图:每个解释因子在不同时间截面的影响差异。



3.3.5  空间回归系数(空间非平稳)

与时间回归系数类似,BSTVC模型不仅可以计算空间回归系数表示空间异质的变量关系,还可以估算其不确定性,即贝叶斯宽(95%)、窄(50%)可信区间。

01  绘制空间回归系数地图

在R语言中提取出模型输出中的空间回归系数数据框之后,为获得更专业的可视化效果,建议在ArcGIS或ArcGIS Pro等专业地图制图软件中进行进一步绘制。

此处基于R语言,也简单绘制了一个基础的空间回归系数地图( 图5 ),旨在直观展示五种解释因子在各个地理单元对目标变量所产生的影响差异。

图5 空间回归系数(空间非平稳)地图:每个解释因素在所有地理空间单元的影响差异。


02  空间单元的因子影响效应制图

该图仿照SHAP制图范式,结合横向柱形图和线段图展示了单个空间单元内不同解释变量的 空间回归系数 及其 宽窄贝叶斯可信区间 (新增制图特色,用于直接评价不确定性)

图6 展示了单个空间单元中不同解释变量对目标变量影响的空间回归系数及其不确定性。在本案例中,LK作为具有较大正向空间系数的变量,对目标变量的影响在空间上较为显著,而DNL、GI和FP的影响则相对较小,且在空间上更加稳定或确定。值得一提的是,这种制图范式扩展到 多个空间单元进行组合制图,详见帮助文档的R制图代码

图6 面向单个地理空间单元的空间回归系数:不同解释因子在单个局部位置的影响差异。


4

案例展示:

利用BSVC函数构建局域空间回归模型

与贝叶斯时空变系数(BSTVC)模型相比,贝叶斯空间变系数(BSVC)模型的主要区别在于, BSVC 模型不考虑时间维度上的非平稳性 。由于BSTVC模型与BSVC模型在案例展示中的大部分步骤是相同的,因此,这里我们只介绍它们之间不同的步骤和结果, 具体内容参考帮助文档

4.1 BSVC建模

执行BSVC 建模的函数为 BSVC() ,该函数参数的设置与BSTVC() 函数相差无几,不同的地方主要体现在formula、data 参数上,且此函数不需要 Time 参数,具体差异设置如下:



formula: 模型公式 ,基本格式为 Y ~ ST(X1 + X2 + X3) 。BSVC 函数中的解释变量X需全部放于 S()符号中,表示解释变量X存在 空间非平稳性

data: 一个数据框,时空面板数据格式包含模型中所用的所有变量。该数据框应仅包含空间维度上变化的信息,即它应该代表时空面板数据集中的一个 时间切片 ,例如特定年份或特定月份的数据。



4.2 BSVC输出结果

对比BSTVC 函数,BSVC 函数除了 没有time.coefficients 的结果外,其余 5个部分即是该函数的所有结果。

重要提示

亲爱的用户,为了帮助您更好地使用BSTVC工具,我们为您准备了 详细的用户使用手册

中文版手册可通过以下链接下载:

https://github.com/songbi123/BSTVC/raw/songbi123-useguides/GetStart-Chinese.pdf

英文版手册可通过以下链接下载:

https://github.com/songbi123/BSTVC/raw/songbi123-useguides/GetStart.pdf


5

BSTVC的引用文献

[Bayesian STVC series models/贝叶斯时空变系数系列模型] Song, Chao, Yin, Hao, Shi, Xun, Xie, Mingyu, Yang, Shujuan, Zhou, Junmin, Wang, Xiuli, Tang, Zhangying, Yang, Yili, & Pan, Jay. (2022). Spatiotemporal disparities in regional public risk perception of COVID-19 using Bayesian Spatiotemporally Varying Coefficients (STVC) series models across Chinese cities. International Journal of Disaster Risk Reduction, 77, 103078.

[STVPI/时空方差分割指标] Wan, Qin, Tang, Zhangying, Pan, Jay, Xie, Mingyu, Wang, Shaobin, Yin, Hao, Li, Junmin, Liu, Xin, Yang, Yang, & Song, Chao. (2022). Spatiotemporal heterogeneity in associations of national population ageing with socioeconomic and environmental factors at the global scale. Journal of Cleaner Production, 373, 133781.

Song, Chao, Shi, Xun, & Wang, Jinfeng. (2020). Spatiotemporally Varying Coefficients (STVC) model: a Bayesian local regression to detect spatial and temporal nonstationarity in variables relationships. Annals of GIS, 26(3), 277-291.

Song, Chao, Shi, Xun, Bo, Yanchen, Wang, Jinfeng, Wang, Yong, & Huang, Dacang. (2019). Exploring Spatiotemporal Nonstationary Effects of Climate Factors on Hand, Foot, and Mouth Disease Using Bayesian Spatiotemporally Varying Coefficients (STVC) Model in Sichuan, China. Science of The Total Environment, 648, 550-560.


6

应用案例

罗雅玲, 唐欣怡, 解铭宇, 严国强, 唐先腾, 唐章英, 王秀丽, 潘杰, & 宋超. (2025). 医疗资源配置效率的小区域时空评价:基于四川省县域面板数据的实证研究. 中国卫生事业管理.

Song, Chao, Fang, Lina, Xie, Mingyu, Tang, Zhangying, Zhang, Yumeng, Tian, Fan, Wang, Xiuli, Lin, Xiaojun, Liu, Qiaolan, Xu, Shixi, & Pan, Jay. (2024). Revealing spatiotemporal inequalities, hotspots, and determinants in healthcare resource distribution: insights from hospital beds panel data in 2308 Chinese counties. BMC Public Health, 24, 423.

• Song, Chao, Wang, Xiuli, Ge, Erjia, Shi, Xun, & Pan, Jay. (2024). Applications of Geospatial Information Technologies and Spatial Statistics in Health Services Research. Frontiers in Public Health, 11, 1349985.

• Zhang, Xu, Song, Chao, Wang, Chengwu, Yang, Yili, Ren, Zhoupeng, Xie, Mingyu, Tang, Zhangying, & Tang, Honghu. (2021). Socioeconomic and Environmental Impacts on Regional Tourism across Chinese Cities: A Spatiotemporal Heterogeneous Perspective. ISPRS International Journal of Geo-Information, 10(6), 410.

• Song, Chao, Wang, Yaode, Yang, Xiu, Yang, Yili, Tang, Zhangying, Wang, Xiuli, & Pan, Jay. (2020). Spatial and Temporal Impacts of Socioeconomic and Environmental Factors on Healthcare Resources: A County-Level Bayesian Local Spatiotemporal Regression Modeling Study of Hospital Beds in Southwest China. International Journal of Environmental Research and Public Health, 17, 5890.

• Yang, Yang, Yang, Jintao, Xu, Chengdong, Xu, Chong, & Song, Chao. (2019). Local-scale landslide susceptibility mapping using the B-GeoSVC model. Landslides, 16(7), 1301-1312.


7

版本更新与技术支持

BSTVC包将会不定期更新以引入新功能和改进。我们欢迎并鼓励用户贡献,包括报告问题、提出功能请求或提交代码更改。

如果您在使用BSTVC包时遇到任何问题,或需要进一步的帮助,可以通过以下方式获取支持:

用户手册: 提供详细的模型描述、安装指南和示例。

中文请访问 (https://github.com/songbi123/BSTVC/raw/songbi123-useguides/GetStart-Chinese.pdf )进行下载。

英文请访问( https://github.com/songbi123/BSTVC/raw/songbi123-useguides/GetStart.pdf )进行下载。

GitHub issues: 在GitHub仓库中报告问题或请求新功能,请访问( https://github.com/songbi123/BSTVC/issues )。

邮件联系: [email protected] ( 唐先腾 ,R 包使用相关);

[email protected] ( 宋超 ,统计理论相关)

Bayesian STVC model主页: https://chaosong.blog/bayesian-stvc/


版权所有 © HEOA-华西健康医学地理课题组(2025)

本作品由HEOA-华西健康医学地理课题组创作并拥有全部版权。未经授权,任何单位或个人不得转载、摘编、复制或以其他方式使用本作品的任何部分。如有需要,请联系HEOA-华西健康医学地理课题组获取授权。违者将依法追究法律责任。


编者后记

自从Bayesian STVC模型在2018年被首次提出以来,便引起了国内外学者的广泛关注与厚爱。众多邮件发给我和共同作者们,希望这一方法能够在实践中落地应用。为了不辜负这份信任,这几年,我们团队潜心钻研,深耕理论,精进算法,衍生新法,还用诸多现实案例反复验证,证明了它的实用与先进。

如今,在个人本命年这个特殊的节点,承蒙课题组的鼎力相助与携手奋进,我们终于将这份成果呈现给大家。打造这个开源共享的工具,能为大家的研究添砖加瓦,我满心欢喜,也借此重温了自己投身科研的初心。

新岁将启,愿诸位幸福安康,坚守初心,一路繁花相伴。

宋超

2025年1月25日












请到「今天看啥」查看全文