本活动来自和鲸社区与 GISphere 联合举办的 Python x GIS Workshop 第四期。
探究城市二氧化碳不确定性的影响因素:以福建省晋江市为例
本次 Workshop 将带你探索基于梯度提升的地理加权集成学习方法,通过模拟实验,揭秘这一方法如何突破传统 GWR 的局限,既提升性能,又保留空间变化的可解释性。
· 学习背景 ·
地理加权回归(Geographically weighted regresion, GWR)是估计依赖变量和独立变量之间的关系在地理背景下的空间变化的重要工具,在诸多科学领域都有着广泛的应用。然而,GWR 存在一个问题,即构成 GWR 模型的经典线性回归更容易出现拟合不足的情况,特别是对于大规模和复杂的非线性数据,导致性能较差。一些先进的模型,如决策树和支持向量机,可以更有效地学习复杂数据的特征,但它们无法提供对局部关系的空间变化的可解释性量化。
在本课程中,我们将实现一种基于梯度提升的地理加权集成学习方法。并在空间网格上根据人为设定的变量依赖关系生成模拟数据集,以进行算法实现的应用与性能测试。同时和 GWR 基准模型进行对比。该方法应用了局部加法模型和梯度提升优化方法来减轻拟合不足问题,并保留了地理位置变量之间空间变化的可解释性量化能力。
· 学习目标 ·
·
了解线性回归和地理加权回归的原理并实现,识别其不足之处
·
了解 GWRBoost 的原理并实现
· 主办方 ·
GISphere
致力于实现全球地理信息科学 (GIS) 教育的民主化。由一群富有远见的中国学生和学者于 2019 年创立,其使命是促进 GIS 教育的
信息自由
,加强学术交流与合作,并为学术界和工业界做出重大贡献。
· 特邀导师 ·
王晗
香港大学博士生。个人主页:
https://hanwgeek.githu
b.io/
· 学习大纲 ·
1.
背景介绍
-
-
-
-
-
2. 数据集概述
-
多元线性回归实现
-
地理加权回归实现
4. 基于梯度提升的地理加权集成学习方法
-
GWR 的问题
-
梯度下降提升方法
5. 结论
6. 作业
基础:
理解线性回归,GWR 和 GWRBoost 的流程。将模型包装为函数后在所有的 100 个模拟数据集上完成性能验证并对比结果
进阶:
尝试进行多重实验,实现检查和控制过拟合的方法
·
12 月 5 日开始:
查看教案,在线运行调试
·
2025 年 1 月 16 日 12:00 前:完成作业,提交
·
2025 年 1 月中旬(具体日期待定):参加讲解交流会(会议具体信息,请关注活动页面上的通知)
https://www.heywhale.com/u/086c60