本篇分享 AAAI 2025 论文
GTG: Generalizable Trajectory Generation Model for Urban Mobility
。本文提出了一种
具备跨城市迁移性的人类移动轨迹生成方法
。
GTG: Generalizable Trajectory Generation Model for Urban Mobility.
论文作者:
作者单位:
课题组:
北航智慧城市课题组 BIGSCity(https://www.bigscity.com/)
研究方向:
论文链接:
https://arxiv.org/abs/2502.01107
代码仓库链接:
https://github.com/lyd1881310/GTG
背景介绍
轨迹数据在城市规划和交通管理等领域具有重要的作用,但是由于数据收集成本和隐私保护条款等因素的限制,大规模轨迹数据集的采集非常困难。轨迹生成技术成为解决轨迹数据不足的关键。
现有的轨迹生成方法大致可以分成知识驱动的方法和数据驱动的方法。知识驱动的方法通常基于经验规则和统计规律来模拟人类的移动并生成轨迹,数据驱动的方法则基于大规模数据训练的神经网络模型来生成轨迹。
知识驱动的方法不依赖大量数据,但是效果往往难以满足需求;数据驱动的方法表现较好,但是过于依赖特定城市的路网结构,难以迁移到其他城市。
本论文作者发现,人类的移动行为具有一定的跨城市不变性,主要体现在两个方面:1)人类总是倾向于选择出行代价最小的路径;2)道路的出行代价可以由路网的拓扑特征做出预测,这种拓扑特征与出行代价之间的映射关系在不同的城市中具有一定的不变性。
对此,本文提出了一种结合跨城市道路出行代价预测和最短路径搜索的轨迹生成方法。
问题定义
路网:城市的路网是一个有向图
,包括路段集合
和边的集合
,若两个路段直接相邻,则它们之间存在一条有向边。
轨迹:本论文的轨迹是指由个体经过的路段组成的序列
。多条轨迹组成轨迹数据集
。
本论文解决的是跨城市轨迹生成问题,使用源城市的轨迹数据集训练深度学习模型,使其能够在目标城市生成轨迹。输入:源城市路网道路网络
和轨迹数据集
,目标城市路网
。优化目标:优化模型参数
使得在目标城市的道路网络
上,生成的轨迹数据集
与真实数据
相似。用公式表示为
其中
为优化目标,衡量生成轨迹与真实轨迹的差异。最终使用训练好的参数进行目标城市轨迹数据的生成
本文提出了一种具备跨城市迁移性的轨迹生成模型(GTG):首先基于空间句法理论提取路网的拓扑特征;然后设计了解耦对抗训练方法学习城市无关的道路表征,实现跨城市的出行代价预测;最后通过最短路搜索为新城市生成轨迹数据。模型框架如图 1 所示。
▲ 图1 GTG 模型框架
本论文以空间句法(Space Syntax)理论为指导,计算了四类典型的空间特征来刻画路段的性质:总深度(Total Depth)、整合度(Integration)、连通度(Connectivity)和选择度(Choice,又称介数中心性)。
然后,本论文使用归纳式图注意力网络来聚合路网的特征。参考 ClusterGCN 的做法,本论文使用了 METIS 算法分割路网,再随机采样子图构造多样化的训练样本。采样过程如下所示
其中
是整个城市路网的全局图,
是 Metis 分割出的子图,
是随机采样组合出的子图。METIS 算法能够确保各个子图的顶点数量尽量均衡,且子图间的边数最少。这种均衡的划分方法有助于增强模型对不同类型道路网络的适应能力。
然后,本论文设计了空间感知的图注意力网络(SAGAT)来聚合子图的特征,生成带周边拓扑信息的路段表征。SAGAT 的输入为各子图的节点特征,通过一系列注意力层堆叠的方式进行特征聚合,最终获得子图拓扑特征表示
其中
是对应路段
的聚合拓扑表征。具体来说,该过程是通过多层注意力聚合来实现的。初始层输入通过多层感知机(MLP)转换后的表征,计算方式为
对于第
层,SAGAT 网络计算了节点间的注意力权重,并将空间关系嵌入到注意力机制中。
在这种结构中,模型不仅关注邻居节点的特征,还考虑了这些节点之间的空间关系,例如转角、行驶距离以及介数中心性。
这些空间关系反映了道路段之间的物理连接和空间相对位置,是理解城市道路网络结构的重要信息。该注意力机制的计算过程为:
其中
是可学习参数,
是路段
的邻居节点集合,
是 LeaklyReLU 激活函数。
表示两节点之间的空间联系,表示如下:
其中 Bet 指的是穿过
和
的最短路径数与整个网络中最短路径总数的比例。Angle 是路段转角,而 Dist 表示两个路段间的中心点旅行距离。最终空间感知的图注意力网络的输出表示为
本论文将 GAT 聚合得到的路段表征用于出行代价预测。但是,源城市和目标城市的路网特征分布存在差异,导致模型直接在目标城市应用的效果较差。对此,本论文设计了一种解耦对抗学习方法,来获得城市无关表征,提升跨城市预测效果。
(1)潜在变量解耦
首先,本论文使用语义编码器和域编码器来分离原始表征中的语义信息和城市相关的信息。本论文假设路段信息由两个独立的潜在变量决定:一个语义潜在变量
和一个域潜在变量
。这些变量分别通过两个 MLP 编码器提取。
捕获用于预测轨迹成本的语义信息,而
包含城市特定的域信息,如下
本论文使用对抗域适应技术来训练这些表征,其中包括一个用于出行代价估算的预测器和一个用于城市识别的判别器。这些表征在出行代价预测的优化当中同步更新。
(2)出行代价预测
出行代价由路段在特定时期的平均通行时间和通行速度表示,如下
以潜在变量
作为输入(为简化省略上标),出行代价预测网络可以表示为
用于训练神经网络的预测损失函数包括一个 MSE 损失和一个排名损失。MSE 损失的计算方式为
其中
是源城市数据集的大小,
是路段出行代价的真实值(包括出行时间和速度),使用真实数据集的平均值来表示。在跨城市场景下,不同城市之间的出行代价往往存在整体偏差,导致很难预测出行代价的绝对大小。
对此,本论文引入了排名损失来解决这一问题。具体来说,本论文预测了任意路段
的出行代价高于
的概率为:
实际的排名标签值计算如下:
计算二元交叉熵损失如下:
出行代价预测的总损失为 MSE 损失和排名损失的加权求和,如下:
其中
是两种损失之间的平衡权重。
(3)解耦对抗训练
为了从语义信息中分离出域信息,本研究引入了一个域判别器,用以预测路段的域标签(即该路段属于源城市还是目标城市)。从源城市或目标城市中提取子图样本,并为每个道路段分配域标签,如下所示:
标签为 1 代表该路段来自源城市路网,标签为 0 代表该路段来自目标城市路网。给定潜在变量
作为输入,域判别器对源城市和目标城市进行分类,如下:
对于这个域判别任务,使用二元交叉熵损失计算得:
其中
和
分别代表源城市和目标城市数据集的路段数量。
解耦对抗训练被用来促进
和
之间信息的解耦。对于语义潜在变量,其最终目标是在最大化域判别损失的同时,最小化出行代价预测损失;对于域潜在变量,目标则正好相反。通过使用不同的表征作为输入,损失函数计算为
为了进一步减少信息耦合,本研究还引入了正交损失,企图使解耦出来的表征之间的差异尽可能增大,正交损失的计算如下:
表征解耦对抗训练的总损失函数结合了这些损失,最终的损失函数为:
其中
是一个平衡因子。通过该步骤的解耦对抗训练,模型能够将域相关的信息从路段表征中分离出来,从而使得城市无关的语义表征,实现跨城市的出行代价预测。
3.3 结合最短路搜索的出行偏好学习
在完成出行预测之后,可以采用最短路径搜索算法为目标城市生成移动轨迹。大多数现存的最短路径搜索方法依赖于固定的道路成本因素,例如出行时间或出行速度,来规划路线。
然而,仅依赖单一成本因素通常无法全面捕捉用户的实际旅行偏好,这些偏好受到更复杂因素的影响。
为了解决这一问题,本论文提出将旅行偏好建模为可观测代价与隐含代价的组合。隐含代价代表了那些难以解释、影响人类选择的因素,通过使用多层感知器(MLP)预测,如下式所示:
其中
是语义潜变量。然后,模型使用可观测代价和隐含代价的加权组合来估计整体出行偏好,如下:
其中
是可学习的权重。