基于城市物理环境反演交通运行状态是一个具有挑战性的问题,因为交通状态受多种因素影响且表现复杂。我们在2017年7月收集了5,115,512条出租车轨迹数据,记录了车辆的经纬度、速度、方向等关键信息,重点关注位置和速度数据。此外,还收集了14,115张覆盖主要道路的全景图像,并对这些图像进行了语义分割,使用了预训练的PSPNet模型,基于Cityscape分类标准(19个类别)生成了语义分割矩阵。矩阵代表了不同类别的物理特征,如道路、建筑物、交通标志、植被等,通过这些特征反映研究区域内的视觉场景。(图5)
图5. 研究区域示意图及研究数据
如图所示,我们将研究区域划分为多个路段,并利用车辆的GPS位置数据为各路段赋予交通状态属性,速度为平均值,交通量为一天内通过车辆总数。数据分布显示速度接近高斯分布,流量符合幂律分布。通过分位数分类方法将交通属性分为不同类型,平衡了预测样本数量。本文研究了短距离依赖(通过道路的直接影响)和长距离空间交互(超越物理邻近的隐性关联),后者主要通过
社交媒体签到数据
来量化。我们构建了
基于签到顺序的空间交互矩阵
,揭示了传统交通分析所忽略的模式,最终生成了包含131,652个交互关系的加权交互网络。
图6. 带有核密度估计的比较直方图展示了街道级交通数据的分布。左侧为平均速度分布,中值为 29.47 公里/小时,右侧为平均交通量分布,中值为 557 辆/街道。共计 5075 个道路样本。
为了验证本文方法的有效性,我们使用分位数法将街道按速度和流量标记为高速、中速、低速及高、中、低流量路段,并进行了10组对比实验,包括本研究提出的方法、传统GCN、随机森林、支持向量机等,以及两个消融实验(去除网络的不同模块)。实验结果如表2和表3所示,分别针对三类和四类标签进行交通状态预测。
模型在PyTorch框架下实现,具有30个隐藏维度,并结合了图形注意网络(GAT)层、注意机制
、全连接层和残差结构,采用Adam优化器训练,并使用dropout和批量归一化技术防止过拟合。
实验结果显示,我们的方法在交通流量和速度估计方面优于其他方法,特别是在交通流量预测上表现更佳,表明街景图像在交通流分析中的潜在价值。
为了说明各种方法的空间性能,我们在图9中展示了消融实验1(仅使用空间依赖信息)和我们方法(结合空间依赖和空间交互信息)的预测结果。与传统方法相比,我们的模型更准确地预测了城市核心地区的拥堵情况,这是因为考虑了长距离的空间交互(典型的长距离交互是
工作通勤
)。整体结果表明我们的方法在预测城市拥堵方面更具优势,并提供了更精确的城市交通场景表示。
图 9. 交通流量和速度预测的比较可视化。面板
(a) 和 (b) 显示了交通流量和速度的真实情况。面板 (c) 和 (d) 分别显示了考虑长距离空间相互作用后预测的交通量和速度分布。面板 (e) 和 (f) 展示了当模型仅考虑近距离空间依赖性时预测值的空间分布。该图强调了当将长距离空间相互作用集成到模型中时,大多数区域的预测准确性得到提高。它特别突出了城市核心区域预测路段流速的明显下降(面板 (d) 和 (f))和交通量预测的显著增加(面板 (c) 和 (e)),强调了传统交通预测方法在高密度城市区域的潜在局限性。
为了说明视觉元素对街道间预测值的可解释影响,我们绘制了图10,并分别分析了空间交互矩阵和空间依赖矩阵的作用。使用PyTorch框架提供的“
钩子
”方法进行特征重要性分析,图10的热图显示了环境特征变化对交通流量预测的影响,颜色从蓝色(负面影响)到红色(正面影响)。分析揭示了短距离和长距离影响的差异,例如人行道扩大会减少近距离交通流量,而墙体等障碍物则削弱了长距离交通。图10的结果表明视觉元素对交通流特征有显著影响,验证了从街景图像推断交通特征的可行性。
图 10.热图显示了各种视觉元素在图像层面对交通量预测的解释影响。单元格值表示空间依赖性和空间交互作用在低、中、高交通量类别中的影响程度。
在街道层面的解释中,注意力权重分数对于识别关键特征至关重要。模型通过为关键场景分配更高权重,能够“关注”对交通速度或流量有重要影响的部分。图11可视化了街道间的注意力权重,红色表示强相互影响,蓝色表示无显著相互作用。图11(a) 展示了空间依赖权重,表现出聚类模式,红线和蓝线成组出现;图11(b) 展示了空间交互权重,揭示了长距离的强烈影响,帮助模型捕捉复杂空间关系的长距离相关性。
图 11. 街道层面注意力图矩阵 和 的可视化:(a) 突出显示局部街道内的空间依赖性,(b) 说明街道对面的空间相互作用。