专栏名称: 计算机视觉深度学习和自动驾驶
讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
目录
相关文章推荐
防骗大数据  ·  八万元养老钱差点“寄”给别人… ·  昨天  
西安头条  ·  一男童在商场突遭意外!警方已介入 ·  昨天  
西安头条  ·  一男童在商场突遭意外!警方已介入 ·  昨天  
中国能源报  ·  1.51亿立方米! ·  2 天前  
中国安全生产网  ·  一周事故及安全警示(2025年第4期) ·  3 天前  
51好读  ›  专栏  ›  计算机视觉深度学习和自动驾驶

数据驱动的扩散模型提高自动驾驶汽车交通模拟的安全性

计算机视觉深度学习和自动驾驶  · 公众号  ·  · 2024-12-28 00:03

正文

24年10月来自芬兰 Aalto University、芬兰 AI 中心和 Tampere University 的论文“Data-driven Diffusion Models for Enhancing Safety in Autonomous Vehicle Traffic Simulations”。

安全-紧要交通场景对于自动驾驶系统的开发和验证至关重要。这些场景为车辆在现实世界中很少遇到的高风险条件下的响应提供了重要的见解。紧要场景生成方面的最新进展,证明了基于扩散的方法在有效性和真实性方面优于传统的生成模型。然而,当前基于扩散的方法,未能充分解决驾驶员行为和交通密度信息的复杂性,这两者都显著影响驾驶员的决策过程。这项工作提出一种方法来克服这些限制,即为结合行为复杂性和交通密度的扩散模型引入对抗性指导函数,从而增强更有效、更现实的安全-紧要交通场景的生成。根据两个评估指标对所提出的方法进行评估:有效性和真实性。根据两个评估指标对所提出的方法进行评估:有效性和真实性,与其他最先进的方法相比,该方法显示出更好的效果。


DiffScene [7] 是一种基于扩散概率模型的安全-紧要场景生成方法,与 STRIVE 【8】等先前的方法相比,取得了重大进步。它使用大量数据训练扩散模型,以确保生成轨迹的真实性,并在测试时指导中应用对抗性目标,以确保安全-紧要场景的生成。这些对抗性目标可分为三类:安全性、功能性和约束目标。DiffScene 的评估包括有效性和真实性,有效性指标包括碰撞率、路线未完成率和速度满意度。最后,评估结果表明,DiffScene 在有效性和真实性方面均优于当代最先进的方法。

基于扩散模型安全-紧要场景生成的另一项重大进步可以在 Chang 的方法 [6] 中找到。它提出了一些对抗性引导函数,旨在改进长时间步长的交通模拟,并在对抗性挑战和现实性之间取得平衡。这些对抗性函数包括碰撞距离、碰撞时间、车道边缘和相对速度目标。与 DiffScene 相比,一个显着的区别是,除了自车和对抗车之外,它还增加了一种额外的车辆类型,即非对抗车。

如图给出所提出方法的概述和生成的交通场景示例。每个安全-紧要车辆的上下文信息在输入扩散模型之前都经过编码,并且需要对抗性引导梯度来修改生成的轨迹,使其更加安全紧要。


为了实现上述目标,首先在大规模数据集上训练扩散模型,生成真实性损失较小的一般交通场景。然后在引导采样过程中应用对抗性优化,满足某些约束的同时最大化自车的驾驶风险。

扩散模型将样本生成视为一个去噪的迭代过程,通过学习反向扩散过程来实现。扩散模型生成的轨迹包括状态轨迹和动作轨迹,都是从纯高斯噪声开始,通过迭代扣除轨迹中的噪声生成的。这种扩散模型是有条件的,因为其去噪过程取决于基于 ResNet 编码器编码的上下文信息。

扩散模型的轨迹生成记做:


所提的方法,不是联合预测状态和动作轨迹 [9],而是仅预测动作轨迹 τ/a,并利用已知的动力学模型 D 和初始状态 s/0 推断状态轨迹 τ/s,记为 τ/s = M(s/0,τ/a),从而保证去噪过程中状态轨迹的物理可行性。

扩散过程:


在无限扩散步的极限下,信号被污染为各向同性的高斯分布。

对于轨迹生成,应用训练的基于 UNet 模型做逆转扩散过程,从而迭代地对噪声轨迹进行去噪 [9]。

逆扩散过程:


在每个训练时间步中,环境上下文信息 c 和真值干净轨迹 τ^0 均从真实驾驶数据集中采样,去噪步骤 k 从 {1, . . . , K} 中均匀采样。首先通过从干净轨迹 τ^0 计算噪声轨迹 τ^k 来污染动作轨迹,然后计算相应的状态 τ^k/s = M (s/0 , τ^k/a)。

训练的损失函数定义为:







请到「今天看啥」查看全文