DiFSD：商汤绝影打造的模拟人类驾驶行为的端到端自动驾驶系统

3D视觉之心 · 公众号 · · 2024-09-25 07:00

正文

作者 | ADFeed 编辑 | ADFeed

点击下方卡片，关注“ 3D视觉之心 ”公众号

第一时间获取 3D视觉干货

DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Autonomous Driving

论文：
https://arxiv.org/abs/2409.09777

DiFSD 是一种创新的端到端自动驾驶系统，由商汤绝影（SenseAuto）联合上海交大共同打造。它采用了一种以自我为中心的全稀疏范式，通过结合不确定性去噪和迭代细化策略，显著提高了自动驾驶的效率和性能。

该系统主要由稀疏感知、层次化交互和迭代运动规划三个核心模块构成：

DiFSD 的特点在于其对人类驾驶行为的深入模拟和对环境的稀疏表示，这使得系统能够集中处理与当前驾驶意图密切相关的信息，同时忽略无关的冗余数据。此外，DiFSD引入的几何先验和意图引导的注意力机制，进一步提升了交互查询的选择精度和规划的合理性。

技术解读

DiFSD 是一种端到端自动驾驶系统，它采用了一种以自我为中心的全稀疏范式，通过模拟人类驾驶行为，专注于与自车意图和轨迹规划最相关的车辆和静止物体。这种系统通过稀疏感知、层次化交互和迭代运动规划三个核心模块来实现对驾驶场景的理解和决策。

DiFSD 的处理过程和技术特点体现在：

DiFSD 的价值在于其能够有效提高自动驾驶系统的效率和性能。在nuScenes数据集上的实验结果表明，DiFSD在减少平均L2误差和碰撞率方面取得了显著的成效，同时大幅提升了系统的运行效率，这表明DiFSD在实际自动驾驶应用中具有巨大的潜力。

未来DiFSD的研究方向将集中在如何进一步提升几何分数的生成质量，以及如何整合更多的交通信号和视觉-语言模型，以实现更加智能化和自动化的驾驶决策。随着这些技术的不断发展和完善，DiFSD有望在未来的自动驾驶领域发挥更加重要的作用。

论文解读

本文提出了一种名为DiFSD的端到端自动驾驶方法，它是一种以自我为中心的全稀疏范式，通过不确定性去噪和迭代细化来提高效率。

论文的主要内容概括如下：

摘要：