专栏名称: 智能车情报局

聚焦智能汽车关键技术与创新产品

实战漫谈：自动驾驶感知的无图方案

智能车情报局 · 公众号 · · 2024-05-26 13:08

正文

👀

导读

国内新能源汽车市场的发展如火如荼。随着高速、城快等场景的L2辅助驾驶功能的普及和成熟，越来越多的上市车型转向进一步支持城区NOA功能。毫无疑问，城区NOA功能的安全性、应对复杂路况的体验和通行效率，将成为各家智驾的最大卖点。

城区NOA功能背后的自动驾驶技术也在飞速发展。相比于基于高精度地图自动驾驶方案、合理的成本控制（制图和更新的成本）成为目前各家智驾公司、主机厂技术发力的一致方向，因此无图（不使用高精度地图）方案得到了更多的讨论。充分利用好导航地图的信息，结合强大的感知能力可在线建立满足规控需求的“高精度地图”。

不过依靠自车感知能力的在线推理的“高精度地图”，难免在遮挡和远距离上与传统图商的高精地图存在精度的差异。这就要求下游和相关任务能够兼容这种精度差异和不确定性。

本文将会讨论无图感知方案中的主要技术环节，提供一些业界解决方案思路，并结合辉羲智能实践做一些探讨。

做个预告！！！ 辉羲智能联合创始人章健勇 将参加6月5日在上海智慧出行展览会同期举行的GTIC 2024中国智能汽车算力峰会，并在上午的高峰论坛发表演讲，主题为《 可扩展的计算引擎，加速打造中国FSD 》。大家可扫码报名参会，到现场进行深入了解。

辉羲智能静态元素检测的基本框图

感知地图向端到端 和向量化演变

从传统的3D车道线检测技术到目前的在线推理高精度地图，除了检测元素更加丰富之外，技术也逐渐从栅格化方法向矢量化方法演变。栅格化方法一般有两种：一种是语义分割+后处理，这类方法在BEV feature上实现简单，但是需要通过复杂的后处理，构建实例级别的信息。通常会增加耗时，鲁棒性相对较差。

另外一种是采用实例分割的方法，但是由于线的特殊形状（100mx0.2m），实例分割会遇到困难，同时还需要进一步矢量化才能提供给下游。因此矢量化的方法，一种端到端的方式构建矢量线得到了大家格外的关注，也涌现出不少的工作[2,3,4,5,6]。

HDMapNet[1] MapTR[2]

在实践过程中也会发现矢量化的方法也会有一些诸如泛化性等其他问题，主要通过以下方式解决：

1、地图元素的建模

相比于nuScenes，Argoverse2等开源数据集，实际的自动驾驶场景包含了更加丰富的道路结构元素类别：车道线、路沿、停止线、待转区、导流区、路面marker等，更多的道路结构元素属性：单双线、虚实线、黄线等，以及更高级别的道路语义：机动车道、非机动车道、公交专用车道等。这些信息的复杂性使得构建类别属性的时候要细心设计，做好解耦，才能在任意检测要素上都获得不错的性能。

2、地图元素的约束

由于将车道线建模成点链，点链中的每个点，需要符合线曲率的约束，避免生成诡异的折线；同时线和线之间也有等宽这样的约束关系，这些几何约束会使得输出更加合理。

3、变道和转弯场景的性能优化

由于感知的推理结果是在ego系下的，根据自车的行驶状态，可以把数据分布简单分为直行、变道和转弯。在这三种场景中，车道线的朝向分布存在差异。直行场景的数据过拟合会导致变道和转弯场景性能下降。因此需要结合数据采样，BEV空间数据增强（BEV旋转）等手段缓解数据分布差异带来的性能问题。

4、增强基于DETR框架的Decoder查询能力

利用实例查询（instance query）而非点查询（point query），可以提升query内容的一致性。辉羲智能的一篇工作MapQR[6]，一种端到端的方法，强调增强query能力以构建在线矢量化地图。尽管地图构建本质上是一个点集预测任务，但 MapQR 使用instance query而不是point query。这些instance query先被分散（scattered）用于点集的预测，随后被聚集（gathered）用于最终的匹配。这种query设计，称为 scatter-and-gather query ，共享同一地图元素中的内容信息。

MapQR和MapTR的对比，左边是基于点查询的MapTR

右边是MapQR

拓扑推理的困难和优化处理

PNC对地图的要求除了基本的几何信息，还需要横向（车道线之间以及车道线和对应的车道中心线）、纵向（分叉合流线、路口引导线的前后继关系）的拓扑关系，有了拓扑关系才可以完成routing和参考线的生成，因此拓扑推理也是尤为重要的。

拓扑推理[7,8]对感知来讲实际上是很有难度的，尤其是在大路口多个方向的拓扑推理，或者有遮挡的情况。由于感知范围的受限，很难将所有路口的路面箭头都识别到，以帮助构建路口的拓扑关系。

因此我们利用两种方式优化路口场景的拓扑推理：一是将推理的范围缩小为当前道路所在路口处的链接关系，当前道路的路口感知距离最近，且对控车最为重要；二是利用好导航地图的路口拓扑信息，增强模型表现。

自车所在道路的拓扑关系

用先验地图增强感知地图

在远距离和遮挡的场景里，地图推理精度的提升会遇到很大的挑战。这时候通过定位获得的局部先验地图信息，就显得非常关键。还有另外一种应用场景，就是路口的拓扑推理，路口处的拓扑基本上是靠路口的建图标识提供的关联信息，在方向箭头被遮挡时，感知很难给出精确的拓扑关系，因此需要先验地图的信息来完善拓扑的构建。

将先验地图作为神经网络的输入的工作也有不少[9,10,11]，但是使用先验地图更重要的是要解决地图的鲜度问题，毕竟感知到的地图信息是即时的，先验地图可能存在鲜度问题。因此在模型训练的过程中，会大量随机的mask部分先验地图或随机的drop掉先验地图，使得整体的模型输出基本依靠感知的能力。

辉羲智能在遮挡情况下，有无先验地图的对比

左边是不带先验地图的输出

使用向量化方法的施工区域检测

无论是无图方案还是高精度地图方案，对城市中的施工区域都是要通过感知来特殊处理。施工区域具有临时性，往往需要实时感知来进行路线规划。

左：施工区域场景 | 右：施工区域基于矢量线(点链)的表示

施工区域的建模和一般地图元素类似，可以刻画为靠近行车区域的Polyline，但不同的是，地面元素一般依靠地面高度的特征，而施工区域的检测则依赖于地面上的一些交通元素（锥桶、水马等路障）。

因此，我们会基于Occupancy网络的输出特征，采用类似Map的模型结构的向量化方法输出施工区域信息。基于Occupancy网络的施工区域检测，进一步提升了感知系统的能力上限，使其更加适应复杂多变的道路场景。

基于交通信号拓扑关系的
车道通行状态推理

当前行车道路各个通行方向（掉头、左转、直行和右转）的通行状态可以借助红绿灯和交通标志牌的识别来完成推理。

由于红绿灯、交通标志牌检测网络与map推理同在一个大模型，其语义类别、几何位置等信息均包含在transformer框架下的Query中，因此可以利用Query之间的交互计算它们与虚拟车道的关联关系[12]。在获得关联关系后，就很容易推断出4个虚拟车道的通行状态。

辉羲智能借助红绿灯和交通标志的检测Query与虚拟车道Query做关联，生成虚拟车道的通行状态

适配感知地图的轨迹预测

轨迹预测任务是预测自车周围，我们比较关心的agents未来的轨迹。传统的预测模块，是独立于感知的，它接收来自感知的动态障碍物的历史轨迹和高精度地图，地图中的静态信息相对来说是确定的。而无图方案中，地图是感知在线推理和先验地图融合的结果，带有不确定性[13]。预测模型要能很好的兼容这种不确定性，最好的方法就是将预测模型嵌入到感知模型中，端到端的输出障碍物轨迹。

辉羲智能基于在线地图端到端的轨迹预测

总结

总之，模型推理的车道线几何精度，覆盖范围和拓扑链接关系将决定自动驾驶车辆行驶的平稳性和接管率。同时一些紧密关联的模块如施工区域检测、车道通行状态推理、轨迹预测等与传统的基于高精度地图的方案都会有差别，需要升级算法框架来兼容推理的地图结果。

基于此方案，在交通参与者密集、交通元素复杂场景的实测中，自动驾驶系统都能展现出非常好的鲁棒性和数据驱动的潜力。未来会聚焦更加端到端的范式，减少信息在各个自动驾驶模块之间流动的损耗，挑战更加广泛、困难的实战场景。

参考文献

[1]Li Q, Wang Y, Wang Y, et al. HDMapNet: An online HD map construction and evaluation framework. International Conference on Robotics and Automation (ICRA), 2022.

实战漫谈：自动驾驶感知的无图方案

正文

请到「今天看啥」查看全文