专栏名称: arXiv每日学术速递
跟踪计算机视觉、人工智能、机器学习、NLP、语音识别、量化金融等热门方向学术信息
目录
相关文章推荐
十点读书会  ·  未婚未育的女孩们,排队拍孕妇照 ·  昨天  
书单来了  ·  碎片时间刷这5本百科全书,丰富知识储备! ·  2 天前  
新京报书评周刊  ·  梁贵柏与《双药记》:下一个“青蒿素”在哪里? ·  3 天前  
十点读书  ·  过了这个年龄,就该给孩子零花钱了 ·  3 天前  
51好读  ›  专栏  ›  arXiv每日学术速递

AAAI 2025 | 合成数据助力自驾点云异常检测新SOTA

arXiv每日学术速递  · 公众号  ·  · 2024-12-27 12:06

正文

论文信息

  • 论文题目: LiON: Learning Point-wise Abstaining Penalty for LiDAR Outlier DetectioN Using Diverse Synthetic Data
  • 论文发表单位:清华大学, 厦门大学,滴滴出行, 香港中文大学-深圳
  • 论文地址:https://arxiv.org/abs/2309.10230
  • 项目仓库:https://github.com/Daniellli/LiON

1.Motivation

基于点云的语义场景理解是自动驾驶汽车感知技术栈中的重要模块。然而,由于点云不像图像那样具有丰富的语义信息,在点云中这个识别异常点是一项极具挑战性的任务。本工作从两个方面缓解了点云缺乏语义信息对异常点感知的影响:1) 提出了一种新的学习范式,使模型能够学习更鲁棒的点云表征,增强点与点之间的辨别性;2) 借助额外的数据源,ShapeNet,提出了一套可以生成多样且真实伪异常的方法。实验结果表明,在公开数据集 SemanticKITTI 和 NuScenes 上,本方法显著超越了前 SOTA。

2.Method

给定一个场景点云,点云语义分割的主要任务是为点云中的每个样本点分配一个预先定义的类别,例如车、树、行人等。本工作将这些属于预先定义类别的样本点称为正常样本点。而 点云异常检测则作为点云语义分割模块的补充,用于识别那些不属于预先定义类别集合的样本点,例如桌子、椅子等无法预料的类别。本工作将这些样本点称为异常样本点。

此前的工作 REAL 将图像异常检测方法直接适配到点云异常检测领域,并通过实验发现,大量异常样本被错误分类为预先定义的类别。为了解决这一问题,REAL 提出了一种新的校正损失,用于校正正常样本的预测。然而,本工作的实验结果表明,尽管该校正损失能够提升异常样本的分类性能,但同时也对正常样本的分类性能造成了显著的负面影响。

本工作将图像异常检测方法在点云异常检测领域表现不佳的原因归结于点云不像图像那样具有丰富的语义信息。比如Figure 1左侧,即使是人类也难以识别道路中央的家具信息。因此,该工作从两个方面缓解点云缺乏丰富语义含义所带来的影响。

Figure 1 点云语义分割模块错误地将家具分类成道路

首先,该工作提出为每个样本点计算一个惩罚项,并通过额外的损失函数保证正常样本点的惩罚较小,而异常样本点的惩罚较大。然后,将该惩罚项嵌入交叉熵损失中,以动态调整模型的优化方向。通过为每个样本点学习额外的惩罚项并改进学习范式,本工作增强了样本点之间的辨别性,缓解了点云缺乏语义信息的问题,从而全面提升了异常检测能力。

此外,该工作提出利用 ShapeNet 数据集生成伪异常。ShapeNet 是一个大规模的三维形状数据集,包含超过 22 万个三维模型,覆盖 55 个主要类别和 200 多个子类别。因此,通过 ShapeNet 生成的伪异常具有较高的多样性。其次,在生成伪异常时,该工作进一步考虑了点云的采样模式,从而使生成的伪异常更加真实。因此,该工作通过生成更加多样且真实的伪异常,更好地估计和模拟了真实异常的分布,缓解了点云缺乏语义信息的问题。

2.1. 模型整体架构

如Figure 2所示,本工作通过伪异常生成方法对输入点云进行编辑生成带有伪异常的输入点云x , 而后该点云通过特征提取器 和正常样本分类器f和异常样本分类器g处理, 得到正常类别logit , 以及异常类别logit , 而后通过softmax 处理, 可以拿到正常类别概率 和异常类别概率 。c表示正常样本类别数量,n表示给定点云的点数量。该处理过程可以形式化表达为:

其中[·]表示拼接操作。

Figure 2 算法处理流程

2.2. 基于逐点惩罚的学习范式

本工作提出对每个样本点用能量函数计算一个额外的惩罚项 ,惩罚项的计算如下所示:

此外,该工作通过一个额外的 逐点惩罚损失函数 使得对于所有的正常样本点都有个较小的惩罚,对于所有的异常样本点都有较大的惩罚。该 逐点惩罚损失函数 的形式化表达如下:

其中,m表示数据集大小;n表示场景点数量;I(.)表示示性函数; {1,...,c,c+1}为样本点类别真值,c+1表示异常类别;max(.)为最大值函数; 为超参数。该损失函数的作用如Figure 3所示,对于所有的正常样本点( 逐点惩罚损失函数 公式左侧),如果惩罚项 大于 ,损失函数的值就会大于0;反之,损失函数的值等于0。异常样本的情况与此类似。通过优化 逐点惩罚损失函数 ,就可以对所有的正常样本计算得到一个接近甚至小于 的惩罚, 对于所有异常样本得到一个接近甚至大于 的惩罚

Figure 3 惩罚项 和逐点惩罚损失之间关系

而后,该工作用惩罚项 升级交叉熵损失函数,动态调整交叉熵损失的优化重点, 升级后的交叉熵损失函数被叫做 逐点拒绝(abstain)损失函数:

对于所有正常样本,该算法会计算得到一个较小的惩罚系数 。将其取负后,值会变得较大,而取负后的平方值 则会进一步放大。因此将异常类别概率除上该值,异常类别概率对于逐点拒绝损失函数的影响会被抑制,从而逐点拒绝损失函数重点会放在优化正常类别概率上。异常样本的情况与此类似。

因此整个算法的损失函数为:

其中 为损失函数的系数。

2.3.合成数据生成点云异常







请到「今天看啥」查看全文