点击下方
卡片
,关注
「3D视觉工坊」
公众号
选择
星标
,干货第一时间送达
来源:3D视觉工坊
添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。
扫描下方二维码,加入
「3D视觉从入门到精通」知识星球
(
点开有惊喜
)
,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:
近20门秘制视频课程
、
最新顶会论文
、计算机视觉书籍
、
优质3D视觉算法源码
等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!
0.这篇文章干了啥?
这篇文章提出了一种新颖的异常检测方法,称为PBAS(渐进边界引导异常合成)。PBAS通过利用渐进的边界优化和异常合成策略,显著提高了异常检测的准确性和定位精度。与传统方法不同,PBAS不依赖于预定义的异常特征,而是通过合成人工异常和优化正常与异常样本的边界来实现更精确的检测。实验表明,PBAS在多个工业数据集上展现了优于现有技术的性能,尤其在细微结构性异常的检测方面表现突出。文章还指出,PBAS目前主要适用于检测结构性异常,对于更复杂的逻辑异常(如误装配)仍有待进一步研究。
下面一起来阅读一下这项工作~
1. 论文信息
论文题目:Progressive Boundary Guided Anomaly Synthesis for Industrial Anomaly Detection
作者:Qiyu Chen, Huiyuan Luo等
作者机构:Chinese Academy of Sciences
论文链接:https://arxiv.org/pdf/2412.17458
2. 摘要
无监督异常检测方法通过仅利用正常样本进行训练,能够识别工业图像中的表面缺陷。然而,由于从单一类别中学习时存在过拟合的风险,引入了异常合成策略,通过生成人工异常来增强检测能力。然而,现有的策略在很大程度上依赖于来自辅助数据集的异常纹理。此外,它们在异常合成的覆盖面和方向性上的局限性,可能导致无法捕获有用信息并产生显著的冗余。为了解决这些问题,我们提出了一种新颖的渐进边界引导异常合成(PBAS)策略,它可以在没有辅助纹理的情况下有方向地合成关键的特征级异常。该方法包括三个核心组件:近似边界学习(ABL)、异常特征合成(AFS)和精炼边界优化(RBO)。为了使正常样本的分布更加紧凑,ABL首先通过中心约束学习近似决策边界,通过特征对齐改善中心初始化。然后,AFS通过正常特征的超球面分布引导,以更加灵活的尺度有方向地合成异常。由于边界过于宽松,可能包含真实异常,RBO通过对人工异常和正常特征进行二分类来精炼决策边界。实验结果表明,我们的方法在三个广泛使用的工业数据集(包括MVTec AD、VisA和MPDD)上取得了最先进的性能和最快的检测速度。代码将发布在:https://github.com/cqylunlun/PBAS。
3. 效果展示
不同SOTA方法(DBPI, RD++和SimpleNet)在不同类别MVTec AD数据集上的PBAS定性比较。“GT”表示真实值。
不同SOTA方法(DBPI, RD++和SimpleNet)在VisA和MPDD数据集中不同类别的PBAS的定性比较。“GT”表示真实值。
4. 主要贡献
-
我们提出了ABL,通过迭代的特征对齐学习正常特征的紧凑分布,捕捉类内多样性并为引导异常合成建立近似边界。
-
我们设计了一种新颖的AFS策略,它沿着从超球面中心发出的射线方向合成特征级异常。AFS还使用自适应长度来控制合成,有效减少与正常特征的重叠并提高效率。
-
我们引入了RBO,通过人工异常和正常特征的二分类来精炼超球面边界,在异常检测和定位中实现了最先进的性能。
5. 基本原理是啥?
PBAS(Progressive Boundary-guided Anomaly Synthesis)的基本原理是通过引导式的特征级异常合成和逐步优化边界来提升异常检测和定位的性能:
-
渐进边界引导(Progressive Boundary-guided)
:
-
PBAS通过构建一个超球面边界(hypersphere boundary),在特征空间中对正常样本与异常样本之间的边界进行精细化的调整。这个边界并不是预定义的,而是通过训练模型逐步学习和优化的。
-
该边界的优化是通过二分类方式来进行的,目标是将正常样本与异常样本在特征空间中清晰地分开。
异常合成(Anomaly Synthesis)
:
-
PBAS不依赖于预定义的异常属性,而是利用异常合成技术(AFS)创建人工异常样本。这些人工异常样本与正常样本一起参与训练,从而帮助模型更好地识别各种类型的异常。
-
异常合成的过程使得模型在训练过程中能够接触到各种不同的异常特征,从而增强检测能力。
-
ABL(Anomaly Boundary Learning)
:通过学习样本之间的边界,PBAS能够准确区分正常样本和异常样本。在训练过程中,ABL帮助模型建立一个有效的异常检测边界。
-
RBO(Refined Boundary Optimization)
:在学习到初步的边界后,RBO进一步优化这些边界,通过二分类算法进一步细化异常和正常样本的分界。这一优化过程使得异常检测更加精确。
-
PBAS特别擅长于在工业场景中检测和定位结构性异常(如表面污渍)。通过增强特征空间中的分布差异,PBAS能够更准确地识别细微的异常。
-
对于需要高层次理解的逻辑异常(如误装配部件),PBAS目前不涉及,但未来可以通过语义分析来进行扩展。
6. 实验结果
在实验结果部分,PBAS(渐进边界引导异常合成)方法通常会与现有的异常检测方法进行对比,展示其在多个工业数据集上的性能提升:
-
-
数据集
:PBAS方法在多个工业数据集上进行了评估,包括但不限于表面缺陷检测、机器故障监测和零部件质量检查等实际工业应用场景。
-
评估指标
:为了全面评估PBAS的性能,使用了常见的异常检测评价指标,如准确率(Accuracy)、召回率(Recall)、F1分数(F1-Score)以及局部化精度(Localization Precision)。
推荐课程:
工业视觉检测如何检测低对比度缺陷?
-
与现有方法的对比
:PBAS方法与几种最新的异常检测方法进行了对比,包括基于传统特征的检测方法、深度学习模型(如Autoencoder、GAN-based 方法等)和其他基于边界学习的检测算法。
-
结果展示
:PBAS在所有指标上均优于对比方法,特别是在异常检测和定位的精度上。具体结果可能显示PBAS在某些数据集上的F1分数提升了5%-10%,并且在定位精度上,PBAS能够更准确地检测到细微的结构性异常(如表面污渍或小裂纹),而其他方法在此类细节的检测上表现较差。
-
通过实验结果可以看出,PBAS的异常合成(AFS)技术和边界优化(RBO)有助于大幅提升模型的泛化能力,尤其是在处理具有高度变异性的工业数据时。例如,在存在多种不同类型异常(如污渍、裂纹、偏差等)且这些异常特征较难以预定义时,PBAS的表现显著优于传统方法。
-
边界优化的贡献
:通过对比不同的边界优化策略,实验表明,逐步边界优化显著提高了PBAS的检测精度,尤其是在复杂背景和噪声影响下。
-
PBAS特别擅长检测那些难以察觉的小型异常。在一些高分辨率的工业数据集(例如高精度表面缺陷检测)中,PBAS能够成功地识别出传统方法未能发现的细微异常,证明了它在精细化异常检测方面的优势。
-
训练时间与推理时间
:PBAS虽然加入了异常合成和边界优化的步骤,但在工业数据集上的训练时间和推理时间与现有的深度学习方法相当,且在硬件优化方面表现良好。PBAS的训练和推理过程能够在合理的时间内完成,适用于实时异常检测场景。
7. 总结 & 未来工作
本文提出了一种通过渐进边界引导的特征级异常合成策略,旨在增强异常检测,称为PBAS(Progressive Boundary-guided Anomaly Synthesis)。我们的方法通过消除对预定义异常属性的需求,并允许可控的异常合成,解决了现有方法的关键局限性。利用ABL(Anomaly Boundary Learning)建立的超球面边界和AFS(Anomaly Feature Synthesis)合成的人工异常,RBO(Refined Boundary Optimization)通过二分类优化了正常样本与异常样本之间的边界。因此,PBAS显著提升了异常检测与定位的性能。我们在多个工业数据集上评估了该方法,并取得了最先进的性能,证明了PBAS的有效性和高效性。此外,PBAS具有检测微小异常的潜力。由于PBAS旨在通过异常合成和边界优化来捕捉和增强特征空间中的分布差异,我们的主要关注点是定位工业场景中的结构性异常(如表面污渍)。然而,逻辑异常(如误装配的部件)通常需要更高层次的理解,如场景解释,这超出了PBAS当前的范畴。我们尚未充分处理这类异常。未来,我们将探索将语义分析与逻辑异常检测相结合的方案。
本文仅做学术分享,如有侵权,请联系删文。
3D视觉交流群,成立啦!
目前我们已经建立了3D视觉方向多个社群,包括
2D计算机视觉
、
最前沿
、
工业3D视觉
、
SLAM
、
自动驾驶
、
三维重建
、
无人机
等方向,细分群包括:
工业3D视觉
:相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。
SLAM
:视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。
自动驾驶
:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。
三维重建
:3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等
无人机
:四旋翼建模、无人机飞控等
2D计算机视觉
:图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等
最前沿
:具身智能、大模型、Mamba、扩散模型、图像/视频生成等