专栏名称: 3D视觉工坊
1、OpenCV的技术传播; 2、3D点云与重建技术; 3、Vslam技术; 4、深度学习; 5、技术干货分享。
51好读  ›  专栏  ›  3D视觉工坊

厦大新作RAAD:全面增强工业异常检测!

3D视觉工坊  · 公众号  ·  · 2024-12-27 07:00

正文

点击下方 卡片 ,关注 「3D视觉工坊」 公众号
选择 星标 ,干货第一时间送达

来源:3D视觉工坊

添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。

扫描下方二维码,加入 「3D视觉从入门到精通」知识星球 ( 点开有惊喜 ) ,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料: 近20门秘制视频课程 最新顶会论文 、计算机视觉书籍 优质3D视觉算法源码 等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!

0. 论文信息

标题:Breaking the Bias: Recalibrating the Attention of Industrial Anomaly Detection

作者:Xin Chen, Liujuan Cao, Shengchuan Zhang, Xiewu Zheng, Yan Zhang

机构:Xiamen University

原文链接:https://arxiv.org/abs/2412.08189

1. 导读

由于缺陷样本的稀缺性和不可预测性,工业异常检测主要采用无监督学习。然而,所有无监督的IAD方法都面临一个共同的挑战:正常样本中的固有偏差,这导致模型专注于可变区域,而忽略了不变区域中的潜在缺陷。为了有效地克服这一点,有必要分解和重新校准注意力,引导模型抑制不相关的变化,并专注于微妙的、易受缺陷影响的领域。在本文中,我们提出重新校准工业异常检测的注意(RAAD),一个系统地分解和重新校准注意图的框架。RAAD采用了两个阶段的过程:首先,它通过量化减少注意力偏差,其次,它微调容易出现缺陷的区域以提高灵敏度。该框架的核心是分级量化评分(HQS),它根据异常检测贡献在各层之间动态分配位宽。HQS根据注意力图的层次性质动态调整位宽,压缩产生粗糙和嘈杂注意力的较低层,同时保留具有更清晰、专注于缺陷的注意力的较深层。这种方法优化了计算效率和模型对异常的敏感性。我们使用单个3090ti在32个数据集上验证了RAAD的有效性。实验表明,RAAD平衡了模型的复杂性和表达能力,增强了异常检测能力。

2. 引言

工业异常检测(IAD)对于保持制造过程的质量和安全至关重要。由于标注成本高且缺陷具有不可预测性,无监督方法已成为现实世界异常检测的实际解决方案,该方法仅使用正常样本进行训练。然而,传统的无监督方法面临一个根本性挑战:在训练过程中,模型往往会对正常样本中变化的部分过度拟合,而忽略未变化区域中潜在的缺陷。如图1所示,我们通过MVTec-AD和MVTec LOCO数据集上的异常热图来直观展示这一挑战。在每个组内,从左到右分别是对应类别的正常样本、正常样本的平均异常热图和异常样本的平均异常热图。热图中的亮区表示更可能受到关注的区域。第二列中的白色框突出显示了模型如何被正常样本的固有偏差所误导。换句话说,从无监督训练中得出的注意力图倾向于突出正常样本中的可变区域,从而忽略了可能存在细微异常的恒定区域。人们可能会直观地考虑放弃注意力机制。然而,完全忽略注意力图并不是一个可行的解决方案,因为它们在异常检测中发挥着至关重要的作用。一个关键问题由此产生:如何让模型更合理地分配注意力?

一个可行的解决方案是分两步来解决这个问题:首先,引导模型的注意力集中在主要目标上,然后重新分配注意力以提高异常检测的效果。前者可以通过模型量化来实现,而后者则通过微调来完成。在量化过程中,参数精度的降低迫使模型优先学习和提取最关键的信息。同时,在微调过程中,模型的注意力被重新校准,使得注意力的重新分配能够更好地符合特定任务的要求。基于这一见解,我们提出了RAAD(工业异常检测注意力再校准,Recalibrating Attention of Industrial Anomaly Detection),该方法首先通过量化修改注意力图,然后通过微调对其进行再校准。同时,我们观察到卷积神经网络通常被用作工业异常检测任务中提取图像特征的主干网络,每一层对模型注意力的影响各不相同。为了优化注意力分配过程,我们引入了分层量化评分(HQS),它根据每一层的异常检测能力自适应地分配位宽。在图2(a)中,我们可视化了模型量化前后的异常热图。可以观察到,与量化前相比,模型的注意力更加分散在主要目标上,而忽略了背景。随后,经过微调后实现了更精确的异常检测。图2(b)展示了教师-学生网络中每个卷积层的输出,强调了图像中焦点逐层变化的差异。这种设计利用了网络层的不同作用:浅层捕捉局部细节,而深层提取全局特征,这对于以更少的参数增强模型性能最有利。 推荐课程: 工业视觉检测如何检测低对比度缺陷?

3. 主要贡献

我们的主要贡献如下:

• 我们打破了无监督IAD中注意力分配的固有偏差,引导模型更好地检测恒定区域中的细微异常。

• 我们提出了RAAD,该方法通过量化减少偏差,并通过微调重新校准注意力图以提高异常敏感性,从而系统地改进了注意力图。

• 我们引入了分层量化评分(HQS)模块,该模块根据每一层的异常检测能力动态分配位宽,优化量化与注意力之间的对齐,从而在IAD中提高效率和准确性。

4. 方法

我们的模型由一个教师-学生模型和自编码器组成,如图3所示。RAAD过程分为三个步骤:1. 模型初始化:模型仅在包含正常图像的数据集上进行训练。在训练过程中,仅更新学生模型和自编码器的权重。2. 分层量化评分:我们首先评估网络中每一层的异常检测能力。然后对模型进行逐层量化。3. 维数增加:类似于第一步,我们对学生模型和自编码器进行微调。

5. 实验结果

我们选择EfficientAD的架构作为评估我们方法的基准。EfficientAD是一种利用轻量级特征提取器的无监督工业异常检测(IAD)方法,实现了低误报率和高计算效率。我们认为,精度与速度之间的权衡是未来工业异常检测发展的方向。值得注意的是,EfficientAD尚未公开其代码,因此我们复现了他们的方法,并在表1中将其称为“基线†”。为了证明我们的区域注意力自适应异常检测(RAAD)方法在模型异常检测性能上的提升,我们在三个工业异常检测数据集上的32个数据集上进行了大量实验。我们将各种训练后量化方法应用于原始框架进行对比,所有量化方法都进行了最大量化,即将权重和激活都量化到8位,确保位宽大于或等于RAAD量化所使用的位宽。如表1所示,RAAD在MVTec AD、MVTec LOCO和VisA上分别实现了98.8、89.75和96.13的平均检测AU-ROC分数。RAAD始终优于基线方法,强调了其在图像级异常检测和像素级异常定位方面的有效性。这证明了该框架对多样异常特征的适应性。

此外,我们还使用各种评估指标在多个数据集上将RAAD与几种竞争方法进行了比较,如表2所示。我们将RAAD与PatchCore、GCAD和SimpleNet]进行了比较。除了EfficientAD外,其他方法的结果均来自“附带代码的论文”。RAAD在这三个数据集上的平均检测AU-ROC分数为95.12,比其他方法分别高出5.37、7.95、6.75和2.97,表现出最佳的总体异常检测性能,证明了RAAD在图像级检测和像素级异常定位方面均达到了强大水平。

6. 总结

无监督IAD方法通常存在正常样本的内在偏差,导致注意力错位。这种偏差使模型关注可变区域,而忽略了不变区域中潜在的缺陷。为了应对这一问题,我们提出了RAAD(工业异常检测注意力重校准),这是一种通过两阶段量化过程分解和重校准注意力图的综合框架。通过采用分层量化评分(HQS)机制,RAAD可以最优地重新分配计算资源,以增强对缺陷的敏感性。定性和定量实验表明,我们的方法能够合理分配模型注意力,打破无监督IAD的偏差,实现有效的注意力重新分配。

对更多实验结果和文章细节感兴趣的读者,可以阅读一下论文原文~

本文仅做学术分享,如有侵权,请联系删文。

3D视觉交流群,成立啦!

目前我们已经建立了3D视觉方向多个社群,包括 2D计算机视觉 最前沿 工业3D视觉 SLAM 自动驾驶 三维重建 无人机 等方向,细分群包括:

工业3D视觉 :相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM :视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

自动驾驶 :深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

三维重建 :3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

无人机 :四旋翼建模、无人机飞控等

2D计算机视觉 :图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

最前沿 :具身智能、大模型、Mamba、扩散模型、图像/视频生成等

除了这些,还有 求职 硬件选型 视觉产品落地、产品、行业新闻 等交流群

添加小助理: cv3d001,备注: 研究方向+学校/公司+昵称 (如 3D点云+清华+小草莓 ), 拉你入群。

▲长按扫码添加助理:cv3d001

3D视觉工坊知识星球

「3D视觉从入门到精通」知识星球







请到「今天看啥」查看全文