专栏名称: 我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net 微博:计算机视觉与机器学习,QQ群:928997753,52CV君个人账号:Your-Word。
目录
相关文章推荐
手游那点事  ·  春节期间,10家游戏公司宣布了裁员 ·  3 天前  
手游那点事  ·  今天,率土团队单机新作公开Steam页面 ·  3 天前  
手游那点事  ·  又是腾讯?一款收入超10亿美金的二游出现了 ·  5 天前  
51好读  ›  专栏  ›  我爱计算机视觉

业界最大!腾讯优图发布Real-IAD大规模工业异常检测数据集!

我爱计算机视觉  · 公众号  ·  · 2024-10-30 18:16

正文




关注公众号,发现CV技术之美




本文已被CVPR2024收录
(上海交通大学,腾讯优图,复旦大学,荣旗工业科技, 上海计算机软件技术开发中心)

Title :Real-IAD: A Real-World Multi-View Dataset for Benchmarking Versatile Industrial Anomaly Detection

Project Page https://realiad4ad.github.io/Real-IAD/

动机:为什么构建Large-scale Real-world Real-IAD数据集

  • 一方面,大多数最先进的方法在MVTec / VisA等主流数据集上已经达到饱和(AUROC超过99%),无法很好地区分方法之间的差异,且由于难度较小而与实际应用场景之间存在较大差距, 因此需要更具挑战性的数据集来支持AD领域的进一步研究

  • 另一方面,各种新的实用异常检测设置的研究受到数据集规模的限制(比如带噪和小样本更贴近实际应用的setting),存在评估结果过拟合的风险,因此 需要更大规模的数据集 来支持;
  • 工业生产中的良率通常介于60%-100%之间,与现有的100%良率实验setting不符,因此, 需要更具实际应用价值的setting,即我们提出的Fully Unsupervised Industrial Anomaly Detection,FUIAD

Real-IAD数据集特性:
  • 更多的类别:30类真实产线物料

  • 大规模数据量:150K数据

  • 多种材料:金属,塑料,木材,陶瓷和混合材料

  • 多种缺陷类别:缺失、划伤、裂纹、脏污、破洞、变形、凹坑、破损

  • 多视角:5个拍摄角度(顶拍+4个侧拍)

  • 更高的分辨率:2K~5K

  • 支持多种实验设置:1)FUIAD;2)多视角AD;3)无监督AD;4)Zero-/Few-shot AD;5)带噪AD等

与主流的2D异常检测数据集规模及属性对比如下表

5个视角的采集效果图示例,包含两种典型异常场景:

1)缺陷可以在一个sample中的每个view都可见

2)缺陷仅在一个sample中部分view上可见

这更具有实际意义和更大的挑战性,将AD推向实际应用迈出了新的一步!


本文贡献

  • 提出了一个新的Real-IAD数据集,它比现有的主流数据集大十倍以上。它包括30类对象,每类对象包含5个拍摄角度,共计150K高分辨率图像。Real-IAD具有更大的缺陷面积和缺陷比例范围,能够更好地区分不同方法的性能,满足IAD的各种研究设置。

  • 基于Real-IAD数据集构建了一个更接近实际应用场景的FUIAD(Fully Unsupervised Industry Anomaly Detection)设置,其中仅使用大多数生产线的成品率大于60%的自然存在约束,而不引入额外的手动注释。

  • 我们报告了常用的IAD方法在Real-IAD数据集上在几种设置下的性能,并提供了一个极具挑战性的基准,以促进异常检测领域的发展。

拆解 Real-IAD 数据收集的具体过程,如下图所示:

  • 物料准备及缺陷产品构建

  • 材料:包含金属,塑料,木材,陶瓷和混合材料

  • 缺陷类型:包含缺失、划伤、裂纹、脏污、破洞、变形、凹坑、破损共8种

  • 原型采集设备准备:包含1个顶拍相机加4个侧拍相机

  • 工业级数据收集、标注、清洗过程:

使用3个基于HRNet-32w主干网络的Cascade RCNN进行检测、交叉验证,直到检测结果偏差小于预定条件(AP基本不变,修改标注的图片数/instance足够小)

Real-IAD数据统计分析:


更多的 数据信息 下载方式 Benchmark 结果 可移步项目主页:

Project Page: https://realiad4ad.github.io/Real-IAD/


基于该数据集的已有开源方法推荐:

AD Benchmark: https://github.com/zhangzjn/ader
MambaAD[NeurIPS'24]: https://github.com/lewandofskee/MambaAD

Dinomaly: https://github.com/guojiajeremy/Dinomaly



往期精彩回顾

1024特辑 | 我们采访了一群程序员,他们说
PRCV2024大会正式召开,腾讯优图携前沿科技成果亮相现场






请到「今天看啥」查看全文