工源三仟AI Lab联合大连理工大学IIAU-Lab将这一实际产业问题,从幕后推向学术前台,提出了业内首个动力电池检测(PBD)benchmark,携手推进Ai4Industury的发展。
论文地址:
https://arxiv.org/pdf/2312.02528v2.pdf
项目主页:
https://xiaoqi-zhao-dlut.github.io/xray_pbd_cvpr2024/Github
仓库:
https://github.com/Xiaoqi-Zhao-DLUT/X-ray-PBD
01 研究价值(应用)
图中展示了新能源汽车动力电池组装工艺。动力电池经历了从电芯单元到搭载整车系统的全过程。为保证动力电池的安全,需要对每个电芯进行动力电池检测(PBD),完成其功能性评估。
02 任务定义
动力电池检测(PBD)旨在根据极片数量和悬垂量来判断电芯的OK/NG。因此,目标计数和定位是PBD的必要处理,它可以为所有阳极和阴极端点提供准确的坐标信息。
03 研究价值、挑战(学术)
-
开放的视觉建模问题。
与character stroke extraction、insubstantial object detection、open vocabulary objects detection and segmentation等新兴任务一样,如何将实际问题建模为视觉领域的学术问题,从而给出基于AI的解决方案,是对于 PBD 任务来说最为重要的。
-
极小目标定位问题
。通常一幅X-ray/CT的锂电池图像具有1024 x 1024以上的分辨率,甚至超过4K级别的多电池组图。极片端点的定位需要网络模型从百万pixel中找寻实例级的1 pixel感兴趣目标(1/X,000,000+)。
-
弱小特征感知问题
。由于机器设备固有的噪声干扰、X-ray无法与彩色RGB一样具有语义线索、极片外观多样性等复杂因素的叠加,进一步加剧了单像素点的极片感知难度。
04 数据集介绍
X-ray PBD 数据集的统计。(a) 干扰和拍摄的分类。(b) 悬垂分布。(c) 数量分布。(d) 属性的数据分布。(e) 属性之间的多重依赖性。
本文所提出的X-ray PBD数据集是从同一产品型号的DR设备捕获的5个制造商的数千个动力电池单元中收集的,涵盖近景、中景和远景。根据外观和干扰类型分为2类,8个属性。本文首先将最初收集的4000多张X射线电池图像交给六位专业电池厂技术人员进行质量筛选。通过仔细观察,重复、空白和严重缺陷(即无效)图像被消除,获得了约 2,000 张电池图像。然后,六名技术人员使用标注软件分别对 2000 张图像进行注释。注释信息包括所有阳极板和阴极板的终点坐标以及板的数量。为了避免人为判断错误,六名技术人员共同评估所有六组标记数据,并选择标记信息一致的示例。最终,获得了1500张高质量的动力电池图像。
属性样本实例。存在来源于图像质量、外部设备、极片外观的多种干扰。
05 解决方案(MDCNet)
-
分割问题建模。
将点定位问题转化为Segmentation 问题。
-
多维协同思想
。通过点、线、数量三个维度上的线索,基于multi-task l协同互补学习,增强point的预测效果。
-
提示滤波器。
基于prompt learning的思想,依靠无干扰的纯净极片作为提示信息,生成动态滤波器以过滤背景干扰信息。
-
自适应监督真值生成策略。
依靠极片之间的间距,自适应的生成大小合适的point mask供MDCNet网络训练。
业内首个综合性评估指标
在新能源产业界往往只关注于粗糙的漏检率和误报率。从学术严谨性,本文提出了从数量、阴阳极、overhang的位置误差(MAE)和准确性(Acc)的8个综合性互补指标。
积极地行业内推行!
与其他潜在的解决方案比较
从定性和定量评估,本文提出的解决方案都遥遥领先!
06 未来工作&即将发布
-
How to better model PBD is still an open problem. (在difficult/tough场景仍有提升空间)
-
Semi/self-supervised and few-shot learning techniques.
-
Extend the PBD dataset to a 3D form with the help of CT device, which can provide richer internal slices information.
Ai4Industury-Image Blind Enhancement.
Ai4Industury-CT Reconstruction.
Ai4Industury-Multimodal Unified Model.
Ai4Industury-GPT.
总结
2024 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2024)将于2024年6月17日至21日在美国西雅图举行。CVPR是计算机视觉领域的顶级国际会议,CCF A类会议。本文研究成果在近几年中已成功应用并交付于众多的新能源锂电池头部产商,本次被CVPR录用,标志着工源三仟在动力电池检测技术方面的行业绝对领先地位!
公众号后台回复“
数据集