一句话总结:本文介绍了一个名为 Swift Hydra 的新框架,用于训练一种基于生成式 AI 和强化学习的反常检测方法。
0. 论文信息
标题:Swift Hydra: Self-Reinforcing Generative Framework for Anomaly Detection with Multiple Mamba Models
原文链接:https://openreview.net/pdf?id=P7t2niLbvw
1. 导读
尽管多年来开发了大量异常检测模型,但它们对未见过的异常进行泛化的能力仍然是一个问题,尤其是在关键系统中。本文旨在通过引入Swift Hydra来解决这一挑战,Swift Hydra是一个基于生成式人工智能和强化学习(RL)训练异常检测方法的新框架。通过使用RL策略操作生成模型的潜在变量,该框架合成新颖和多样化的异常样本,这些样本能够绕过检测模型。这些生成的合成样本反过来用于增强检测模型,进一步提高其处理具有挑战性的异常的能力。Swift Hydra还集成了Mamba模型,其结构为专家混合(MoE),可以根据数据复杂性调整Mamba专家的数量,有效地捕捉各种特征分布,而不会增加模型的推理时间。在ADBench基准上的实证评估表明,Swift Hydra在保持相对较短的推理时间的同时,比其他最先进的异常检测模型表现更佳。从这些结果中,我们的研究强调了将RL和生成式人工智能相结合以推进异常检测的新颖和有利范式。
2. 主要贡献
我们引入了一个新的系统框架,即Swift Hydra,用于训练基于合成异常(由RL引导的C-VAE模型战略性地生成)的异常检测模型。通过Mamba专家混合,提高了检测模型的效率,从而在保持较短推理时间的同时实现了高检测准确性。
·我们建立了一个定理,表明RL代理可以在隐空间上进行梯度下降,以在早期训练期产生可行的动作。我们还提出了一种新的MoE训练方案,解决了“赢家通吃”问题(Fedus等人【2022】)。
推荐课程:
工业视觉检测如何检测低对比度缺陷?
在ADBench上进行了全面的实验,该基准包括来自各个领域的57个数据集。以展示我们的模型在检测准确性和推理效率方面的出色表现。结果表明,RL和生成式AI共同激发了推进异常检测的一种新的、有前途的范式。
3. 方法
Swift Hydra框架包含两个主要模块:自我强化生成模块和推理模块。首先,自我强化生成模块使用RL训练生成模型,以合成多样且具有挑战性的异常。这些生成的样本随后被附加到原始数据集D中。其次,从该新数据集开始,推理模块使用专家混合(MoE)技术训练一个高效的检测器,其中包括多个轻量级Mamba模型的组合,这些模型专门用于不同的数据簇,以及一个门控网络,用于将每个数据点引导到顶级k专家进行协作预测。
4. 实验结果
AUC-ROC评估
。如表1所示,平均AUC-ROC分数表明,SwiftHydra的两个版本--单个大型检测器和MoME--在各种训练大小(即整个数据集的40%、30%、20%和10%)上都优于其他最先进(SOTA)方法。值得注意的是,在仅使用10%的数据集时,SwiftHydra在半监督设置中优于DTE,在无监督设置中优于Rejex。这表明我们的RL算法可以训练一个生成模型来合成有效的异常,这些异常可以随后用于训练一个高性能的检测模型。
推理时间评估
。在57个数据集的总推理时间方面,表格显示Rejex的时间最短,这是意料之中的,因为它依赖于传统的懒惰学习方法,如孤立森林。基于扩散模型的DTE只需要几个步骤就可以重建反向并确定样本是否异常,从而产生相对较短的推理时间。虽然ADGym为每个数据集选择了最佳的ML模型,但实验表明,与SwiftHydra(MoME)相比,其总体预测时间仍然相对较高。Swift Hydra(Single)实现了较高的 AUC-ROC分数;然而,其预测时间显著较长,因为一个大型模型被设计用于捕捉由自我强化生成模块生成的整个多样化数据集。相比之下,Swift Hydra(MoME)不仅获得了最佳的 AUC-ROC分数,而且在训练规模为40%和30% 的情况下,其预测时间效率与 DTE相当。总体而言,在测试方法中,SwiftHydra(MOME)在 AUC-ROC性能和推理时间之间提供了最佳平衡。
生成数据分布
。我们在图2中可视化了我们自增强生成模块随时间产生的数据的分布。最初,模型探索了广泛分散的异常数据点的大范围。随着剧集的进展,出现了一个明显的模式:生成的异常点越来越集中在正常数据与异常数据之间的边界上。实际上,边界上的过渡区域突显了那些不易与普通数据点区分的异常。因此,这种动态进展表明,我们的生成方法显著丰富了异常数据点的多样性,同时推动了最具挑战性的异常,从而增强了检测器的泛化能力。
图3显示了我们的方法与其他过采样方法的生成数据分布的比较分析。可以看出,像SMOTE、Borderline-SMOTE、SVM-SMOTE、ADASYN和CBO等方法只能牛成训练集中异常数据边界内的数据点,而我们的方法允许生成超出这些边界的数据点。这使得我们的方法有可能生成能够覆盖测试集分布的异常数据点。虽然VAE-Geometry和OversamplingGAN也探索了超出边界的情况,但我们的方法在生成异常数据点时具有更大的灵活性。
5. 总结
我们提出Swift Hydra框架,旨在增强生成模型综合异常的能力,以增强异常检测模型该框架具有RL代理,用于指导C-VAE模型的训练,该模型生成多样化和具有挑战性的异常。我们还提出了一种机制,以帮助RL代理在训练过程中更有效地选择动作。此外由于生成数据集的多样性,我们引入了Mamba专家混合体来训练高效的异常检测器’其中每个专家专门捕捉特定数据簇。因此,我们的模型展示了强大的泛化能力和快速的推理能力,这在ADBench基准上与最先进异常检测型的实验中得到了证明。我们的研究强调了将强化学习和生成式人工智能整合以促进异常检测的有前途的范式。它可以在收集真实数据昂贵和稀缺的其他应用上下文中用于生成和合成数据。
对更多实验结果和文章细节感兴趣的读者,可以阅读一下论文原文~
本文仅做学术分享,如有侵权,请联系删文。
3D视觉交流群,成立啦!
目前我们已经建立了3D视觉方向多个社群,包括
2D计算机视觉
、
最前沿
、
工业3D视觉
、
SLAM
、
自动驾驶
、
三维重建
、
无人机
等方向,细分群包括:
工业3D视觉
:相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。
SLAM
:视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。
自动驾驶
:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。
三维重建
:3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等
无人机
:四旋翼建模、无人机飞控等
2D计算机视觉
:图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等
最前沿
:具身智能、大模型、Mamba、扩散模型、图像/视频生成等
除了这些,还有
求职
、
硬件选型
、
视觉产品落地、产品、行业新闻
等交流群
添加小助理: cv3d001,备注:
研究方向+学校/公司+昵称
(如
3D点云+清华+小草莓
), 拉你入群。
▲长按扫码添加助理:cv3d001
3D视觉工坊知识星球
「3D视觉从入门到精通」知识星球
(
点开有惊喜
)
,已沉淀6年,星球内资料包括:
秘制视频课程近20门
(包括
结构光三维重建、相机标定、SLAM、深度估计、3D目标检测、3DGS顶会带读课程、三维点云