这两种模型在合成图像时,都大量使用上采样和卷积,而这两个操作在数值计算上相当于对像素值加权平均,会让合成图像相邻像素的局部相关性变强,留下独特的 “伪影特征”,这就是 AI 图像检测的关键线索。
检测方法 “跑偏”:错在训练策略
想象一下,你要在一堆真假难辨的画作里找出赝品,如果用来鉴定的方法本身就有缺陷,那肯定很难完成任务。
现有的 AI 图像检测方法,就面临着这样的困境。
当前的 AI 图像检测方法大多将重点放在挖掘真实图像与 AI 图像之间的通用差异,,也就是“通用伪影特征”,却忽略了训练过程中的关键问题。
研究团队发现,当前的训练模式存在两大问题。
第一个问题是“弱化的伪影特征”。
AI 图像在生成过程中,由于使用了上采样和卷积等操作,图像像素之间的联系变得更加紧密,从而留下了可供检测的痕迹。然而,许多检测方法在对图像进行预处理时,常常采用下采样操作来统一图像尺寸,这一操作会“抹除”那些细微的痕迹,大大增加了检测的难度。
第二个问题是“过拟合的伪影特征”。
现有的检测方法在训练时,数据增强方式较为单一,比如仅仅进行水平翻转操作。这就使得模型过度适应了训练数据中的特定特征,出现过拟合现象。一旦遇到未曾见过的 AI 图像,模型就无法准确识别,泛化性能较差。
简单图像变换:有效去偏
为了解决这些问题,研究团队提出了 SAFE,它凭借三种简单的图像变换直击难题。
第一是痕迹保留(Artifact Preservation)。
SAFE 在图像预处理阶段,舍弃了传统的下采样(Resize)操作,改为采用裁剪(Crop)操作。在训练过程中进行随机裁剪(RandomCrop),测试时则使用中心裁剪(CenterCrop)。这样一来,AI 图像中的细节以及像素之间的微妙联系得以保留,方便检测器发现那些细微的“破绽”,显著提升了捕捉 AI 伪影的能力。