本文先从遥感图像场景分类的研究背景和意义出发,介绍了随着遥感技术发展,对图像信息智能提取技术要求提高,引出场景分类的重要性。由于深度学习在场景分类中应用广泛且成果显著,因而对基于深度学习的场景分类方法进行重点研究。
按照模型架构和原理的不同,本文将深度学习分类方法细分为基于手工特征提取的分类模型、基于卷积神经网络的分类模型、基于ViT的分类模型、基于生成对抗网络的分类模型以及基于遥感基础模型的方法。基于手工特征提取的方法依赖手工特征描述算子,虽简单有效,但在复杂场景下存在局限性。而卷积神经网络因其强大的特征提取能力在场景分类中得到广泛应用,包括作为特征提取器、端到端的分类以及引入注意力机制等多种应用方式。
Vision Transformer引入后为场景分类提供了新框架,它能直接考虑图像上下文信息,但也存在一些缺陷,研究人员通过改进和与其他框架结合来提升性能。生成对抗网络则主要用于数据增广和跨域分类,不过目前其分类性能相较于基于CNN的方法还有提升空间。遥感基础模型从大规模数据集中学习特征表示,为场景分类带来新热点,基于此的场景分类方法往往能取得更优结果。
表1
部分遥感图像场景分类深度学习方法的公开代码汇总