还记得
CNN+Transformer
这个热门组合吗?最近发现它在
遥感图像
领域有不少高质量成果。比如顶刊Nat. Commun.上的GlaViTU 模型,一区IEEE TGRS上的SparseFormer(用于稀疏点标注遥感语义分割)、 LGCNet 模型等。
其实这也是遥感图像领域的发展趋势,这类混合架构通过轻量化设计(如Lite-Mono参数减少80%)和高效注意力机制(如LeWin模块),显著提升任务性能,完美契合工业界需求,研究前景很广阔(论文er可试)。
这方向现下仍处于快速发展期,结合领域特性的创新模型(如针对遥感多模态、高分辨率等特点)比较容易产出高水平论文,感兴趣的同学不妨从
架构轻量化、多模态融合、动态计算
等方向着手研究。
本文整理了
11篇
CNN+Transformer+遥感相关的新论文
,方便论文er找参考,尽量找的开源的,大家有什么问题欢迎评论区友好交流~
扫码添加小享,
回复“
结合遥感
”
免费获取
全部方案+开源代码
TCNet: Multiscale Fusion of Transformer and CNNfor Semantic Segmentation of Remote Sensing Images
方法:
论文提出的 TCNet 是一种将 CNN 和 Transformer 结合用于遥感图像语义分割的创新方法。通过充分利用局部和全局信息,TCNet 在多个数据集上展示了优越的性能,证明了其在遥感图像分割任务中的有效性。
创新点:
-
介绍了一种名为TCNet的网络,采用并行分支架构,其中Transformer分支用于获取全局上下文,而CNN分支则用于捕获低级空间细节。
-
提出了一种新颖的融合技术,称为交互自注意力(ISa),用于融合从两个分支中提取的多层次特征。
-
开发并应用了一种名为窗口自注意力门控(WSaG)的跳跃连接模块,集成到渐进上采样网络(PUN)中。
CMLFormer: CNN and Multiscale Local-Context Transformer Network for Remote Sensing Images Semantic Segmentation
方法:
论文提出了一种新颖的CMLFormer网络架构,结合轻量级CNN和多尺度局部上下文Transformer,用于遥感图像的语义分割,以解决现有方法在全局和局部信息整合上的不足,通过设计多尺度局部上下文变换块(MLTB)和特征增强模块(FEM)来提升分割性能。
创新点:
-
MLTB模块通过结合注意力机制和多尺度策略,在不增加复杂度的情况下有效捕捉局部和全局特征信息。
-
提出了一种特征增强模块,能够在通道和空间维度上实现全局与局部信息的综合融合。
-
CMLFormer采用了轻量级的ResNet-18作为编码器,并结合了CNN和Transformer的优势。
扫码添加小享,
回复“