专栏名称: 深度之眼
入行人工智能,学算法公式,写毕业论文,看经典书籍,刷全球公开课,就来深度之眼
目录
相关文章推荐
南京日报  ·  起猛了!南京好多哪吒…… ·  昨天  
南京日报  ·  起猛了!南京好多哪吒…… ·  昨天  
邳州银杏甲天下  ·  近期高发!邳州人出门请注意→ ·  2 天前  
大众网青岛  ·  恭喜!他们结婚了,网友:多少人的青春回忆! ·  2 天前  
大众网青岛  ·  恭喜!他们结婚了,网友:多少人的青春回忆! ·  2 天前  
51好读  ›  专栏  ›  深度之眼

结合CNN与Transformer,实现遥感图像处理性能巅峰,霸榜顶会顶刊!

深度之眼  · 公众号  ·  · 2025-03-06 18:21

正文

还记得 CNN+Transformer 这个热门组合吗?最近发现它在 遥感图像 领域有不少高质量成果。比如顶刊Nat. Commun.上的GlaViTU 模型,一区IEEE TGRS上的SparseFormer(用于稀疏点标注遥感语义分割)、 LGCNet 模型等。

其实这也是遥感图像领域的发展趋势,这类混合架构通过轻量化设计(如Lite-Mono参数减少80%)和高效注意力机制(如LeWin模块),显著提升任务性能,完美契合工业界需求,研究前景很广阔(论文er可试)。

这方向现下仍处于快速发展期,结合领域特性的创新模型(如针对遥感多模态、高分辨率等特点)比较容易产出高水平论文,感兴趣的同学不妨从 架构轻量化、多模态融合、动态计算 等方向着手研究。

本文整理了 11篇 CNN+Transformer+遥感相关的新论文 ,方便论文er找参考,尽量找的开源的,大家有什么问题欢迎评论区友好交流~

扫码添加小享, 回复“ 结合遥感

免费获取 全部方案+开源代码

图片

TCNet: Multiscale Fusion of Transformer and CNNfor Semantic Segmentation of Remote Sensing Images

方法: 论文提出的 TCNet 是一种将 CNN 和 Transformer 结合用于遥感图像语义分割的创新方法。通过充分利用局部和全局信息,TCNet 在多个数据集上展示了优越的性能,证明了其在遥感图像分割任务中的有效性。

图片

创新点:

  • 介绍了一种名为TCNet的网络,采用并行分支架构,其中Transformer分支用于获取全局上下文,而CNN分支则用于捕获低级空间细节。
  • 提出了一种新颖的融合技术,称为交互自注意力(ISa),用于融合从两个分支中提取的多层次特征。
  • 开发并应用了一种名为窗口自注意力门控(WSaG)的跳跃连接模块,集成到渐进上采样网络(PUN)中。
图片

CMLFormer: CNN and Multiscale Local-Context Transformer Network for Remote Sensing Images Semantic Segmentation

方法: 论文提出了一种新颖的CMLFormer网络架构,结合轻量级CNN和多尺度局部上下文Transformer,用于遥感图像的语义分割,以解决现有方法在全局和局部信息整合上的不足,通过设计多尺度局部上下文变换块(MLTB)和特征增强模块(FEM)来提升分割性能。

图片

创新点:

  • MLTB模块通过结合注意力机制和多尺度策略,在不增加复杂度的情况下有效捕捉局部和全局特征信息。
  • 提出了一种特征增强模块,能够在通道和空间维度上实现全局与局部信息的综合融合。
  • CMLFormer采用了轻量级的ResNet-18作为编码器,并结合了CNN和Transformer的优势。
图片

扫码添加小享, 回复“







请到「今天看啥」查看全文