专栏名称: 深度之眼

入行人工智能，学算法公式，写毕业论文，看经典书籍，刷全球公开课，就来深度之眼

结合CNN与Transformer，实现遥感图像处理性能巅峰，霸榜顶会顶刊！

深度之眼 · 公众号 · · 2025-03-06 18:21

正文

还记得 CNN+Transformer 这个热门组合吗？最近发现它在 遥感图像 领域有不少高质量成果。比如顶刊Nat. Commun.上的GlaViTU 模型，一区IEEE TGRS上的SparseFormer（用于稀疏点标注遥感语义分割）、 LGCNet 模型等。

其实这也是遥感图像领域的发展趋势，这类混合架构通过轻量化设计（如Lite-Mono参数减少80%）和高效注意力机制（如LeWin模块），显著提升任务性能，完美契合工业界需求，研究前景很广阔（论文er可试）。

这方向现下仍处于快速发展期，结合领域特性的创新模型（如针对遥感多模态、高分辨率等特点）比较容易产出高水平论文，感兴趣的同学不妨从 架构轻量化、多模态融合、动态计算 等方向着手研究。

本文整理了 11篇 CNN+Transformer+遥感相关的新论文 ，方便论文er找参考，尽量找的开源的，大家有什么问题欢迎评论区友好交流~

扫码添加小享， 回复“ 结合遥感 ”

免费获取 全部方案+开源代码

TCNet: Multiscale Fusion of Transformer and CNNfor Semantic Segmentation of Remote Sensing Images

方法： 论文提出的 TCNet 是一种将 CNN 和 Transformer 结合用于遥感图像语义分割的创新方法。通过充分利用局部和全局信息，TCNet 在多个数据集上展示了优越的性能，证明了其在遥感图像分割任务中的有效性。

创新点：

介绍了一种名为TCNet的网络，采用并行分支架构，其中Transformer分支用于获取全局上下文，而CNN分支则用于捕获低级空间细节。
提出了一种新颖的融合技术，称为交互自注意力（ISa），用于融合从两个分支中提取的多层次特征。
开发并应用了一种名为窗口自注意力门控（WSaG）的跳跃连接模块，集成到渐进上采样网络（PUN）中。

CMLFormer: CNN and Multiscale Local-Context Transformer Network for Remote Sensing Images Semantic Segmentation

方法： 论文提出了一种新颖的CMLFormer网络架构，结合轻量级CNN和多尺度局部上下文Transformer，用于遥感图像的语义分割，以解决现有方法在全局和局部信息整合上的不足，通过设计多尺度局部上下文变换块（MLTB）和特征增强模块（FEM）来提升分割性能。

创新点：

MLTB模块通过结合注意力机制和多尺度策略，在不增加复杂度的情况下有效捕捉局部和全局特征信息。
提出了一种特征增强模块，能够在通道和空间维度上实现全局与局部信息的综合融合。
CMLFormer采用了轻量级的ResNet-18作为编码器，并结合了CNN和Transformer的优势。

扫码添加小享， 回复“

请到「今天看啥」查看全文

推荐文章

南京日报 · 起猛了！南京好多哪吒……

昨天

南京日报 · 起猛了！南京好多哪吒……

昨天

南京零距离 · 8盒蓝莓总共才46颗！直播间蓝莓严重“缩水”……

2 天前

南京零距离 · 8盒蓝莓总共才46颗！直播间蓝莓严重“缩水”……

2 天前

江西晨报 · “不得侮辱、谩骂运动员教练员”，中国乒协发声→

2 天前

江西晨报 · “不得侮辱、谩骂运动员教练员”，中国乒协发声→

2 天前

邳州银杏甲天下 · 近期高发！邳州人出门请注意→

2 天前

大众网青岛 · 恭喜！他们结婚了，网友：多少人的青春回忆！

2 天前

大众网青岛 · 恭喜！他们结婚了，网友：多少人的青春回忆！

2 天前

健康时尚百科 · 你相信？一把椅子就能改变一个人吗？

8 年前

知心 · 做简单的人，过简单的生活

7 年前

央视网体育 · 还是靠罗本!95分钟一条龙绝杀这是33岁的身体?

7 年前

观海解局 · 声称“尽量不用战争”，这名少将咋回事？

7 年前

供应链金融 · 交易银行转型：一条综合化、国际化相结合的发展之路

7 年前