专栏名称: 学姐带你玩AI
这里有人工智能前沿信息、算法技术交流、机器学习/深度学习经验分享、AI大赛解析、大厂大咖算法面试分享、人工智能论文技巧、AI环境工具库教程等……学姐带你玩转AI!
目录
相关文章推荐
艾儿天空  ·  2月第3周起点月票榜:《Z时代艺术家》中断《 ... ·  18 小时前  
艾儿天空  ·  2025第8周:娘子护驾、大汉有活爹、恶龙等 ... ·  18 小时前  
古典文献学微刊  ·  编辑·手记 | ... ·  3 天前  
51好读  ›  专栏  ›  学姐带你玩AI

即插即用Mamba模块全新突破!无缝集成,无痛涨点

学姐带你玩AI  · 公众号  ·  · 2024-05-03 18:17

正文

Mamba入局图像复原了!基于Mamba的图像复原基准模型MambaIR性能超越SwinIR,达成新SOTA!

MambaIR是一种引入通道注意力和局部增强的即插即用Mamba模块。这类高效、创新的模块 在写论文时可以帮助我们简化模型的构建过程 ,通过将这些模块集成到现有的网络架构中,我们可以 轻松提高模型的性能。

除此之外, 即插即用Mamba模块还可以通过降低计算复杂度,提高模型的计算效率 ,尤其是在处理长序列和大规模数据时。比如零参数、即插即用的方法Zigzag Mamba,无需额外参数调整,速度和内存利用率显著提升。

为方便大家理解和运用,本次分享 2024最新的即插即用Mamba模块 。这些模块的来源文章以及代码我都整理了,并简单罗列了创新点,更详细的工作细节建议各位仔细阅读原文。

扫码 添加小享,回复“ 即插即用新
免费获取 全部 文+开源代码

MambaIR: A Simple Baseline for Image Restoration with State-Space Model

方法: 论文介绍了一种名为MambaIR的基于Mamba模型的图像恢复方法,是引入通道注意力和局部增强的即插即用Mamba模块,用于解决现有恢复网络在全局感知范围和计算效率之间的平衡困境。

创新点:

  • 作者的首要创新贡献是将Transformer应用于图像恢复任务,以解决CNN方法在全局依赖建模方面的挑战。
  • 作者提出了一种名为Mamba的高效状态空间模型,用于图像恢复,并通过引入局部增强和通道注意力来改善模型的性能。
  • 作者设计了一种新的残差状态空间块结构,用于Mamba-based图像恢复网络,以更好地模拟全局依赖关系。

MambaTab: A Simple Yet Effective Approach for Handling Tabular Data

方法: 论文介绍了一种针对表格数据的轻量级学习模型MambaTab。MambaTab基于结构化状态空间模型(SSM)开发,通过高效地提取具有长期依赖性的有效表示来改进性能。

MambaTab具有高效性、可扩展性、普适性和预测性能,是一种轻量级的、即插即用的解决方案,可广泛应用于各种表格数据,为实际应用提供了更多可能性。

创新点:

  • 极小的模型大小和学习参数数量:与现有的基线模型相比,MambaTab在表现上具有明显的优势,同时模型大小和学习参数数量都显著减少,这意味着它在数据处理和资源需求方面更具可扩展性和可访问性。
  • 引入了Mamba模块和层归一化技术:Mamba模块是一种新型的SSM变体,能够有效地从具有长程依赖关系的数据中提取有意义的表示。与此同时,层归一化技术被应用于嵌入表示中,进一步提升了MambaTab模型的性能。

扫码 添加小享,回复“ 即插即用新
免费获取 全部 文+开源代码

ZigMa: A DiT-style Zigzag Mamba Diffusion Model

方法: 论文提出了一种简单的、即插即用、零参数的方法,名为Zigzag Mamba,它优于基于Mamba的基线,并且相对于基于变压器的基线表现出更好的速度和内存利用率。通过将交叉注意力机制纳入Mamba模块中,该方法还可以促进文本到图像的生成。

创新点:

  • 提出了一种名为Zigzag Mamba的新的扩散模型,该模型通过使用空间连续的Zigzag扫描路径来最大程度地利用2D图像的归纳偏差,从而解决了空间连续性的关键问题。
  • 提出了一种将3D Mamba分解为2D和1D Zigzag Mamba的方法,以优化性能,并且可以根据需要调整其应用顺序,从而更好地利用空间和时间相关性。

nnMamba: 3D Biomedical Image Segmentation, Classification and Landmark Detection with State Space Model

方法: 本文提出了nnMamba,一种结合了CNNs的局部表示能力和SSMs的先进的长程建模能力的新型架构。具体而言,本文引入了Mamba-In-Convolution with Channel-Spatial Siamese learning(MICCSS)模块来建模体素之间的长程关系。对于密集预测和分类任务,本文还设计了通道缩放和通道顺序学习方法。







请到「今天看啥」查看全文