专栏名称: AI算法科研paper
每日更新人工智能行业技术干货、论文推荐、动态资讯、职场指南等AI知识。关注AI算法科研paper更深入了解人工智能。
目录
相关文章推荐
北京厚朴中医  ·  厚朴有料 | 破局春季的易困与易怒 ·  5 天前  
中国中医  ·  节气养生 | ... ·  3 天前  
51好读  ›  专栏  ›  AI算法科研paper

拿下CV顶会!多模态特征融合+Mamba新方法,性能超越SOTA!

AI算法科研paper  · 公众号  ·  · 2025-03-12 19:01

正文

Mamba,一种具有强大信息整合能力的技术,加上多模态特征融合,不仅能提升模型在处理复杂任务时的准确性和鲁棒性,还拓宽了应用边界:从智能交互到复杂数据分析的多个领域...都涵盖了。创新空间和落地应用前景可见一斑。

去年至今, Mamba+多模态特征融合 相关的论文呈爆发式增长,其中顶会顶刊成果占比可观,比如ICASSP 2025的DepMamba模型,计算效率、准确率等都优于SOTA。如果有同学也对此感兴趣,想出成果,推荐优先探索 动态模态融合、轻量化混合架构、特定领域(如医疗或机器人)的多模态应用 ,结合真实场景需求设计创新点。

为方便大家找参考,我已经整理好了 11篇 Mamba+多模态特征融合前沿论文(基本都有代码) ,需要的可直接获取,帮各位节省时间加快论文进度。

扫码添加小享, 回复“ 曼巴特征

免费获取 全部论文+开源代码

图片

MambaPro: Multi-Modal Object Re-Identification with Mamba Aggregation and Synergistic Prompt

方法: 论文提出了一种名为MambaPro的多模态目标重识别方法,通过Mamba的高效序列建模和协同提示机制,实现了多模态特征的深度融合与交互,有效提升了特征的判别力和模型性能。

创新点:

  • PFA 被引入到冻结的 CLIP 图像编码器中,以促进预训练知识向多模态目标重识别任务的转移。
  • SRP 被提出用于指导多模态特征的联合学习,有效促进了判别性多模态信息的交换,并通过残差提示逐层聚合多模态信息,显著增强了信息的协同效应。
  • MA 高效地对来自不同模态的长序列进行建模交互,整合了模态内部和模态之间的互补特征。

MambaGesture: Enhancing Co-Speech Gesture Generation with Mamba and Disentangled Multi-Modality Fusion

方法: 论文提出了一种名为MambaGesture的新框架,旨在通过结合Mamba模型的序列处理能力与多模态特征融合模块SEAD,解决现有协同语音手势生成方法中忽视多模态交互的问题,以提升手势生成的真实性和多样性。

创新点:

  • 引入Mamba模型用于扩散基础的共同语音手势生成,这是首次在该领域使用Mamba模型。
  • 提出了MambaAttn模块,强化了序列建模能力,以及SEAD模块,一种新颖的音频解耦方法,能够融合多模态数据。
  • 引入了多模态特征融合模块,通过音频、文本、风格和情感的解耦,深化了融合过程,从而生成具备更高逼真度和多样性的手势。

扫码添加小享, 回复“







请到「今天看啥」查看全文