专栏名称: 深度之眼
入行人工智能,学算法公式,写毕业论文,看经典书籍,刷全球公开课,就来深度之眼
目录
相关文章推荐
掌上铜山  ·  刚刚,徐州中小学新校历发布! ·  13 小时前  
掌上铜山  ·  刚刚,徐州中小学新校历发布! ·  13 小时前  
江苏教育新闻  ·  江苏部分学校通知,元宵节次日报到! ·  昨天  
江苏教育新闻  ·  江苏部分学校通知,元宵节次日报到! ·  昨天  
疯狂区块链  ·  暴富靠的是什么? ·  昨天  
好地讯江苏  ·  2月苏州6宗涉宅地待出让,总起价34.7亿( ... ·  4 天前  
51好读  ›  专栏  ›  深度之眼

深度学习模型涨点必备的112个注意力机制

深度之眼  · 公众号  ·  · 2025-01-09 20:08

正文

注意力机制 已经成了模型设计的基础架构,现在模型里没个Attention都不好意思发出来。


从注意力机制发布到今天,学术界一直在对Attention进行各种魔改。魔改后的Attention能够 提升模型的表达能力 增强跨模态能力和可解释性 ,以及 优化模型大小与效率


最重要的一点,很多注意力模块都是 即插即用 的。我们可以在自己的模型里用学术大牛的注意力模块,这样再做实验写论文绝对是事半功倍了。


近期,包括 缩放点积注意力、多头注意力、交叉注意力、空间注意力、通道注意力 等在内的11种主流注意力机制都有许多创新研究。今天分享 112个11种主流注意力机制 的创新研究。最新的创新思路非常适合大家用在实验中!


112个11种主流注意力机制的创新研究,paper和代码都帮大家下载整理好了。欢迎扫码领取。


扫码领112个11种主流注意力机制

创新研究paper和代码


缩放点积注意力

  • 5.Sep.2024—LMLT:Low-to-high Multi-Level Vision Transformer for Image Super-Resolution

  • 4.Sep.2024—MobileUNETR:A Lightweight End-To-End Hybrid Vision Transformer For Efficient Medical Image Segmentation

  • 4.Sep.2024—More is More Addition Bias in Large Language Models

  • 4.Sep.2024—LongLLaVA:Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture

......

扫码领112个11种主流注意力机制

创新研究paper和代码


多头注意力

  • 4.Sep.2024—Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening

  • 30.Aug.2024—From Text to Emotion: Unveiling the Emotion Annotation Capabilities of LLMs

  • 25.Jun.2024—Temporal-Channel Modeling in Multi-head Self-Attention for Synthetic Speech Detection

  • 14.May.2024—Improving Transformers with Dynamically Composable Multi-Head Attention

......

扫码领112个11种主流注意力机制







请到「今天看啥」查看全文