专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  【Transformer详解(Slides) ... ·  昨天  
爱可可-爱生活  ·  [CL]《Between Circuits ... ·  昨天  
机器之心  ·  DeepSeek ... ·  2 天前  
黄建同学  ·  Landing AI ... ·  2 天前  
黄建同学  ·  对需要文档处理的同学很有用↓ ... ·  2 天前  
51好读  ›  专栏  ›  爱可可-爱生活

当线性注意力遇上双向序列 查看图片 //@爱可可-爱生活:本文-20250303061150

爱可可-爱生活  · 微博  · AI  · 2025-03-03 06:11

正文

2025-03-03 06:11

当线性注意力遇上双向序列 查看图片 // @爱可可-爱生活 :本文提出了 LION 框架,创新性地将全线性注意力等效转换为双向 RNN,实现了与传统 Transformer 相当的训练速度和与 RNN/SSM 相当的推理效率,显著提升了线性 Transformer 在双向序列建模任务中的实用性,并在图像分类和掩码语言建模任务上取得了有竞争力的性能。
[LG]《Linear Attention for Efficient Bidirectional Sequence Modeling》A Afzal, E A Rocamora, L N Candogan, P Puigdemont... [EPFL] (2025)






请到「今天看啥」查看全文