专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
黄建同学  ·  AI ... ·  12 小时前  
爱可可-爱生活  ·  【[30星]DeepRetrieval:用L ... ·  21 小时前  
爱可可-爱生活  ·  【[41星]AnyText2:让文本生成与编 ... ·  21 小时前  
黄建同学  ·  这款AI设备有点意思! Mark ... ·  3 天前  
爱可可-爱生活  ·  当线性注意力遇上双向序列 查看图片 ... ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

RSQ:关注重要信息,让大模型压缩更出色 查看图片 //@爱可-20250305075914

爱可可-爱生活  · 微博  · AI  · 2025-03-05 07:59

正文

2025-03-05 07:59

RSQ:关注重要信息,让大模型压缩更出色 查看图片 // @爱可可-爱生活 :RSQ 论文创新性地提出了一种基于 token 重要性的后训练量化框架,通过旋转权重、重要性缩放和结合注意力集中策略,显著提升了低比特率量化后大语言模型在下游任务和长文本任务上的性能,揭示了在模型压缩过程中优先学习重要信息而非均匀压缩所有信息的反直觉但有效的策略。
[LG]《RSQ: Learning from Important Tokens Leads to Better Quantized LLMs》Y Sung, P Yadav, J Li, J Yoon... [UNC at Chapel Hill] (2025)






请到「今天看啥」查看全文