专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
量子位  ·  阿里推理模型一战封神!32B硬刚671B ... ·  16 小时前  
爱可可-爱生活  ·  //@爱可可-爱生活:欢迎参与!//@爱可可 ... ·  昨天  
爱可可-爱生活  ·  RSQ 论文创新性地提出了一种基于 ... ·  昨天  
51好读  ›  专栏  ›  爱可可-爱生活

RSQ 论文创新性地提出了一种基于 token 重要性的后训练量-20250305060359

爱可可-爱生活  · 微博  · AI  · 2025-03-05 06:03

正文

2025-03-05 06:03

RSQ 论文创新性地提出了一种基于 token 重要性的后训练量化框架,通过旋转权重、重要性缩放和结合注意力集中策略,显著提升了低比特率量化后大语言模型在下游任务和长文本任务上的性能,揭示了在模型压缩过程中优先学习重要信息而非均匀压缩所有信息的反直觉但有效的策略。
[LG]《RSQ: Learning from Important Tokens Leads to Better Quantized LLMs》Y Sung, P Yadav, J Li, J Yoon... [UNC at Chapel Hill] (2025) 网页链接 #机器学习#






请到「今天看啥」查看全文