专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  【[212星]neosr:开源的超分辨率模型 ... ·  13 小时前  
爱可可-爱生活  ·  【[109星]PRefLexOR:基于偏好的 ... ·  18 小时前  
机器之心  ·  从零开始自主「起身站立」,上海AI ... ·  昨天  
量子位  ·  花1699请DeepSeek当家教,值么? ·  昨天  
爱可可-爱生活  ·  【[37星]dpo-prefix-shari ... ·  2 天前  
51好读  ›  专栏  ›  爱可可-爱生活

本文提出了一个统一的压缩 缩放率 框架,通过“有效参数计数”的概-20250226060422

爱可可-爱生活  · 微博  · AI  · 2025-02-26 06:04

正文

2025-02-26 06:04

本文提出了一个统一的压缩 缩放率 框架,通过“有效参数计数”的概念,揭示了权重稀疏性和量化等压缩技术如何影响 LLM 的 scaling 行为,实验证明权重量化在保持参数效率方面表现出色,尤其仅权重化量化在低比特下依然有效,而全量化在 4 比特以下收益递减,为高效压缩和训练 LLM 提供了理论指导和实验依据,并为未来模型压缩技术的研究方向提供了新的视角。
[LG]《Compression Scaling Laws:Unifying Sparsity and Quantization》E Frantar, U Evci, W Park, N Houlsby... [Google DeepMind] (2025) 网页链接 #机器学习#






请到「今天看啥」查看全文