专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
机器之心  ·  DeepSeek关键RL算法GRPO,有人从 ... ·  昨天  
机器之心  ·  DeepSeek ... ·  昨天  
宝玉xp  ·  DeepSeek 开源周第 6 天彩蛋 – ... ·  2 天前  
爱可可-爱生活  ·  【Self-rewarding-reason ... ·  3 天前  
宝玉xp  ·  //@Rex牙醫:他们怎么这么多-20250 ... ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

Stable-SPAM: 4-bit训练比16-bit Adam-20250302064648

爱可可-爱生活  · 微博  · AI  · 2025-03-02 06:46

正文

2025-03-02 06:46

Stable-SPAM: 4-bit训练比16-bit Adam更稳定的突破 查看图片 // @爱可可-爱生活 :本文提出了 Stable-SPAM 优化器,通过自适应梯度归一化和裁剪等创新技术,显著提升了 4-bit 低精度训练大型语言模型的稳定性,使其性能不仅超越了传统 Adam 优化器,甚至在某些情况下超越了 BF16 训练的 Adam,有力地证明了在低精度训练中,稳定性优化能够带来突破性的性能提升,并为高效低成本的 LLM 训练开辟了新路径。
[LG]《Stable-SPAM: How to Train in 4-Bit More Stably than 16-Bit Adam》T Huang, H Hu, Z Zhang, G Jin... [University of Exeter & University of Science and Technology of China & University of Texas at Austin] (2025)






请到「今天看啥」查看全文