专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  晚安~ #晚安# -20241017222159 ·  昨天  
爱可可-爱生活  ·  【ComfyUI-Fluxtapoz:用于 ... ·  昨天  
宝玉xp  ·  //@金山://@来去之间://@三十三讲结 ... ·  4 天前  
51好读  ›  专栏  ›  爱可可-爱生活

本文利用重尾自正则化理论诊断小数据训练中模型各层训练质量的不平衡-20241018053704

爱可可-爱生活  · 微博  · AI  · 2024-10-18 05:37

正文

2024-10-18 05:37

本文利用重尾自正则化理论诊断小数据训练中模型各层训练质量的不平衡问题,并提出 TempBalance 算法通过分层学习率调度有效提高 NLP 和 SciML 任务的模型性能,尤其在极低数据量场景下效果显著,该方法也可用作现有优化器的补充。
[LG]《Model Balancing Helps Low-data Training and Fine-tuning》Z Liu, Y Hu, T Pang, Y Zhou... [Dartmouth College] (2024) 网页链接 #机器学习##人工智能##论文#