今日推介(第1689期):通过稀疏自编码器进行多样性驱动的语言模型微调数据选择、提高自编码器的可扩散性、利用蒸馏技术设计参数/计算高效扩散Transformer、利用统一稀疏注意力提供高效长序列 LLM 服务、通过两阶段KV缓存压缩加速长上下文LLM推断 公·众·号:爱可可爱生活
网页链接
#机器学习#
#人工智能#
#论文#