专栏名称: 将门创投

将门是一家专注于发掘及加速技术创新激活商业价值的创业公司的创投机构。将门旗下设有将门创新服务、将门技术社群以及将门投资基金。关注领域包括机器智能、物联网、自然人机交互、企业计算。

ICML 2024 | COPAL：三星提出“持续剪枝”新概念，仅需16个样本即可实现大模型高效瘦身

将门创投 · 公众号 · 科技创业 · 2024-07-12 08:22

正文

随着NLP领域的不断发展，将预训练的大语言模型快速优雅的部署到不同的领域已经成为一个重要的研究方向。通常这种迁移需要考虑两个关键因素：（1）模型的高计算需求和（2）在下游领域中无法持续适应。

为了同时应对这两个问题，本文介绍一篇来自三星半导体的研究工作，本文提出了一种自适应语言设置中的持续剪枝框架，称为COPAL ，该框架可以在持续模型适应设置下对生成式大模型进行剪枝优化。剪枝可以避免对模型在下游任务中进行二次微调，为了提高剪枝过程的性能，本文作者提出了一种敏感性分析来指导剪枝过程，该敏感度有效地衡量了模型抵抗新数据集引入的扰动的能力，并找出最适合当前数据集的模型权重。这使得COPAL可以在保持高效剪枝效率的同时，无缝适应到新领域中。作者在不同规模的大模型上进行了详实的实验，结果表明COPAL在效率和适应性方面都取得了优越的性能。

论文题目：

COPAL: Continual Pruning in Large Language Generative Models

论文链接：

https://arxiv.org/abs/2405.02347

一、引言

目前以GPT和LLaMA家族为代表的大型语言模型（LLMs）为各种领域都带来了全新的活力，这些预训练的LLMs为各种NLP任务提供了前所未有的能力，包括语言理解和生成。但是将这些预训练的LLMs适应到不同领域时，目前仍然面临两个主要挑战：

（1）计算需求高：

考虑到模型和数据集的大规模性质，重新训练过程需要大量计算资源 。这种高计算需求在资源受限的环境中非常难解决，限制了LLMs的广泛应用。

（2）模型的适应能力有限：

模型一旦更新以适应某些任务或领域， 在面对不同目标域的新数据时可能无法保持原有同等水平的性能。这种现象被称为"灾难性遗忘"（catastrophic forgetting） ，是持续学习中的一个关键问题。

目前已有研究者尝试基于持续学习框架来缓解上述问题，例如[1]尝试在持续学习环境中对模型进行剪枝处理， 鉴于持续学习本身的局限性，这种方法无法保证剪枝后模型的泛化能力 。针对上述问题，本文提出了COPAL框架， COPAL首次引入了“持续剪枝”（Continual Pruning）的概念，并且提出了一种新的敏感度分析方法 ，用于衡量模型对新数据集引入的扰动的鲁棒性。这种策略使模型能够无缝适应新信息，同时保留先前的知识。

COPAL可以灵活地在模型性能和计算复杂性之间保持平衡 ，上图展示了本文方法与其他剪枝baseline的效果对比。可以看到，本文方法在不同剪枝稀疏密度下均获得了优越的性能。

二、本文方法

COPAL是一种全新的持续剪枝算法， 其旨在解决LLMs在下游适应过程中的“权重停滞(weight stasis)”和“遗忘(forgetting)”问题 ，具体如下图左侧所示。本文作者认为，在持续模型自适应的设置下，直接对模型进行剪枝具有一定的风险，如果一些满足特定阈值的剪枝权重始终保持不变，会导致模型在迁移到新数据时无法实现有效的激活。 因此COPAL提出了一种基于敏感性分析的指导策略来进行剪枝，无需重新训练模型即可实现模型适应性和资源效率的平衡 。