李飞飞＆DeepSeek都在用！模型蒸馏爆火！在CVPR上杀疯了...

AI算法科研paper · 公众号 · · 2025-03-14 19:01

正文

被李飞飞成本不到150元的推理模型s1震撼到了，甚至他们只花了26分钟...研读后发现秘诀只有一个：蒸馏。简单来说，就是将谷歌Gemini 2.0的推理能力蒸馏到阿里Qwen2.5模型中，得到s1，效果媲美DeepSeek-R1和OpenAI o1。

不得不赞叹 模型蒸馏 的强大，这种将大模型知识迁移到小模型上的技术，在降低训练和部署成本方面遥遥领先。这也是它成为s1秘诀和DeepSeek核心技术的原因，非常贴合当下“技术普惠”的发展趋势，研究前景明确。

当前，模型蒸馏仍然是 深度学习领域的热点 ，但成熟度比较高。如果论文er们想有所创新，建议聚焦细分方向，比如蒸馏算法效率、稳定性提升、与量化/剪枝等技术的协同优化。我整理了 9篇 模型蒸馏前沿论文， 顶会（尤其CVPR）多，基本都有代码，大家可以参考这些思路找idea。

扫码添加小享，回复“ 模型蒸馏 ”

免费获取全部论 文+开源代码

方法： 论文提出了一种新的模型蒸馏方法，通过Logit标准化预处理，解决了传统蒸馏中教师和学生模型共享温度导致的Logit匹配问题，使学生模型能更好地学习教师模型的内在关系，显著提升了蒸馏性能。

创新点：

方法： 论文提出了一种名为ADD的模型蒸馏方法，将预训练的扩散模型转化为仅需1-4步采样即可生成高质量图像的快速模型。通过结合对抗训练和分数蒸馏损失，ADD在单步生成中超越了现有快速生成方法，并在四步内超过了其教师模型SDXL的性能。

创新点：

扫码添加小享，回复“ 模型蒸馏

推荐文章

新北方 · 倒计时1天！2025沈阳C4潮车展明日开幕！就在沈阳苏家屯国际展览中心！

17 小时前

新北方 · 痛心！14岁哥哥误伤妹妹酿悲剧，常见的装修工具咋成了致命凶器？

昨天

新北方 · 发霉橘子在二手平台标价上千？

昨天

新北方 · 为一口卤味，大学生劝和吵架夫妻！

2 天前

新北方 · 大连海关党委书记、关长刘大立，被查！

2 天前

教你驾驭男人 · 要做就做一个让男人离不开的女人！

8 年前

中国经济网 · “舌战群儒”！傅莹慕尼黑安全会议实力圈粉丨必看

8 年前

孤读先生 · 离开那个对你忽冷忽热的人

8 年前

人神共奋 · 一条传遍公司的小道消息，是如何制造出来的？

8 年前

正商参略 · 当你准备买房的时候，210万富人已在高位套现！

7 年前