提出MaskLLM,一种可学习的方法,用于在大型语言模型中建立N:M稀疏性,实验表明其可显著提升压缩质量,并可无损迁移至下游任务。
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师 |
宝玉xp · //@西雅图黄都督:这个数据你是瞧不起美国。 ... · 昨天 |
爱可可-爱生活 · 通过clustering based ... · 2 天前 |
字节跳动技术团队 · 从0到1搭建 AI ... · 4 天前 |
字节跳动技术团队 · 从0到1搭建 AI ... · 4 天前 |
爱可可-爱生活 · 【Datago:Python友好的高性能数据 ... · 4 天前 |
宝玉xp · 挤牙膏了//@明风:大模型界的汪峰 ... · 6 天前 |
爱可可-爱生活 · 通过clustering based token pooling-20240929052525 2 天前 |
字节跳动技术团队 · 从0到1搭建 AI 口语陪练,雅思口语这不就搞定了?|扣子(coze.cn)最佳实践Vol.1 4 天前 |
字节跳动技术团队 · 从0到1搭建 AI 口语陪练,雅思口语这不就搞定了?|扣子(coze.cn)最佳实践Vol.1 4 天前 |
爱可可-爱生活 · 【Datago:Python友好的高性能数据加载器,支持从对象存-20240926205137 4 天前 |
宝玉xp · 挤牙膏了//@明风:大模型界的汪峰 //@陈阿荣TD:转发微博-20240925021556 6 天前 |
军武次位面 · 志愿军特等功神炮手60年来的寻找,他找到了吗? 7 年前 |
体坛老司机 · 他永远最勤奋却最后时刻无缘奥运 如今升任队长能否率队圆梦? 7 年前 |
前端JavaScript · Angular开发者指南(四)控制器 7 年前 |
科技每日推送 · 技巧 | iPhone透明主题和圆形文件夹,无需越狱! 7 年前 |
百思不得姐 · 泡姐新闻:今天全网最爆炸的5件事 7 年前 |