专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
爱可可-爱生活  ·  [LG]《Mixture of ... ·  3 天前  
奇舞精选  ·  AI时代的人性化交互:语音交互技术 ·  3 天前  
奇舞精选  ·  AI时代的人性化交互:语音交互技术 ·  3 天前  
51好读  ›  专栏  ›  爱可可-爱生活

混合专家模型在知识密集型任务中展现出卓越的记忆能力,但在推理任务-20241029053624

爱可可-爱生活  · 微博  · AI  · 2024-10-29 05:36

正文

2024-10-29 05:36

混合专家模型在知识密集型任务中展现出卓越的记忆能力,但在推理任务方面却不如密集 Transformer,这揭示了模型架构与任务类型之间存在深刻的联系,并非所有任务都适合 MoE 架构。
[LG]《Mixture of Parrots: Experts improve memorization more than reasoning》S Jelassi, C Mohri, D Brandfonbrener, A Gu... [Harvard University] (2024) 网页链接 #机器学习##人工智能##论文#