MoLE 创新性地提出将混合专家模型中的前馈网络专家转换为预计算查找表,实现了专家免计算推理,在保持模型性能的同时,显著降低了 VRAM 需求和推理延迟,为高效部署大规模混合专家模型开辟了新路径。
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师 |
![]() |
爱可可-爱生活 · 【[168星]DeepMesh:用AI生成高 ... · 昨天 |
![]() |
宝玉xp · 回复@可明白啦:我敢打包票 Manus ... · 昨天 |
|
机器之心 · 刚刚,OpenAI开启语音智能体时代,API ... · 昨天 |
![]() |
宝玉xp · 我只是就原文的观点说明一下,不做其他解读,另 ... · 2 天前 |
|
量子位 · AI一周写出ICLR研讨会论文!成果简洁有效 ... · 3 天前 |
![]() |
爱可可-爱生活 · 【[168星]DeepMesh:用AI生成高质量3D网格,让复杂-20250321134145 昨天 |
|
机器之心 · 刚刚,OpenAI开启语音智能体时代,API价格低至每分钟0.015美元 昨天 |
![]() |
宝玉xp · 我只是就原文的观点说明一下,不做其他解读,另外硅谷这次最惨的是开-20250320021130 2 天前 |
|
量子位 · AI一周写出ICLR研讨会论文!成果简洁有效获审稿人大赞 3 天前 |
|
小新说车 · 自驾回家,请用5分钟看完交警这7条忠告 8 年前 |
|
新疆949交通广播 · 车主发明防违章贴条的大招!交警:确实很机智……结果悲剧了 8 年前 |
|
叔叔恋爱学 · 叔叔的爱·约会专家网络服务 7 年前 |
|
经济学家圈 · 揭秘中国最凶猛的9大并购派系!它们操控了万亿金融帝国 7 年前 |
|
科尔沁都市报 · 理发店暗拍!通辽、赤峰、包头...传疯了! 7 年前 |