专栏名称: 学术头条

致力于科学传播和学术分享，关注计算机科学、认知科学、人工智能科学、神经科学、脑科学等学科领域。我们从跨学科的角度，围绕“认知智能”向科学界和大众介绍相关领域的前沿话题和深度解读。

3B 超越 7B，Mistral AI 推出端侧模型 Ministral 3B 和 8B

学术头条 · 公众号 · · 2024-10-17 12:02

正文

今日凌晨，Mistral AI 推出了他们最新一代端侧模型 les Ministraux：Ministral 3B 和 Ministral 8B，这是两款用于端侧计算和边缘用例的 SOTA 模型。

据介绍， les Ministraux 在知识、常识、推理、函数调用和效率方面达到了 10B 以下同类模型的新高度 ，可直接用于或微调为各种用途，从协调智能体工作流到创建专业任务工作者。

两种模型都支持高达 128k 的上下文长度（vLLM 目前为 32k），Ministral 8B 具有一种特殊的交错滑动窗口注意力机制（SWA），可加快推理速度并提高内存效率。

使用案例

目前，为端侧翻译、无互联网智能助手、本地分析和自主机器人等关键应用提供本地、隐私优先推理的需求越发强烈。

Mistral AI 方面表示，Les Ministraux 就是为这些应用场景提供计算效率高、延迟低的解决方案而设计的。从独立业余爱好者到全球制造团队，Les Ministraux 可满足各种使用情况。与 Mistral Large 等大语言模型（LLM）结合使用时，Les Ministraux 还是多步骤智能体工作流中函数调用的高效中介。可以对它们进行微调，以处理输入解析、任务路由和根据用户意图在多种上下文中以极低的延迟和成本调用 API。

Benchmark

Mistral AI 在多个任务中展示了 les Ministraux 的性能，其表现始终优于同类产品。他们利用内部框架重新评估了所有模型，以便进行公平比较。

1.预训练模型