他们更担心的是DeepSeek R2//@Easy:趁OpenA-20250406090555_宝玉xp的专栏文章_微信文章

他们更担心的是DeepSeek R2// @Easy :趁OpenAI发开源小模型之前赶紧发了

今天，Meta正式发布了首批原生多模态Llama 4系列模型：Llama 4 Scout和Llama 4 Maverick。据官方介绍，这是迄今为止最先进的多模态AI模型，也是同类产品中的顶尖之作。

Llama 4 Scout
• 拥有170亿活跃参数，配备了16个专家模块。
• 提供了业内领先的上下文窗口能力，长度达到惊人的 10M tokens。
• 在广泛公认的基准测试中，Llama 4 Scout的表现全面超过了Gemma 3、Gemini 2.0 Flash-Lite以及Mistral 3.1。

Llama 4 Maverick
• 同样具备170亿活跃参数，但专家模块的数量增加到128个。
• 图像理解与定位能力出色，能精准地将用户输入与图像中的视觉元素相匹配，并能清晰地将回答与图像的具体区域关联起来。
• 在广泛接受的基准测试中，其性能表现超越了GPT-4o和Gemini 2.0 Flash。
• 在推理和代码任务方面，只需一半的活跃参数就能达到与DeepSeek v3相当的高水平表现。
• 拥有极高的性能-成本比，在LMArena聊天基准中的ELO评分高达1417。

据Meta透露，这两款模型之所以表现如此卓越，很大程度得益于更强大的Llama 4 Behemoth模型的知识蒸馏。Llama 4 Behemoth目前仍在训练中，但其初步的测试成绩已经超越GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro等竞争对手，尤其在STEM领域表现突出。官方表示，后续还将持续公开更多相关细节。

如需进一步了解Llama 4模型的训练和具体性能表现，可访问官方页面➡️ go.fb.me/gmjohs
模型下载地址➡️ go.fb.me/bwwhe9

他们更担心的是DeepSeek R2//@Easy:趁OpenA-20250406090555

正文

请到「今天看啥」查看全文

2025-04-06 09:05
本条微博链接

请到「今天看啥」查看全文