他们更担心的是DeepSeek R2//
@Easy
:趁OpenAI发开源小模型之前赶紧发了
今天,Meta正式发布了首批原生多模态Llama 4系列模型:Llama 4 Scout和Llama 4 Maverick。据官方介绍,这是迄今为止最先进的多模态AI模型,也是同类产品中的顶尖之作。
Llama 4 Scout
• 拥有170亿活跃参数,配备了16个专家模块。
• 提供了业内领先的上下文窗口能力,长度达到惊人的 10M tokens。
• 在广泛公认的基准测试中,Llama 4 Scout的表现全面超过了Gemma 3、Gemini 2.0 Flash-Lite以及Mistral 3.1。
Llama 4 Maverick
• 同样具备170亿活跃参数,但专家模块的数量增加到128个。
• 图像理解与定位能力出色,能精准地将用户输入与图像中的视觉元素相匹配,并能清晰地将回答与图像的具体区域关联起来。
• 在广泛接受的基准测试中,其性能表现超越了GPT-4o和Gemini 2.0 Flash。
• 在推理和代码任务方面,只需一半的活跃参数就能达到与DeepSeek v3相当的高水平表现。
• 拥有极高的性能-成本比,在LMArena聊天基准中的ELO评分高达1417。
据Meta透露,这两款模型之所以表现如此卓越,很大程度得益于更强大的Llama 4 Behemoth模型的知识蒸馏。Llama 4 Behemoth目前仍在训练中,但其初步的测试成绩已经超越GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro等竞争对手,尤其在STEM领域表现突出。官方表示,后续还将持续公开更多相关细节。
如需进一步了解Llama 4模型的训练和具体性能表现,可访问官方页面➡️ go.fb.me/gmjohs
模型下载地址➡️ go.fb.me/bwwhe9
Llama 4 Scout
• 拥有170亿活跃参数,配备了16个专家模块。
• 提供了业内领先的上下文窗口能力,长度达到惊人的 10M tokens。
• 在广泛公认的基准测试中,Llama 4 Scout的表现全面超过了Gemma 3、Gemini 2.0 Flash-Lite以及Mistral 3.1。
Llama 4 Maverick
• 同样具备170亿活跃参数,但专家模块的数量增加到128个。
• 图像理解与定位能力出色,能精准地将用户输入与图像中的视觉元素相匹配,并能清晰地将回答与图像的具体区域关联起来。
• 在广泛接受的基准测试中,其性能表现超越了GPT-4o和Gemini 2.0 Flash。
• 在推理和代码任务方面,只需一半的活跃参数就能达到与DeepSeek v3相当的高水平表现。
• 拥有极高的性能-成本比,在LMArena聊天基准中的ELO评分高达1417。
据Meta透露,这两款模型之所以表现如此卓越,很大程度得益于更强大的Llama 4 Behemoth模型的知识蒸馏。Llama 4 Behemoth目前仍在训练中,但其初步的测试成绩已经超越GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro等竞争对手,尤其在STEM领域表现突出。官方表示,后续还将持续公开更多相关细节。
如需进一步了解Llama 4模型的训练和具体性能表现,可访问官方页面➡️ go.fb.me/gmjohs
模型下载地址➡️ go.fb.me/bwwhe9