专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
目录
相关文章推荐
51好读  ›  专栏  ›  宝玉xp

他们更担心的是DeepSeek R2//@Easy:趁OpenA-20250406090555

宝玉xp  · 微博  · AI  · 2025-04-06 09:05

正文

请到「今天看啥」查看全文


2025-04-06 09:05

他们更担心的是DeepSeek R2// @Easy :趁OpenAI发开源小模型之前赶紧发了 [允悲]
今天,Meta正式发布了首批原生多模态Llama 4系列模型:Llama 4 Scout和Llama 4 Maverick。据官方介绍,这是迄今为止最先进的多模态AI模型,也是同类产品中的顶尖之作。

Llama 4 Scout
• 拥有170亿活跃参数,配备了16个专家模块。
• 提供了业内领先的上下文窗口能力,长度达到惊人的 10M tokens。
• 在广泛公认的基准测试中,Llama 4 Scout的表现全面超过了Gemma 3、Gemini 2.0 Flash-Lite以及Mistral 3.1。

Llama 4 Maverick
• 同样具备170亿活跃参数,但专家模块的数量增加到128个。
• 图像理解与定位能力出色,能精准地将用户输入与图像中的视觉元素相匹配,并能清晰地将回答与图像的具体区域关联起来。
• 在广泛接受的基准测试中,其性能表现超越了GPT-4o和Gemini 2.0 Flash。
• 在推理和代码任务方面,只需一半的活跃参数就能达到与DeepSeek v3相当的高水平表现。
• 拥有极高的性能-成本比,在LMArena聊天基准中的ELO评分高达1417。

据Meta透露,这两款模型之所以表现如此卓越,很大程度得益于更强大的Llama 4 Behemoth模型的知识蒸馏。Llama 4 Behemoth目前仍在训练中,但其初步的测试成绩已经超越GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro等竞争对手,尤其在STEM领域表现突出。官方表示,后续还将持续公开更多相关细节。

如需进一步了解Llama 4模型的训练和具体性能表现,可访问官方页面➡️ go.fb.me/gmjohs
模型下载地址➡️ go.fb.me/bwwhe9






请到「今天看啥」查看全文