Meta要放大招了!
扎克伯格刚刚透露,
Llama 4的预训练工作已经启动
,这可能是Meta在AI领域的一次重大飞跃。
那么,
Llama 4到底会有多强?
它能否追上OpenAI的GPT-4o和o1呢?
Llama 4:推理能力大升级
Meta AI副总裁Manohar Paluri向AIM透露,
Llama 4不仅能"计划",还能实时评估决策并根据情况调整
。
这意味着什么?
简单来说,Llama 4将具备
更强大的推理能力
。
它不再只是按部就班地执行指令,而是能够像人类一样
思考、评估、调整
。这种迭代式方法,结合"思维链"等技术,将帮助Llama 4在复杂任务中表现更出色。
自监督学习:Llama的秘密武器
Meta表示,Llama模型使用
自监督学习(SSL)
来获取广泛的知识表示。这与当前主流的
RLHF(基于人类反馈的强化学习)
方法形成鲜明对比。
Paluri解释道:"
自监督学习让模型能够从海量数据中自主获取通用知识。而RLHF则专注于特定任务的对齐,就像在模型完成特定动作后给它说'干得好'或'再试一次'。
"
这将使得Llama在
生成高质量合成数据
方面表现出色,特别是对于印度语言等资源匮乏的语言。
这也解释了为什么Llama成为了
合成数据生成的首选工具
。
Llama 4 何时问世?
扎克伯格在接受AI博主Rowan Cheung采访时透露,
Meta已经为Llama 4设置了计算集群和数据基础设施
。
他预计Llama 4将是对Llama 3的重大改进。
Meta产品副总裁Ragavan Srinivasan暗示,
"
下一代"Llama模型可能会在2025年发布
。新模型将具备原生集成、扩展的记忆和上下文能力、跨模态支持,并扩大第三方合作。
Paluri开玩笑说,如果问扎克伯格发布时间,他可能会说"今天",这也体现了Meta在AI开发上的迫切心情。
量化让AI更轻便
最近,Meta还
推出了Llama 3.2模型的量化版本
。
这项技术能将模型大小减少56%,内存使用量减少41%,同时将推理速度提高4倍。这意味着Llama模型将更容易在各种设备上运行,为AI的广泛应用铺平道路。
随着Llama 4的即将到来,AI领域的竞争似乎正在升温。
你认为Meta能否通过这次升级追上或超越OpenAI的GPT-4o和o1呢?