专栏名称: AGI Hunt
关注AGI 的沿途风景!
目录
相关文章推荐
直播海南  ·  80后副局长,5年4次被查处,终被判刑! ·  昨天  
直播海南  ·  女子去菜市场后确诊罕见传染病 ·  昨天  
杭州网  ·  突然!暴涨超388% ·  2 天前  
闽南日报  ·  突然暴涨!超388% ·  2 天前  
闽南日报  ·  突然暴涨!超388% ·  2 天前  
51好读  ›  专栏  ›  AGI Hunt

重磅!Meta明年初推Llama 4,赶超GPT-4o和o1

AGI Hunt  · 公众号  ·  · 2024-10-30 00:00

正文

Meta要放大招了!

扎克伯格刚刚透露, Llama 4的预训练工作已经启动 ,这可能是Meta在AI领域的一次重大飞跃。

那么, Llama 4到底会有多强?

它能否追上OpenAI的GPT-4o和o1呢?

Llama 4:推理能力大升级

Meta AI副总裁Manohar Paluri向AIM透露, Llama 4不仅能"计划",还能实时评估决策并根据情况调整

这意味着什么?

简单来说,Llama 4将具备 更强大的推理能力

它不再只是按部就班地执行指令,而是能够像人类一样 思考、评估、调整 。这种迭代式方法,结合"思维链"等技术,将帮助Llama 4在复杂任务中表现更出色。

自监督学习:Llama的秘密武器

Meta表示,Llama模型使用 自监督学习(SSL) 来获取广泛的知识表示。这与当前主流的 RLHF(基于人类反馈的强化学习) 方法形成鲜明对比。

Paluri解释道:" 自监督学习让模型能够从海量数据中自主获取通用知识。而RLHF则专注于特定任务的对齐,就像在模型完成特定动作后给它说'干得好'或'再试一次'。 "

这将使得Llama在 生成高质量合成数据 方面表现出色,特别是对于印度语言等资源匮乏的语言。

这也解释了为什么Llama成为了 合成数据生成的首选工具

Llama 4 何时问世?

扎克伯格在接受AI博主Rowan Cheung采访时透露, Meta已经为Llama 4设置了计算集群和数据基础设施

他预计Llama 4将是对Llama 3的重大改进。

Meta产品副总裁Ragavan Srinivasan暗示, " 下一代"Llama模型可能会在2025年发布 。新模型将具备原生集成、扩展的记忆和上下文能力、跨模态支持,并扩大第三方合作。

Paluri开玩笑说,如果问扎克伯格发布时间,他可能会说"今天",这也体现了Meta在AI开发上的迫切心情。

量化让AI更轻便

最近,Meta还 推出了Llama 3.2模型的量化版本

这项技术能将模型大小减少56%,内存使用量减少41%,同时将推理速度提高4倍。这意味着Llama模型将更容易在各种设备上运行,为AI的广泛应用铺平道路。

随着Llama 4的即将到来,AI领域的竞争似乎正在升温。

你认为Meta能否通过这次升级追上或超越OpenAI的GPT-4o和o1呢?


👇







请到「今天看啥」查看全文