Llama 3.1发布，性能媲美最强闭源大模型

分布式实验室 · 公众号 · · 2024-07-24 11:05

正文

美国太平洋时间 7 月 23 日，Meta 公司发布了其最新的 AI 模型 Llama 3.1，这是一个里程碑时刻。Llama 3.1 的发布让我们看到了开源 LLM 有与闭源 LLM 一较高下的能力。

Meta 表示，“到目前为止，开源 LLM 在功能和性能方面大多落后于闭源模型。现在，我们正迎来一个由开源引领的新时代。”

Meta 称 Llama 3.1 是目前最强的生成式 AI 产品。4 月份，Meta 已经发布了 Llama 3，被称为是 “我们最先进的开源 LLM 的下一代产品”。

此次 Llama 3.1 发布的产品有 8B、70B 和 405B 三个尺寸。

其中最受关注的是 Llama 3.1 405B。Meta 表示 Llama 3.1 405B 是目前全球最大、功能最强的公共基础模型，可与 OpenAI 和 Google 开发的顶级模型一争高下。

Meta 在官方博客中表示：“Llama 3.1 405B 是首个公开可用的模型，在通用常识、可引导性、数学、工具使用和多语言翻译方面可与顶级 AI 模型相媲美。405B 模型的发布将带来前所未有的创新和探索机会。”

Meta 称他们在超过 150 个基准数据集上进行了性能评估，并将 Llama 3.1 与竞品进行了比较，结果显示 Llama 3.1 405B 在各项任务中都有能力与当前最先进的闭源模型一较高下。

8B 和 70B 在与同级别的小参数模型对比中也表现优异。

Llama 3 的推出以及 Meta 向生成式 AI 的全面转型，使得这一产品被广泛应用于 Meta 的大多数产品线，包括 Instagram、Messenger 和 WhatsApp。

此外，Meta CEO 扎克伯格表示，将 AI 作为开源工具向所有人开放也非常重要。

扎克伯格在一篇文章中写道：“开源将确保世界上更多的人能享受到 AI 带来的红利和机会。这种权利不应该集中在少数公司手中，而且这项技术可以更均衡、更安全地部署到整个社会。”

Meta 开发开源 AI 模型的努力也促使其他 AI 开发者，包括去中心化 AI 公司 Venice AI、Brave 浏览器开发者 Brave 和 Perplexity AI，将 Llama 3 添加到他们的平台上。

Venice AI 创始人 Erik Voorhees 在 5 月的一次 Twitter Space 中表示：“Meta 值得高度赞扬，因为他们花费了数亿美元来训练一个最先进的模型，并免费向全世界开放。”

Meta 表示，在提供更多功能的过程中，开发 Llama 3.1 405B 面临的最大挑战是模型规模的整体增长，支持更大的 12800,0-token 上下文窗口，并提供多语言支持。根据该公司表示，其 Meta AI 现在可以用法语、德语、印地语、意大利语、葡萄牙语和西班牙语进行响应。

关于 AI 安全性方面，扎克伯格强调 AI 应避免所有类型的伤害。

扎克伯格表示：“非故意伤害是指即使操作人员无意，AI 系统也可能造成伤害。故意伤害是指不法分子使用 AI 模型故意造成伤害。”

在故意滥用的情况下，主要的 AI 开发者 —— 包括 Meta、Anthropic、OpenAI、Google 和 Microsoft—— 对与选举相关的提示施加了限制，以遏制使用其模型传播错误信息。

扎克伯格指出，非故意伤害涵盖了人们对 AI 的大部分担忧，并表示开源软件的透明性也有助于缓解这些担忧。Llama 3 的发布还包括 Llama Guard 3，一款旨在监控和执行模型道德使用的工具。

扎克伯格表示：“从历史角度看，开源软件因此更加安全。同样，使用 Llama 及其安全系统如 Llama Guard 可能比闭源模型更安全。”

扎克伯格接着表示，他相信 Llama 3.1 的发布将成为 AI 行业的一个拐点。

扎克伯格说：“归根结底，开源 AI 代表了世界上最好的一次利用这项技术创造最大经济机会和安全性的机会。”

我们建了一个大模型技术交流微信群，专门分享最新资讯、行业趋势和有趣想法。如果你想抓住这次 AI 变革的红利，欢迎扫码进群，一起学习交流。