专栏名称: NVIDIA企业开发者社区
NVIDIA 英伟达开发者社区是NVIDIA GPU开发者交流平台,通过此平台可第一时间获取NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。
目录
相关文章推荐
芋道源码  ·  分库分表 带来了哪些问题? ·  2 天前  
程序猿  ·  突发!百度出手,152亿元大收购 ·  3 天前  
51好读  ›  专栏  ›  NVIDIA企业开发者社区

开发者新闻 | 使用 Llama 3.1 为企业应用程序定制生成式 AI 模型

NVIDIA企业开发者社区  · 公众号  ·  · 2024-08-15 16:38

正文


使用 Llama 3.1

为企业应用程序定制生成式 AI 模型



新推出的 Llama 3.1 集合 8B、70B 和 405B 大型语言模型 (LLM) 正在缩小专有模型和开源模型之间的差距。它们的开放性吸引了更多的开发者和企业将这些模型集成到他们的 AI 应用程序中。

这些模型擅长各种任务,包括内容生成、编码和深度推理,并可用于为聊天机器人、自然语言处理和语言翻译等用例的企业应用程序提供动力。

Llama 3.1 405B 模型,由于其训练数据的庞大规模,是生成合成数据以调优其他 LLM 的绝佳候选。这在医疗保健、金融和零售等行业尤其有用,因为这些行业由于合规性要求而无法获得真实数据。

此外, Llama 3.1 405B 还可以使用特定于领域的数据进行调优,以服务于企业用例。

一旦企业定制 LLM 以适应其组织需求、领域知识和技能、公司词汇和其他文化差异,他们就会体验到更好的准确性。




全文链接:

https://developer.nvidia.com/blog/customize-generative-ai-models-for-enterprise-applications-with-llama-3-1/


在 NVIDIA 平台上全面加速 Llama 3.1


Meta 的 Llama 大型语言模型集合是当今开源社区中最受欢迎的基础模型,支持各种用例。全球数百万开发人员正在构建衍生模型,并将这些模型集成到他们的应用程序中。

在 Llama 3.1 中,Meta 推出了一套大型语言模型 (LLM) 以及一套信任和安全模型,以确保 LLM 的安全响应。

Meta 工程师在 NVIDIA Tensor Core GPU 上训练 Llama 3。他们显著优化了完整训练堆栈,并将模型训练扩展到了超过 16K H100 GPU,使 405B 成为第一个以这种规模训练的 Llama 模型。

我们很高兴地宣布,Llama 3.1 系列针对全球 100M 以上的 GPU 进行了优化,涵盖了从数据中心到边缘和 PC 的所有 NVIDIA 平台。






请到「今天看啥」查看全文