专栏名称: NVIDIA企业开发者社区
NVIDIA 英伟达开发者社区是NVIDIA GPU开发者交流平台,通过此平台可第一时间获取NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。
目录
相关文章推荐
中国舞台美术学会  ·  资讯丨中国旅游产业十年蜕变:2014-202 ... ·  2 天前  
中国舞台美术学会  ·  聚焦丨文旅新业态含“智”量又高了 ·  昨天  
中国舞台美术学会  ·  陶庆梅:“沉浸式”演出与当代戏剧的发展 ·  2 天前  
中国舞台美术学会  ·  艺谈丨胡娜:从演艺新空间看戏曲的守正创新 ·  3 天前  
临淄发布  ·  别眨眼!这样的临淄,ài了ài了! ·  2 天前  
临淄发布  ·  别眨眼!这样的临淄,ài了ài了! ·  2 天前  
51好读  ›  专栏  ›  NVIDIA企业开发者社区

开发者新闻 | 使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM

NVIDIA企业开发者社区  · 公众号  ·  · 2024-04-12 18:18

正文


使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM


大型语言模型 (LLM) 已经彻底改变了自然语言处理 (NLP),它们能够从大量文本中学习,并为各种任务和领域生成流畅和连贯的文本。然而,定制 LLM 是一项具有挑战性的任务,通常需要一个完整的训练过程,耗时且计算成本高昂。此外,训练 LLM 需要一个多样化和有代表性的数据集,这可能很难获得和策划。

企业如何在不支付全额训练费用的情况下充分利用 LLM 的力量?一个有希望的解决方案是低秩自适应 Low-Rank Adaptation (LoRA),这是一种微调方法,可以显著减少可训练参数的数量、内存需求和训练时间,同时在各种 NLP 任务和领域上实现与微调相当甚至更好的性能。

这篇文章解释了 LoRA 的直觉和实现,并展示了它的一些应用和好处。它还将 LoRA 与监督微调和即时工程进行了比较,并讨论了它们的优点和局限性。它概述了 LoRA 调整模型的训练和推理的实用指南。最后,演示了如何使用 NVIDIA TensorRT-LLM 在 NVIDIA GPU 上优化 LoRA 模型的部署。




全文链接:

https://developer.nvidia.com/blog/tune-and-deploy-lora-llms-with-nvidia-tensorrt-llm/


使用 NVIDIA NeMo Evaluator 简化 LLM 的准确性评估



大型语言模型 (LLM) 已经展示了非凡的能力,从处理复杂的编码任务到编写引人注目的故事,再到翻译自然语言。企业正在定制这些模型,以获得更大的特定于应用程序的有效性,从而为最终用户提供更高的准确性和更好的响应。


然而,为特定任务定制 LLM 可能会导致模型“忘记”先前学习的任务。这被称为灾难性遗忘。因此,当企业将 LLM 应用到其应用程序中时,有必要对LLM 在原有任务和新学习的任务上进行评估,不断优化模型以提供更好的体验。这意味着在定制模型上运行评估需要重新运行基础和校准评估,以检测任何潜在的回归。


为了简化 LLM 的评估,NVIDIA NeMo 团队宣布了 NeMo Evaluator 的早期访问计划,这是一种提供自动基准测试功能的云原生微服务。它使用一套多样化的、精心策划的学术基准、客户提供的基准或 LLM-as-a-judge 来评估最先进的基础模型和定制模型。







请到「今天看啥」查看全文