专栏名称: NVIDIA企业开发者社区

NVIDIA 英伟达开发者社区是NVIDIA GPU开发者交流平台，通过此平台可第一时间获取NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。

目录

相关文章推荐

中国舞台美术学会 · 资讯丨中国旅游产业十年蜕变：2014-202 ... · 2 天前

中国舞台美术学会 · 聚焦丨文旅新业态含“智”量又高了 · 昨天

中国舞台美术学会 · 陶庆梅：“沉浸式”演出与当代戏剧的发展 · 2 天前

中国舞台美术学会 · 艺谈丨胡娜：从演艺新空间看戏曲的守正创新 · 3 天前

临淄发布 · 别眨眼！这样的临淄，ài了ài了！ · 2 天前

临淄发布 · 别眨眼！这样的临淄，ài了ài了！ · 2 天前

51好读 › 专栏 › NVIDIA企业开发者社区

开发者新闻 | 使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM

NVIDIA企业开发者社区 · 公众号 · · 2024-04-12 18:18

正文

使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM

大型语言模型 (LLM) 已经彻底改变了自然语言处理 (NLP)，它们能够从大量文本中学习，并为各种任务和领域生成流畅和连贯的文本。然而，定制 LLM 是一项具有挑战性的任务，通常需要一个完整的训练过程，耗时且计算成本高昂。此外，训练 LLM 需要一个多样化和有代表性的数据集，这可能很难获得和策划。

企业如何在不支付全额训练费用的情况下充分利用 LLM 的力量?一个有希望的解决方案是低秩自适应 Low-Rank Adaptation (LoRA)，这是一种微调方法，可以显著减少可训练参数的数量、内存需求和训练时间，同时在各种 NLP 任务和领域上实现与微调相当甚至更好的性能。

这篇文章解释了 LoRA 的直觉和实现，并展示了它的一些应用和好处。它还将 LoRA 与监督微调和即时工程进行了比较，并讨论了它们的优点和局限性。它概述了 LoRA 调整模型的训练和推理的实用指南。最后，演示了如何使用 NVIDIA TensorRT-LLM 在 NVIDIA GPU 上优化 LoRA 模型的部署。

全文链接：

https://developer.nvidia.com/blog/tune-and-deploy-lora-llms-with-nvidia-tensorrt-llm/

使用 NVIDIA NeMo Evaluator 简化 LLM 的准确性评估

大型语言模型 (LLM) 已经展示了非凡的能力，从处理复杂的编码任务到编写引人注目的故事，再到翻译自然语言。企业正在定制这些模型，以获得更大的特定于应用程序的有效性，从而为最终用户提供更高的准确性和更好的响应。

然而，为特定任务定制 LLM 可能会导致模型“忘记”先前学习的任务。这被称为灾难性遗忘。因此，当企业将 LLM 应用到其应用程序中时，有必要对LLM 在原有任务和新学习的任务上进行评估，不断优化模型以提供更好的体验。这意味着在定制模型上运行评估需要重新运行基础和校准评估，以检测任何潜在的回归。

为了简化 LLM 的评估，NVIDIA NeMo 团队宣布了 NeMo Evaluator 的早期访问计划，这是一种提供自动基准测试功能的云原生微服务。它使用一套多样化的、精心策划的学术基准、客户提供的基准或 LLM-as-a-judge 来评估最先进的基础模型和定制模型。

请到「今天看啥」查看全文

推荐文章

中国舞台美术学会 · 资讯丨中国旅游产业十年蜕变：2014-2023年增加值分析报告

2 天前

中国舞台美术学会 · 聚焦丨文旅新业态含“智”量又高了

昨天

中国舞台美术学会 · 陶庆梅：“沉浸式”演出与当代戏剧的发展

2 天前

中国舞台美术学会 · 艺谈丨胡娜：从演艺新空间看戏曲的守正创新

3 天前

临淄发布 · 别眨眼！这样的临淄，ài了ài了！

2 天前

临淄发布 · 别眨眼！这样的临淄，ài了ài了！

2 天前

FitTime睿健时代 · 适合一群好肌友的练后大餐：鸡胸肉披萨

8 年前

老金扯谈 · 要永远活得像个少年，即使这很难

8 年前

掌上太原 · 国务院批复：未来3年，太原交通大爆！太原人出行将有怎样变化？

7 年前

点点星光 · ♬ 早上好刚出的九个字，太美了！忍不住送给你！

7 年前

读史 · 当面好不如背后好（说得真好）

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!