专栏名称: NVIDIA企业开发者社区
NVIDIA 英伟达开发者社区是NVIDIA GPU开发者交流平台,通过此平台可第一时间获取NVIDIA GPU 开发相关的新产品、新工具、线上/线下活动的资讯。
目录
相关文章推荐
河北交通广播  ·  【992 | 关注】石家庄地铁5号线传来最新消息→ ·  13 小时前  
河北交通广播  ·  【992 | 注意】启动Ⅱ级应急响应! ·  13 小时前  
河北交通广播  ·  【992 | ... ·  23 小时前  
河北交通广播  ·  【992 | ... ·  昨天  
河北交通广播  ·  【992 | 关注】95%以上将在公办学校就读! ·  3 天前  
51好读  ›  专栏  ›  NVIDIA企业开发者社区

开发者新闻 | 借助 NVDashboard v0.10 实现近乎实时的使用情况统计,从而充分释放 GPU 性能

NVIDIA企业开发者社区  · 公众号  ·  · 2024-07-18 17:52

正文


借助 NVDashboard v0.10

实现近乎实时的使用情况统计, 从而充分释放 GPU 性能


在 NVIDIA GTC 2024上,RAPIDS 团队展示了 NVDashboard v0.10 的新功能,该面板在 JupyterLab 上运行,用于监控 GPU 使用情况,以帮助最大限度地提高 GPU 资源的效率。

我们很高兴地宣布 NVDashboard v0.10 现在可供使用

此更新引入了一系列改进,包括通过 WebSockets 进行数据流传输以增强性能、时间序列图表刷写和同步工具提示以提高易用性。这些升级共同改变了用户体验,为在 JupyterLab 中使用 GPU 密集型应用程序的开发者和研究人员提供了一个更加响应、直观且视觉上更加协调的工具。

图 1 显示右侧的 GPU 控制面板,而左下角显示两个 dask-labextension 控制面板。

NVDashboard 是一个重要的 JupyterLab 扩展程序,专为显示 GPU 使用情况控制面板而定制。它支持各种指标,包括以下内容:

• GPU 计算利用率
GPU 显存消耗
PCIe 吞吐量
NVLink 吞吐量

该扩展程序以前仅与 JupyterLab 的 3.0 及更低版本兼容。随着 JupyterLab 4.x 的发布,我们更新了 NVDashboard 到版本 0.10,以确保与最新版本的 JupyterLab 兼容。



全文链接:

https://developer.nvidia.com/blog/maximize-gpu-performance-with-near-real-time-usage-stats-on-nvdashboard-v0-10/


使用 CRIU 实现 CRIU 应用程序检查点


CUDA 的检查点和恢复功能通过名为 cuda-checkpoint 的命令行实用程序公开,该实用程序可用于在正在运行的 Linux 进程中以透明方式检查点和恢复 CUDA 状态,同时也可以与开源检查点实用程序 CRIU(用户空间中的检查点/恢复)相结合,以完全检查点 CUDA 应用程序。

›› 检查点概述 ‹‹

透明的每进程检查点在虚拟机检查点和应用程序驱动检查点之间提供了一个中间地带。每进程检查点可与容器结合使用,检查复杂应用程序的状态,从而促进诸如以下用例。






请到「今天看啥」查看全文