一句话总结:能放在你桌面上的个人AI超级计算机
NVIDIA 今天在CES 2025大会上发布了
NVIDIA Project DIGITS
,这是一款能放在你桌面上的个人AI超级计算机。
Project DIGITS 提供了一个超强的AI计算工具,可以让普通用户在自己的电脑上完成:
Project DIGITS 采用全新的 NVIDIA GB10 Grace Blackwell Superchip,能够提供 1 PFLOP(
每秒一千万亿次浮点运算
)的AI计算性能。
设计用于原型开发、微调以及运行大型AI模型,使用户能够在本地桌面系统上开发和运行推理模型,然后无缝部署到云或数据中心
也就是它能在你的本地就能运行超大的AI模型,
能够运行高达 2000亿 参数的大语言模型
(比如...)。
而且支持在本地电脑上开发和测试AI模型,然后快速部署到云端或数据中心。
简单来说,
它就像是给每个开发者配了一台袖珍的AI超级计算机!
Project DIGITS 的核心是一颗叫 GB10 Superchip 的芯片:
SoC设计:
基于 NVIDIA Grace Blackwell 架构,集成 NVIDIA Blackwell GPU(搭载最新一代CUDA核心和第五代Tensor Cores)与高性能 NVIDIA Grace CPU,专为深度学习优化。
高效性能:
在 FP4 精度下提供
1 PFLOP(每秒一千万亿次浮点运算)的计算性能
。同时具有 20 个基于 Arm 架构的高效能核心,能耗低但性能强。。
能耗与存储:
配备 128GB 统一内存和 4TB NVMe 存储。
性能超强:
可以运行非常复杂的AI任务,能处理
2000亿 参数
的大语言模型。
可扩展性:
通过 NVIDIA ConnectX 网络,
两台 Project DIGITS 超级计算机连接起来,可以运行 4050亿 参数模型
。
连接性能
:通过 NVLink-C2C 实现 GPU 和 CPU 高速互联。
有什么用?
本地开发与测试:允许开发者在本地环境中快速进行 AI 模型原型设计和实验。
云端扩展:本地开发的模型可以直接迁移到云端加速部署。
高效性能与成本:提供媲美大型数据中心的计算能力,但仅需少量成本和能耗。
多样化应用场景:支持深度学习、自然语言处理、计算机视觉等多个领域的 AI 应用。
适合谁用?
适合AI 研究人员、数据科学家、学生以及初创企业使用。
更容易上手:只需普通电脑的配置即可使用。
灵活性强:从本地开发到云端部署无缝衔接。
典型应用场景
AI研究与创新
开发和测试复杂的 AI 模型,如大规模语言模型(LLM)或生成式AI应用。
进行原型开发、模型微调和实验。
数据科学
使用 RAPIDS 和其他工具,快速处理和分析大型数据集。
加速数据清理、特征工程和建模工作。
教学与学习
面向高校和学生,提供负担得起的 AI 计算资源,支持 AI 教学和学习实践。
NVIDIA 提供丰富的软件生态,让用户能够快速开始开发和部署AI模型:
(1) 开发工具
NVIDIA NGC:提供一个全面的软件库,包含开发工具包(SDK)、框架和预训练模型。
NVIDIA NeMo:用于微调大型语言模型(LLM)的框架。
NVIDIA RAPIDS:用于加速数据科学工作流。
兼容常用框架:支持 PyTorch、Python 和 Jupyter Notebook 等流行工具。
(2) 部署支持
用户可以在本地开发模型,随后直接部署到 NVIDIA DGX Cloud 或其他加速的云和数据中心架构中,无需改动代码。
(3) 企业级支持
提供 NVIDIA AI Enterprise 软件,保障企业级安全性、支持和生产环境发布。
过去只有大企业或实验室才能用得起的AI计算能力,现在变成了普通开发者都能负担得起的工具。
这意味着:
小团队或个人可以开发和测试自己的AI模型。
AI研究和创新的门槛大大降低。
AI 计算的普及:通过降低硬件成本和部署难度,推动 AI 技术的普及。
创新驱动力:为个人和小型团队提供前所未有的计算能力,激发更多创新。
生态系统的整合:将 NVIDIA 的硬件与软件生态系统无缝结合,为用户提供一站式解决方案。
售价:
起步价为 3000美元
,由 NVIDIA 和顶级合作伙伴联合发售。
可在 NVIDIA 官网注册获取通知
NVIDIA 推出了全
新 GeForce RTX 50 系列
显卡和笔记本电脑
这些产品基于 Blackwell RTX 架构,带来了革命性的性能提升和 AI 驱动的神经渲染技术。
RTX 50 系列提供高达 8 倍的性能提升(通过 DLSS 4)、高达 75% 的延迟降低(通过 Reflex 2),为游戏玩家和内容创作者开启了全新的可能性。
包含 920 亿个晶体管,采用最新的 GDDR7 显存(速度高达 30Gbps),提供高达 1.8TB/s 的内存带宽。
新一代 Tensor 核心和光线追踪(RT)核心,支持实时渲染和更高效的 AI 模型处理。
DLSS 4 和 Reflex 2 的支持,提升游戏流畅度和响应速度。
GeForce RTX 5090
规格参数:
CUDA 核心数:21,760
通过 DLSS 4 和 Multi Frame Generation,可支持 4K 分辨率、240 FPS 和全光追游戏。
支持生成式 AI 应用,图像生成速度提升 2 倍,同时显存占用减少(FP4 模式)。
GeForce RTX 5080
规格参数:
CUDA 核心数:16,384
显存:16GB GDDR7
显存带宽:960 GB/s
可在 4K 分辨率下畅玩支持光追的游戏(如《赛博朋克 2077》和《Alan Wake 2》)、《黑神话:悟空》 等大作
GeForce RTX 5070Ti
规格参数:
CUDA 核心数:12,288
显存:16GB GDDR7
显存带宽:896 GB/s(相比 RTX 4070 Ti 提升 78%)
在 2560x1440 分辨率下,可高帧率运行光追游戏。
GeForce RTX 5070
规格参数:
CUDA 核心数:10,240
显存:12GB GDDR7
显存带宽:672 GB/s(相比 RTX 4070 提升显著)
在 2560x1440 分辨率下,可高帧率运行光追游戏,支持 DLSS Multi Frame Generation。
DLSS 4 是 NVIDIA 最新的神经渲染技术,由 GeForce RTX Tensor 核心驱动,可显著提升帧率的同时保持清晰的画质。
首次在游戏中应用 Transformer AI 模型
NVIDIA Reflex 2 通过全新的帧变形技术将游戏延迟降低高达75%,让游戏体验更加流畅。