专栏名称: ADS智库
致力于建立自动驾驶及关联“学科”知识库
目录
相关文章推荐
51好读  ›  专栏  ›  ADS智库

GTC:老黄震撼发布B300,B200已破DeepSeek-R1推理世界纪录

ADS智库  · 公众号  ·  · 2025-03-20 11:11

正文

请到「今天看啥」查看全文


来源:OxyAI Studio李玉侠 | 首图 :网络 | 作者 :李玉侠

全文 800+ 字,预计阅 5-10 分钟

进群交流: 点此处


在2025年3月19日的GTC大会上,英伟达(NVIDIA)发布了一系列重要的硬件和软件产品,以下是关键信息:


一、硬件发布


1.1 新核弹B300芯片

性能提升 相比去年发布的GB200芯片,GB300的推理性能提升了1.5倍。


出货时间 GB300预计将在2025年下半年出货。


1.2 B200打破DeepSeek-R1推理世界纪录

性能表现 单个DGX系统配备8个B200 GPU,可实现每秒超过250个token的处理速度,最大吞吐量达到每秒超过30000个token。


未来展望 随着Blackwell Ultra等新GPU的推出,这一纪录有望被进一步打破。


1.3 下一代AI超级芯片Vera Rubin

性能预览 Vera Rubin的整体性能是GB300的3.3倍,其中CPU内存是Grace的4.2倍,内存带宽是Grace的2.4倍,GPU将配备288GB的HBM4。


出货时间 预计2026年下半年发货。


1.4 个人AI超级计算机

DGX Spark 采用GB10芯片,售价3000美元,大小与 Mac Mini 相当,能够提供每秒1000万亿次的AI运算。


DGX Statio 采用最新的GB300芯片,拥有784GB的相干内存空间和800Gb/s的网络速度。


二、软件开源

2.1 NVIDIA Dyamo

这是一个用于加速AI模型推理的分布式推理服务库,能够将DeepSeek-R1的吞吐量提升30倍。


2.2 Llama Nemotron

新的AI推理模型,基于开源Llama基础模型构建,优化了计算效率和准确性。


三、其他进展


3.1 自动驾驶


英伟达与通用汽车达成合作,将使用英伟达的AI技术开发自动驾驶系统。


3.2 人形机器人

推出Isaac GR00T N1,全球首个开源的、完全可定制的人形机器人基础模型。


这些发布和进展展示了英伟达在AI芯片和相关技术领域的强大实力和持续创新能力。

公号👇发消息“ 我来了 ”,可直接领取 “10G+自动驾驶相关资料”

联 系 & 声 明

进交流群

号主六耳
知识星球
声明:除文内特殊声明外,本公众号内所有文章编写或转载的目的仅用于学习和交流,不予以商用,不代表本号观点及立场。本公众号内资讯及正文引用图片均由个人公众号 ADS 智库六耳基于官网或公开信息梳理或引用。本公众号所引用及转载内容版权均归原作者所有,凡是注明来源 “ XXX ADS 智库 ” 或作者为 “ XXX 六耳、XXX ADS 智库 ” 的文章转载或引用时请注明来源 ADS 智库。若有版权或其他任何问题请联系六耳( 微信号:adas_miao ),本号将及时处理。


转发、点赞、在看
,安排一下?







请到「今天看啥」查看全文