专栏名称: 企业存储技术
企业存储、服务器、SSD、灾备等领域技术分享,交流 | @唐僧_huangliang (新浪微博 )
目录
相关文章推荐
51好读  ›  专栏  ›  企业存储技术

调整峰值性能70WT解读:4090 D、AI PC真会受限吗?

企业存储技术  · 公众号  ·  · 2024-04-03 09:36

正文

摘要: “Adjusted Peak Performance” (“APP”) exceeding 70 Weighted TeraFLOPS (WT),这里的单位应该是针对FP64双精度浮点。也就是针对HPC高性能计算。

背景参考《 NVIDIA AI性能计算更正:为什么RTX 4090抢购,而工作站A6000相对乐观?

我本来还是 不太想 蹭这个热点 但这几 天陆续有同事问我。 查阅资料之后, 发现 近几天 网上看到的 新闻可能有误读 所以就把我理解的信息跟大家分享一下。

首先是这份 “主禁令” 的更新:编号没有变还是RIN 0694-AI94,日期更新为,日期更新为240321。接着看下面这条新闻中写的:

对于“Adjusted Peak Performance” (“APP”) exceeding 70 Weighted TeraFLOPS (WT),该新闻里的理解是“似乎”与FP16/FP32或TF32有关,真的是这样吗?

我又把去年[Docket No. 231013-0248]那个版本的 RIN 0694-AI94文档翻出来,其中也提到了70 WT,写着“29 Weighted TeraFLOPS (WT) 的限制快要被提高到70 WT”。——这段描述在最新的[Docket No. 240321-0084]文档中没有了,余下关于3A090、4A003的描述我并没有看出区别。

剩下的焦点,就是70 WT指的是什么计算类型(浮点精度)?

我找了一份在3月13日更新的Commerce Control List(CCL4)文档,里面提到了APP指的是64位浮点操作。还提到了一个计算中的系数,“针对“vector processors”(矢量处理器),Wi=0.9;针对非矢量处理器,Wi=0.3”。







请到「今天看啥」查看全文


推荐文章
经典短篇阅读小组  ·  博学的乐趣是专门为失败者准备的
7 年前
房地产投资融资俱乐部  ·  本轮炒房运动真的结束了!我们需要前所未有的耐心
7 年前
全球见证分享网  ·  生命诗歌|我要看见
7 年前