专栏名称: 电子发烧友网
关注电子发烧友网,即时收听电子行业动态,抢先知晓半导体行业发生的最新事件。
目录
相关文章推荐
EETOP  ·  英特尔的创新是如何消亡的? ·  昨天  
石油地质学  ·  Geosciences/Processes/ ... ·  昨天  
石油地质学  ·  Geosciences/Processes/ ... ·  昨天  
哎咆科技  ·  苹果:5 大重磅新品来了,666 ·  3 天前  
51好读  ›  专栏  ›  电子发烧友网

强悍的AWS Graviton4处理器及其背后的Arm Neoverse

电子发烧友网  · 公众号  · 硬件 科技自媒体  · 2024-12-19 07:00

正文

电子发烧友网报道(文/吴子鹏)在今年的亚马逊re:Invent 2024大会上,该公司正式对外发布了旗下第四代自研Arm芯片——Graviton4。作为目前最强大的Graviton处理器,Graviton4相较于上一代产品带来了巨大的性能提升。同时,为Graviton4赋能的Arm Neoverse也跟着受到了更多的关注。

强悍的Graviton4处理器

据介绍,Graviton4处理器每个核心都能提供比上代强30%的性能,vGPU数量和内存容量也是上一代的3倍,能将处理大型Java应用的速度提升45%,可以为企业提供更低成本和高效的高性能计算解决方案。
除了内核性能的提升,亚马逊还着重提升了Graviton4处理器的存储性能,首次创建了双插槽NUMA内存集群。Graviton4处理器配备了高达1.5 TB的DDR5主内存,运行频率为5.6 GHz,提供12个内存通道。与之相比,上一代Graviton 3处理器使用了4.8 GHz主频的DDR5内存,只有8个内存通道。并且,单个Graviton4处理器的内存插槽就可以提供537.6 GB/秒的带宽,能够轻松应对HPC负载。
此前,亚马逊针对Graviton4处理器发布过一些测试实例,通过这些实例体现了这颗处理器强大的性能。比如,基于Graviton4处理器构建UE5 Dedicated Server,据亚马逊的说法,最新的Graviton 4实例是迄今为止亚马逊为各种workload设计的最强大并且最高效节能的CPU。Graviton 4的实例R8g相较于Graviton 3的实例R7g有大约30%的性能提升。实例R8g压测使用Lyra Starter Game项目,通过增加AI Bot和GameClient的方式来增加Dedicated Server(简称DS)的负载,通过对比不同机型以及不同参数编译出的DS在server full的情况下的CPU使用率和帧率(FPS)来对比性能。
结果显示,Graviton 4的实例在UE Dedicated Server应用场景下:
  • 相较于Graviton 3有约 25+%的性价比提升(均使用优化参数编译);
  • 相较于Intel Sapphire Rapids和AMD Genoa有30%~35%的性价比提升;
  • 使用Graviton针对C/C++的优化参数来编译Dedicated Server对性能提升约10%~25%。

根据外媒的测试,在相同的vCPU数量下,新的Graviton4处理器内核大致与Intel Sapphire Rapids性能相当,同时能够与AMD EPYC“Genoa”相媲美,并始终表现出极佳的代际提升。这都离不开Arm Neoverse的赋能。

Graviton4 处理器背后的Arm Neoverse

Graviton4 处理器基于Arm Neoverse V2平台,这颗核心发布于2022年9月。Neoverse V2和Neoverse E2都是Arm公司内部代号“Demeter”项目下的产品,Arm Neoverse V2平台涵盖Armv9架构的新特性,包括高性能浮点和向量指令支持,以及SVE/SVE2、Bfloat16和INT8 MatMul等特性。这些特性为AI/机器学习 (ML) 以及高性能计算 (HPC) 工作负载提供了卓越性能。
根据Arm官方的介绍信息,得益于全面增强的核心性能、内存带宽和高达两倍的L2缓存大小(每核2MB),Neoverse V2可以在云和ML应用程序上提供两倍于Neoverse V1的性能。根据Arm工程团队实际运行EDA工作负载所得出的结果,Graviton4 提供的RTL仿真工作负载性能比Graviton3高出 37%。同时,Neoverse V2具有出色的平台扩展性,当与新的CMN-700核心网状网络配对时,Neoverse V2 CPU可以配置多达256个内核和512MB的系统级缓存(SLC)。AMBA CHI C2C使用UCIe、CXL、PCIe或自定义PHY来连接计算、内存和加速器,实现高效、高速的芯片连接。
看过Graviton4处理器的性能之后,人们对下一代Arm服务器会更加期待,这些产品将搭载最新的Neoverse V3。2024年2月,Arm宣布推出新一代 Arm Neoverse技术,Neoverse CSS V3则是V系列芯片IP的首款Neoverse CSS产品,单芯片性能可提高50%。官方的资料显示,全新的Neoverse CCS V3 核心基于64核的Neoverse V3 核心,拥有6个DDR5 内存控制器、4个 I/O 控制器和两个芯片间互连,并支持PCIe Gen5和CXL3.0。通过芯片间互联,可以升级至128核。相对于此前的 Neoverse CSS N2,其单芯片性能可提高50%。
除了核心的提升,Arm将继续投入并进一步强化软件生态系统,从而使开发者能够更加轻松地在 Arm平台上构建其应用,并充分利用 Arm计算平台所提供的卓越性能和效率优势。

结语

亚马逊Graviton4处理器是Arm处理器历史上的一次巨大成功,性能全面对标x86处理器当前的旗舰产品。在Graviton4处理器背后,Neoverse V2内核起到了巨大的赋能作用,这让产业界对于下一代基于Neoverse CCS V3 核心的Arm处理器更加期待。

声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱[email protected]


更多热点文章阅读



点击关注 星标我们



将我们设为星标,不错过每一次更新!

喜欢就奖励一个“在看”吧!