AMD在本届CES展上终于正式放出VEGA显卡的细节信息,作为Polaris的继任者,采用全新架构的VEGA显卡据传将具备能够与NVIDIA旗舰级显卡相抗衡的性能。自从AMD在2011年公布全新的GCN架构以来,经历了4代版本的更替,GCN架构终于迎来了重大变革,CU单元正式升级为NCU,全新的显存架构和次级缓存系统让核心能以更高的效率工作,第二代HBM内存继承了HBM一代的高显存带宽,储存能力也在HBM一代的基础上提高了8倍。
Vega的诞生据Polaris的发布仅仅过去了半年,虽然时间很短,但变化却非常大,可以说是GCN自诞生以来最大的一次变化。Vega的设计理念来源于如今的GPU架构已经不能很高效地处理大量的数据和负载需求,尤其是显存架构远远跟不上GPU计算性能提升的脚步,因此对显存架构的改进迫在眉睫。
新老显存架构对比
因此,AMD设计出了号称世界上最具扩展性的架构,彻底更改了GPU同显存间的数据传输方式,为的正是可以高效地处理大量数据。那么这些变化究竟体现在哪些方面呢?首先要提的就是全新的HBM2超大带宽显存。
HBM2显存
第二代高带宽显存HBM2的单位带宽是第一代HBM的2倍,达到了2Gbps/pin,堆叠容量则是高达8倍,为8GB,占用面积相比GDDR5显存降低了50%。
HBCC控制器
为了更好地发挥HBM2显存的优势,在Vega中,AMD加入了高带宽缓存控制器(HBCC),该控制器用来管理HBM2、系统内存、非易失性内存和网络存储。HBCC的最大虚拟寻址空间高达512 TB,可以适应并管理超大数据集,并可精细调节数据的转移。以游戏为例,《巫师3》和《辐射4》的显存占用很高,但其中只有一小半是充分利用的,说明现阶段显卡架构对现存的利用效率很不理想。
新的可编程几何管线
Vega拥有全新可编程几何管线,每时钟周期峰值吞吐量为之前的2倍。
原始着色器
同时,Vega的几何引擎还加入了原始着色器,和顶点着色器、几何着色器并行,提供更高的图形渲染效率。
改进的负载均衡
架构的负载均衡也得到了改进,Vega通过智能工作组分配器高效率地为计算引擎、几何引擎、像素引擎分派不同的任务负载,让负载更平衡,引擎渲染效率更高。
下一代计算引擎
2个FP16可以打包成1个FP32处理
接下来要说的就是整个Vega中最大的改变——NCU计算单元。下一代计算单元(NCU)是GCN架构引入以来最大规模的底层革新,每时钟周期可以处理512个8位、256个16位或者128个32位操作,尤其是可以在单个FP32 ALU内处理一对FP16浮点操作,如果两个FP16操作彼此兼容的话,就可以打包到一起作为FP32进行处理,由此带动峰值吞吐能力的翻倍。同时,寄存器还可以把一个FP32拆分成两个FP16,进行反向操作。
NCU对比CU
Vega NCU单元针对高频率、高IPC都进行了优化,可以同时进行计算和图形处理,并且能够根据负载不同而变换SIMD单元宽度,以往需要多个计算单元才能完成的任务,现在只需一个就能搞定,不会造成GPU性能上的浪费。AMD多年来一直致力于减少显存带宽的浪费,NCU的推出正是为此。
下一代像素引擎
流式传输光栅器
后端渲染统一交由L2缓存处理
最后我们要说的是下一代像素引擎。流式传输光栅器的应用可以大大提高能耗比,其原理是剔除无效像素,在高速缓存内更智能地执行原始光栅化。此外,一改之前架构像素及纹理访问不一致的情况,将后端渲染全部交由L2缓存处理,这样的延迟渲染可以避免多次渲染同一个像素,降低信息处理量,变相提高GPU性能。
Vega的四大特点
以上就是Vega显卡架构的四大特点,总结起来就是革命性的高带宽缓存、新的可编程几何管线、下一代计算单元以及更先进的像素引擎。和Polaris相比,Vega带来8倍的显存提升、4倍的能耗节约、2倍的每pin带宽提升以及2倍的峰值吞吐量,真可谓是巨大的提升。
Vega芯片设计
从前期曝光的这些信息来看,Vega毫无疑问是目前最先进的芯片架构之一,而AMD在展馆展示的搭载Vega显卡的DEMO机在游戏帧数上的确不输GTX 1080,就让我们期待即将发布的Vega游戏卡吧,相信Vega也可以像Polaris一样,让业界沸腾,并接过Polaris手中的“红色复兴”大旗。