专栏名称: 牛科技网
奉行科技娱乐化,以娱乐视角解读、八卦互联网圈。
目录
相关文章推荐
腾讯研究院  ·  腾讯研究院AI速递 20250206 ·  昨天  
新浪科技  ·  【#华为小艺助手接入DeepSeek#,此前 ... ·  昨天  
51好读  ›  专栏  ›  牛科技网

NVIDIA的一场豪赌 图灵架构光线追踪

牛科技网  · 公众号  · 科技媒体  · 2018-08-14 22:46

正文

北京时间8月14日早7点,在SIGGRPAH 2018上,NVIDIA公布了自己的最新显卡架构Turing,同时发布了首款基于Turing架构,并支持光线追踪的Quadro系列专业卡。目前,这张卡仅刚刚发布,并不知道这款Quadro系列的核心代号,但从NVIDIA公布的信息中依旧能管中窥豹。

大核心和GDDR6显存

Turing核心相比Pascal变大非常多,NVIDIA这里给出是与GP102(GTX TITAN XP P)的对比。整个核心的核心面积增大约60%,晶体管增加到18.6亿。

大核心有很多优点,例如散热好,布线方便。但有一个最大的缺点,良品率低。其原因是因为一块晶圆上切出的核心有限,大核心能切出的核心更少,而且其瑕疵几乎以伪平均出现时,大核心分到的瑕疵更多,自然报废的也更多。NVIDIA这次加大的核心面积,自然和其增加功能密不可分。

除了常规的视频解码升级,L2的改进之外。NVIDIA还在核心中放进了NVlink和RT core,并保留了Tensor core。RT core的主要用途是加速对于光线追踪的计算,它加速了一些主流的光线追踪算法 (ray-triangle intersection checks and bounding volume hierarchy) ,最快每秒可以投射100亿条光线,和前代未加速的Pascal相比,性能提高25%。

新的Quadro并没有继承Volta架构的HBM2显存,而是使用了三星最新量产的GDDR6颗粒,其中,RTX 8000使用2G颗粒,并达成了最高48G的容量,其正反使用了24个颗粒。

在三星的新闻稿中,GDDR6显存相比20nm的GDDR5容量翻倍,同时速度达到14Gbps,传输速度56GB/s,提升了75%速度。同时还降低了35%的功耗,GDDR6的电压仅需1.35V。

面积增大,换用显存之后,整颗核心的CUDA部分达到了16TF的性能,相较上一代Volta GV100提升约1TF,但核心面积有所缩小7.5%。功耗方面,NVIDIA给出的是225W,远低于预计,在没有公布制程的情况下并不知道到底是制程还是架构带来的福利。

Turing的架构常规升级还有8K HEVC解码、VirualLink和Type C输出的支持。其中Type C不仅支持DP 1.4标准的图像传输,还支持10Gbps的数据传输,让一些一线通显示设备不再尴尬。

光线追踪

光线追踪是这一次发布会的重点,也是这次Quadro系列改为RTX前缀的原因。

光线追踪的目的是为了提供整个画面中更加准确的光反射显示,它的思路是确定一条光线的路线,其光路和视觉角度相反,以此得出符合现实规律的光照和反射。

这项技术提出非常早,在很久以前的电影特效和渲染中就以得到广泛的使用。但由于其复杂的特性和运算量,无法实时渲染。在DX10 中,微软就添加了相应的接口,在性能的逐步增加之后,部分游戏开始使用,但依旧不是整个画面全局使用,而是一小部分。实时光线追踪核心的引入,能让整个游戏画面看起来更真实。

NVIDIA并没有详细公布其光线追踪的细节,对于整个仍未成熟的业界来说非常大胆,也可以说是NVIDIA的一场豪赌,赌的是自己技术能成为未来光线追踪的主流,并且还想打击自己的竞争对手AMD。NVIDIA能不能成功我们并不知道,但是其战争已经打响。

NVLINK

相对于AMD的无桥交火CrossFile技术,NVIDIA的SLI技术一直不占优势,首先是需要实体连接2张或以上的显卡,其次需要专门的SLI芯片,而且从效率上也远远低于对方,NVIDIA也由此推出自己的NV LINK。这项多GPU连接技术首发于NVIDIA的计算平台Tesla上,NVIDIA将其折半阉割之后下放到了Quadro平台中。

和目前其他的双卡技术不同,NVLINK的速度更快,即双卡之间的显存可以互相访问,基本可以认为两张卡可以算作为一张卡。传统的双卡技术则很难同步,在需要显示游戏时是以AB帧交替来渲染,如果一张卡渲染延迟稍高,那么性能就会有损失。

在新架构中,NVIDIA使用了统一内存,新的架构能直接访问CPU内存,提高了整体的能效,减少了数据传输带来的延迟。依靠NVlink,能实现CPU和GPU的缓存一致性。

NVlink的研发借由OpenPOWER Foundation,NVIDIA只是其中一员,NVlink的技术也非常开放,可以用于很多大规模高性能平台的互相桥接和连接,减少中间带来的损耗。

在大核心单芯片,目前工艺的瓶颈下,NVIDIA选择重回双卡是不得以而为止。据传NVIDIA已经将其下放到Geforce系列,以将性能提高为4K 60Fps的准4k水平。未来,NVlink很有可能替代GPU到CPU的连接。

深度学习和游戏结合(DLAA/辅助光线追踪)







请到「今天看啥」查看全文