专栏名称: 企事录
企事录为您分析点评企业IT和互联网基础设施及架构方面值得关注的话题,把握行业热点,看清产业趋势。
目录
相关文章推荐
电商报Pro  ·  拼多多Temu拿下全球第一 ·  昨天  
JP欧洲跨境服务  ·  135个店铺被匿名起诉,这100+版权商标专 ... ·  昨天  
蛋先生工作室  ·  最新淘汰鸡行情 ·  昨天  
大数跨境  ·  Tokopedia-印尼第二大电商平台,月访 ... ·  3 天前  
51好读  ›  专栏  ›  企事录

揭秘高端服务器设计:一套机框搞定四路与八路

企事录  · 公众号  ·  · 2018-02-08 08:20

正文

四路服务器能干什么?必须是关键业务啊,毕竟单一强计算的主机一直都是供不应求的存在。什么?你说BAT都爱用双路的便宜服务器!你说的很对,肯定是业内人士,BAT只用双路服务器的主要原因是四路的服务器太贵了,而且BAT有海量的程序员和强悍的数据中心运维团队,服务器在他们手里出点问题很正常,全面云化的数据中心环境下甚至不需要去维修故障。可是对于传统非IT属性的行业用户来说,服务器要出点故障那是天大的事情,这年头谁家网站宕机都是大事,更别说关键业务停机了。

因此四路服务器一直在RAS(可靠性、可用性、服务性)特性上远超双路服务器,它们用的处理器不一样,设计和用料也不同,因此在可靠性、稳定性和安全性上大为不同。

不过显然现在新一代的四路服务器和之前的不太一样了,企事录在分析英特尔的Skylake SP处理器平台的时候介绍过,传送门《 8张图速览新至强:Skylake架构、外貌与型号 》。

新一代的处理器取消了Xeon E7和E5家族,统一称为Xeon SP(可扩展处理器家族),虽然使用了贵金属白金、黄金来对应Xeon E7平台(只有8字头和6字头的可以组成MESH架构的四路计算平台),用白银、青铜来呼应低端Xeon E5,但是显然用户不会这么看,毕竟除了数字型号的不同,连LGA 3647的插座都是一样的。

的确,英特尔这次的Skylake SP家族不但让用户在选择的时候会产生迷惑,就连各家服务器厂商也在推出新品的时候纷纷Delay。于是乎,目前真正上市的Skylake的四路x86服务器只有几个老牌的服务器品牌。

并购了IBM System x服务器的联想凭借x的研发力量,成为市场上率先推出八路和四路高端Skylake SP家族服务器的厂商。而更为神奇的是——四路和八路的产品型号都是SR950,相比上一代的八路服务器System x3950 X6,这一代的SR950的采用了4U高度的机箱设计,在计算密度高于上一代服务器。如果不看小型号,无法从外表分别SR950是四路还是八路。同样的机箱架构也解决了四路和八路服务器共享机箱、扩展仓、磁盘仓等部件的问题,有效降低了模具设计的成本。可以这么说——SR950在一套优秀的服务器平台下,解决了八路or 四路的选择问题。

四路服务器是均衡的典范

英特尔官方的四路MESH架构图

在服务器领域,多颗处理器并行是有效提升计算性能的方法,特别是在单一处理器在提升主频或增加计算核心数量都已经遇到强大的阻力的时代,如何将多颗处理器的计算性能更好的攒到一起用就成为各家服务器厂商研发设计的主要目标了。

为什么不提升主频?

服务器处理器在十几年前就已经摸到3GHz主频了,但是单纯提升主频就会增加系统的不稳定性,还会增加大量的额外功耗。虽然在台式机领域有4.0GHz的处理器可选,但是在服务器领域的主流处理器还都停留在3GHz以下的水平。相比系统的稳定性和可靠性,处理器主频的高低还是要向后排的。不过英特尔并没有放弃高主频的计算优势,它用睿频的方式来满足用户对高主频的需求(可以将少量核心的主频提升到接近4.0GHz 的水平),好在用户也不是随时都需要那么高的主频来处理应用,因此睿频是处理器主频不能进一步上升环境下的最佳解决方案了。

为什么不增加更多的计算核心?

从双核处理器到今天28核处理器,15年间,单颗处理器里的计算核心增加了14倍,而且每一个计算核心的性能都可以PK掉上一代的单核性能(同主频下),这貌似是增加处理器性能的一个捷径,可惜的是每一个强大的计算核心都是功耗的大户,最初双核Xeon的典型功耗40W/核心,今天单核功耗仅有7.32W/核心,足足降了5倍之多,但是受于单颗处理器的TDP散热的限制,还是不能无限制的增加计算核心的数量。早期的双核Xeon只需要不到100W的散热,而今天的Xeon-8180已经需要205W的散热了。

题外话:虽然超频不是服务器领域的话题,但是从超频可以看出提升主频会对散热带来什么影响——桌面级的i9处理器提升到5GHz是可以做到的,但是需要满足500W以上的散热环境(通常使用液氮),还需要高达350A以上的供电需求,这显然不是今天计算平台能够随便满足的条件。对于服务器而言,虽然一些大型互联网用户开始小规模使用服务器处理器锁定Turbo的模式来压榨计算性能,但是对于超越睿频的设定,在服务器领域还是别想了。

服务器要提升单机的性能,剩下的唯一道路就是怎么把多颗处理器串在一起使用了。这点我们在之前介绍联想SR950 八路服务器的时候已经有过详细的介绍,英特尔已经把架构设计好了,具体怎么实现就看各个服务器厂商的神通了。

SR950的系统板

这是联想SR950的系统板解析图,每块系统板上都安装了两颗处理器。四路有两块这样的系统板,而八路则有4块这样的系统板。

在ITIC《全球服务器硬件可靠性报告》中,联想的服务器一直都占据着领先地位,原因很简单,可靠性是靠设计实现的。在联想的System X6服务器架构中有一个和其他品牌不同的设计就是服务器中板,它承担着互联系统板和扩展板的重要作用;而其他的四路服务器则大多采用大平板主板的设计,4颗处理器分布在一块硕大的主板上,因此留给内存、散热的空间都相当有限。也正是因为采用了中板设计,因此在Xeon SP家族发布后,联想的SR950成为四路/八路服务器的产品中,唯一一个在4U机箱内实现四路/八路服务器两套架构的产品。

什么是服务器中板?

下图就是联想SR950的中板示意图,承载着两颗处理器+24根DIMM槽的系统板就对接在中板上,多块系统板就依靠不同的中板来实现四路的MESH互联或者八路的RING互联。

中板为服务器带来什么?

多颗处理器间的互联依靠的是UPI高速总线,新一代Xeon SP家族的UPI总线达到了10.4GT/s,如果没有可靠的互联方式,很难保证服务器的长期稳定工作。而处理器提供的数十条PCIe总线也需要由中板桥接到背部IO扩展仓或者磁盘仓,因此中板是一个高速I/O通道的交汇中心,就像高速公路的交叉口一样,(中板)交互式立交桥就能显著提升车辆通过的能力。

中板对Xeon SP处理器的NUMA一致性有非常重要的作用,通过中板互联的方式,多颗处理期间的UPI总线可以确保时序和延时的一致性,对处理大型关键业务时的RAS特性有极大的帮助。







请到「今天看啥」查看全文