企事录实验室最近刷新了一项测试记录,基于Dell 14G服务器主力PowerEdge R740xd平台,构建的Oracle数据库性能突破了200万TPM,平均TPM达到240万,峰值TPM超过270万,逼近300万。仅凭一台双路服务器,要获得如此高的性能,是很难得的。
每秒在线事务处理量(TPS)峰值超过5万,峰值TPM(每分钟在线事务处理量)逼近300万,而平均响应时间仅为3ms,各项曲线都非常平滑,意味着整个Oracle数据库平台运行平稳。
需要说明的是,这台R740xd配备了384GB DDR4-2666内存,为了避免大内存容量造成Oracle数据库性能“虚高”,企事录实验室特意调小了Oracle可用的内存容量(SGA约为64GB),从上图的“Disk IO”曲线也可看出,这是Oracle数据库落(SSD)盘后的性能,Disk IO中有两种颜色的曲线,其中橙棕色表示读IO,深蓝色表示写IO,读写比例约为3:1。
对于以Oracle数据库为代表的关键业务应用而言,性能高且平稳保持,必须要满足两大条件:
企事录实验室曾利用NVMe SSD在四路服务器,或者多台(四路)服务器组成的Oracle RAC环境中,获得过更高的Oracle数据库性能。但在双路至强(Xeon)服务器上,却很难突破200万TPM,即便使用的是相同的NVMe SSD,其原因就在于服务器的计算性能终归有限,之前的双路处理器无法提供更高的计算能力。
提高处理器性能有两种做法:高主频和多内核
。高主频会带来处理器的TDP(Thermal Design Power,热设计功耗)指数上升,相比高主频,多核设计更适合服务器领域。但是这些变化都意味着处理器需要更高的TDP来支持,
TDP的提升意味着还要解决另外一个问题——散热
。对于部署在数据中心里的服务器而言,风冷是目前最普遍的手段,如何优化散热效率则是服务器能具备更高性能的关键因素。
对于销量最大的2U双路机架式服务器而言,散热设计显得尤为重要。2U的机箱高度限制了使用更大口径散热风扇的可能;其次,由于高性能的设备越来越多,例如NVMe SSD广泛应用、GPU大量进驻服务器……相应的服务器电源功率也从早期不到1000W攀升到2000W级别,如何实现更高的散热效率成为摆在服务器厂商面前的一个难题。。
散热问题在戴尔前几代服务器(比如13G的R730)中并没有如此严峻,其原因在于,英特尔最新一代的至强可扩展处理器(Xeon Scalable Processor,至强SP)在拥有更多内核、更多I/O之后,功耗显著提升——以顶配的至强白金版8180为例:
提供28个物理核心,默认主频就达到了2.5GHz ,睿频支持3.8GHz,TDP达到205W,比之前至强E5-2699 v4处理器的TDP(145W)提升了40%还多,双路服务器在处理器环节的散热就增加了120W。
即使是企事录测试的这台R740xd服务器中配置的黄金版6130处理器(约相当于上一代E5-2660 v4),单颗处理器功耗也从上一代的105W提升到现在的125W,双路服务器内仅CPU就增加了40W功耗。尽管CPU针脚和安装方式都有巨大的改变,但留给散热器的空间并没有增加,因此对散热片、风道的优化设计要求也就更高了。
除了CPU需要更好的散热之外,NVMe SSD相关高性能设备的加入,也变相提升了散热需求:
Dell PowerEdge R740xd内部组件,为了满足12个U.2 NVMe SSD全速工作的要求(工作在PCIe 3.0 x4),戴尔在R740xd内部的3个PCIe x16插槽上安装了三张PCIe扩展卡;新一代Skylake平台提供性能更高的25GbE网卡也已经成为14G的标识。这些板卡自身需要散热,而且还占据了服务器背部的散热空间
送测的这台R740xd服务器配置的
至强黄金6130处理器
,是面向主流市场的高端产品,而R740xd可以支持支持全系列的至强可扩展处理器,包括最高端的铂金81xx处理器,但散热器也要更换成相应的型号,以满足更高的散热需求。
考验来了:换用旗舰版的铂金8180处理器,服务器的整体性能将进一步飞跃,前提是服务器的散热跟得上——特别是不更换这两个为125W级别TDP设计的散热器?