专栏名称: 企业存储技术
企业存储、服务器、SSD、灾备等领域技术分享,交流 | @唐僧_huangliang (新浪微博 )
目录
相关文章推荐
51好读  ›  专栏  ›  企业存储技术

Dell PowerEdge R740xd解析:服务器只看参数那就错了

企业存储技术  · 公众号  ·  · 2017-07-14 08:39

正文

请到「今天看啥」查看全文


本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博ID:唐僧_huangliang,以便更好地与读者互动。


昨天写了《 Dell PowerEdge R940 解析:四路顶配服务器维护平民化 》,今天继续。

对于 R7x0 这样的 2U 主力服务器机型,说实话我觉得不是特别好写。一方面不如四路有特点,另外又是互联网等行业消耗最多的,可以说乃服务器厂商必争之地。正如业内同行所言,比较有追求的厂商在某些功能参数上如果落后领先者一代,因为只要你愿意投入下一代产品就可能追上。


不过,指标归指标、品质归品质。服务器的 R.A.S. (可靠性、可用性、可维护性)才是更重要的实力体现 。关于 13G PowerEdgeR730 的品质,多听听用户端的口碑就好,不需要我在这里主观评论什么。

支持 3/6 块共 900W GPU PCIe 散热设计非易事


今天介绍这台 R740xd 样机,前面板是 2U 12 3.5 英寸盘位的布局。


在机箱 后端选配了 2 3.5 英寸 热插拔驱动器位,当然该机型还有更多灵活的选择。


还是看机箱上盖内侧的贴纸说明,最上面的配置是除了 NDC (网卡模块)之外 7 个全高 PCIe 扩展槽;

往下是前端配 12 3.5 英寸盘( 0-11 ),后背 4 2.5 英寸盘位;

如果前端换成 24 2.5 寸硬盘 /SSD ,后面再加上 4 个就是 28 块。当然机箱中部还可以有( +4 ),这个我在下文中会介绍;

如果都是 3.5 寸盘, R740xd 前后端一共是 12+2 的配置,同样可以在机箱中部加盘( +4 )。

这里我想特别提一下 GPU 支持,因为好几位朋友都问到我 R740 xd 支持 3 300W 双插槽 GPU 的事情。据我了解, Dell 可能不是第一家做到这点的,但要做到解决好散热却不太容易。


上图引用自技术文档《 Direct from Development –PowerEdge Multi-Vector Cooling 》,应该代表了 R740 系列服务器 7 PCIe 扩展槽可以支持最大的散热气流量 LFM 单位表示线性英尺每分钟。一般负载下风扇不需要全速运转,可以根据对应位置的传感器温度值来做精细调节。


PowerEdge 14G 服务器同步更新的 iDRAC9 管理界面中, PCIe Airflow 设置 部分可以识别扩展卡是否为第三方、类型( FC HBA RAID 或者 SSD )。对于 第三方 PCIe 扩展卡 Dell 可能识别不准其功耗,如果自动的 200LFM 风量不够合适, 也可以手动调节 。最终都会反应到 6 个系统风扇的转速上。

注:根据 690LFM 支撑 150W GPU 来推算, 200LFM 大约能支持 40 多瓦功耗的 PCIe 扩展卡,如果 20W 以内改到 100LFM 应该问题不大。我这么算也可能不准:)


拆下来的风扇排。从这个角度还可以看到 PowerEdge R740xd SAS 背板,上面带热管散热片的就是 Expander 芯片。由于 R740xd 还可以支持 最多 24 2.5 英寸 U.2 NVMe SSD ,所以可选不同的热插拔背板。

NVDIMM :电池保护、 Oracle 数据库和 SDS 应用


PowerEdge R740 服务器支持 12 NVDIMM ,虽然这台样机没有配,不过从这张图上可以看出对应电池模块固定的位置。如果想从平面变成三维理解,可以接着往下看。


7 12 日的 PowerEdge 14G 发布会上, Dell 列举了 2 家合作伙伴在应用中测试 NVDIMM 的价值,其中一家是大名鼎鼎的 Oracle 服务商云和恩墨。上图中列举的是 NVDIMM Redo log 性能提高 20 ,对比平台配置信息没有详细讲。

NVDIMM 就是 DRAM 内存的性能,受限于 Backupto Flash 掉电保护设计,目前容量应该在单条 8-32GB 之间。如果想兼顾性能(低延时)和容量,使用 3D XPoint Memory Intel Optane SSD P4800X 375GB 表现也不错,参见《 Optane P4800X 评测 (2) Oracle 170 TPM 意味着什么? 》一文。

另一家合作伙伴是 XSKY ,也是 Dell 发起的“未来就绪企业云联盟”成员,我在《 NVMeF 的另一种用法:连接 AFA 控制器和 JBOF 》中曾经提到过两家公司的共同案例。本次介绍了将 PMEM (持久化内存) 用于 Ceph Journal 存储,延时可降低 7

此外,这个方案中还用到了 PowerEdge 14G 服务器的 25GbE 网卡, iWARP RDMA 支持可以减少 CPU 负担、降低存储网络延时。

打开上盖的 Dell PowerEdge R740xd

机箱内部驱动器托架、 PERC NDC

上面就是 R740xd 机箱中部的驱动器托架,看着和上一代 R730xd 差别不大,主要变化应该是支持 2.5 英寸转换套件 。由于这里的视角是从机箱后端看,所以最左边那个盘位应该就是和 NVDIMM 电池共用的。

加上这 4 个盘位, R740xd 支持的最大 3.5 英寸硬盘可达 18 块, 2.5 寸驱动器最多 32 个。

上图是拆下的机箱后端那 2 3.5 英寸热插拔托架,分量够重可见钢板厚度。

也许有朋友会问,机箱后端能否设计更多的盘位?内部托架如果使用 2.5 寸盘可否支持更多?我认为这里要考虑 2 个问题,不一定最大就好:

1、 硬盘控制器 SAS RAID 卡、 HBA )、 扩展器支持的端口数量 。比如 48 SAS Expander ,如果支持双 RAID 卡上行占据 16 lane ,剩下正好是 32 盘位;

2、 散热、散热、散热 ,重要的事情讲三遍。因为机箱内部和后端的硬盘 /SSD 进风温度没有前面板那么乐观,这个和 GPU 支持是同样的道理。

我拆下其中一颗 CPU 的散热器,下面露出 LGA-3647 插座。

Dell PERC SAS/SATA RAID 卡模块的样子没有变, 14G 服务器除了 PERC9 还可选新一代 PERC10 H740p H840 Cache 容量可以更大。

为什么还用电池而不是电容,理由参见《 炉石传说数据库损坏:这锅 RAID 卡电池背吗? 》。

Dell 服务器专用的 NDC 网络子卡模块,这里同样配置了 Broadcom 10G/GbE 2+2P 57800-t rNDC 。大家还记得上一篇中它在 PowerEdge R940 中是怎么转成竖插 的吗?

细心的朋友可能看到了它—— IDSDM Dual-SD 模块插在 NDC 和电源之间的主板边缘位置。

今天先写到这里吧,下周有时间继续给大家分享别的 Xeon Scalable 服务器。

参考资料

Direct from Development – PowerEdge Multi-Vector Cooling http://en.community.dell.com/techcenter/extras/m/white_papers/20444244

:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流 技术 可以 加我的 QQ/ 微信: 490834312 。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)


尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号: huangliang_storage


长按二维码可直接识别关注

历史文章汇总 (传送门): http://chuansong.me/account/huangliang_storage

点击下方“阅读原文”,查看更多历史文章
↓↓↓






请到「今天看啥」查看全文