在《风冷500W CPU?Dell PowerEdge 17G AMD服务器预览 (1)》一文中,我提到过现在2U双路服务器已经能支持风冷500W CPU,1U双路支持到400W。最近又看到另一款机型的资料,让我产生了更多的联想…
上图为某1U单路服务器的CPU散热器,是不是比传统的面积更大了?具体用在哪款机型下文中我会交代。
机架每U风冷散热极限多少瓦?
大家还记得3年多前我讨论过的《1U双路风冷350W?点评方升服务器散热设计》吗?由于今天CPU已经发展到500W,风冷技术又卷了一点,但毕竟还是有局限的。
这里拿NVIDIA的DGX B200做个参照。8颗GPU为了风冷,已经提高到10U机箱。整个系统最大估计功耗达到14.3kW,相当于平均每Rack U要能散出的热量为1430W。
这样来看,1U风冷服务器的电源1500W也就差不多了。而更高密度的机型,比如像Dell的M7725 1OU 2节点双路EPYC 9005机型,还有我在一周前提到的浪潮2U 4节点双路500W CPU高密度服务器(4个2700/3200W电源模块,相当于每个U至少有2700W 1+1),都是引入了液冷。
关于风冷2x 400W CPU的1U双路服务器,由于Dell R6725没有看到详细资料,下面我先参考下HPE DL365 Gen11的结构:
HP
ProLiant DL365 Gen11支持不超过400W的AMD
EPYC 9004/9005两代CPU,包括Classic经典大核心和Dense高密度核心。
上图的CPU散热器是流行的“双向展翅”设计,DL365 Gen11除了风冷也能支持液冷。
冷板液冷配置的DL365 Gen11参考图
在HP的QuickSpec文档中,提到了在某些SSD存储配置下,如果CPU超出320W,必须选择DLC液冷。
看完这些我在想:既然风冷能有限支持到2颗400W CPU,要是1U单路500W可行吗?
如上图:我还参考了ASUS(华硕)的RS520QA
E13 RS8U服务器,2U 4节点单路400W CPU风冷的设计。折算下来也是每Rack U 800W的CPU总功耗。但我们并不能以这个数字来判断风冷单路CPU功率的极限,因为发热单元与散热片接触的区域和面积也是不同的。
PowerEdge R470单路服务器的启示
本文开头列出的散热器图片,就是来自Dell R470。如果看对应的数字系列命名,这之前的Dell服务器还是15G里面双CPU的R450。不过在第 3 代英特尔至强可扩展处理器时期核心数较少,再加上机型定位的原因,R450也没有支持R650系列那些高端CPU,所以如今干脆用1颗Xeon 6E来换代了。
R470支持最多144个Xeon 6 E-Core(能效核,或称小核,没有HT超线程)——与之前发布的R670、R770
CSP都采用同样的CPU Socket,R470区别在于单路。88 lane PCIe 5.0是指CPU支持的理论值,毕竟1U服务器用不到这么多。
如上表,看来Dell还是对R470做了限制,是不是与“大核”无缘了?因为R670和R770都没有这样写——之前发布的2款服务器,后续应该有机会支持Xeon 6700及以下的P-series CPU。
这里我尝试着帮Dell解释下:上一代16G服务器并不是完全取消了低端的“R460”,而是将其改为R660xs;类似的还有顶替R560的R760xs机型。从最近的新闻来看,17G这一代R470和R570型号又恢复了。
参考链接 https://www.dell.com/en-us/blog/dell-poweredge-servers-unmatched-performance-and-energy-efficiency/
PowerEdge
R470也是可选Front I/O前出线,或者传统的Rear I/O
上图主要吸引到我的地方,就是位置偏左的CPU Socket,关键是上面的散热器形状(还记得本文开头那张图吗?)。
在ark.intel.com网站上,目前已经发布的Xeon 6处理器,67xxE“小核”最高功耗只到330W;而400-500W TDP的69xxP“大核”系列,需要搭配尺寸较大的CPU插座,在主板方面无法与当前已发布的Dell 17G服务器通用。
如我在之前文章中交待的,Xeon 6产品线中的更多型号系列,要晚一些才能发布。
Remote HSK风冷散热器提升几何?
在35℃进风温度下支持到330W CPU,如果降到30℃就会有进一步的余地。类似地,既然1U双CPU都能做到风冷400W,理论上单CPU应该可以做到更高TDP。
Dell给这种新的CPU散热器命名为Remote HSK。我感觉按照它的设计思路,还有进一步发挥的空间吧?
在PowerEdge
R470主板上,为Remote HSK散热器专门留出的空位
Remote HSK的散热面积,应该还达不到传统散热器的2倍。上文我还提到过只从1颗CPU吸热的问题,以及热管的传热效率等,使它无法达到让风冷散热效果翻番。不过相比当前的400W CPU散热器,Remote HSK提高25%支持到500W还是有可能吧?
关于风冷(单路)1U 500W和2U
600W+的猜想
单路服务器的CPU散热器尺寸,有机会做得比双路服务器更大些。这个理论没错吧?
上图引用自Dell PowerEdge R6615 1U服务器的文档。它的CPU在主板上也是偏左,并且是12个内存通道2 DPC一共24 DIMM插槽的最大内存设计。
红线区域是我假想出来的——如果在R6615机型基础上改进,也引入Remote HSK散热器设计,有没有可能支持风冷单路500W的EPYC 9005 CPU呢?(前提是主板VR供电没有限制)
进一步讨论,如果在2U服务器上也采用类似的Remote HSK散热器(同样针对单路),风冷的CPU支持能力可否从现在的500W提升到600W+?
当然,我清楚当前R6715和R7715服务器CPU只支持到280W不是技术原因,而应该是市场策略——这个就超出了我的评论范围。我只负责yy技术:)
扩展阅读:《企业存储技术》文章分类索引更新(微信公众号合集标签)
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。进一步交流,可以加我的微信:490834312。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage
长按二维码可直接识别关注
历史文章汇总:http://www.toutiao.com/c/user/5821930387/
http://www.zhihu.com/column/huangliang