专栏名称: 企业存储技术
企业存储、服务器、SSD、灾备等领域技术分享,交流 | @唐僧_huangliang (新浪微博 )
目录
相关文章推荐
哎咆科技  ·  舔狗 ·  昨天  
ZOL中关村在线  ·  泰坦军团P245MS显示器评测:究极小屏之选 ·  3 天前  
ZOL中关村在线  ·  Win11史诗级更新!新功能终于来了 ·  4 天前  
51好读  ›  专栏  ›  企业存储技术

风冷散热极限:1U/2U服务器CPU 500/600W+可行性分析

企业存储技术  · 公众号  · 硬件  · 2024-12-15 08:30

正文

在《风冷500W CPU?Dell PowerEdge 17G AMD服务器预览 (1)》一文中,我提到过现在2U双路服务器已经能支持风冷500W CPU1U双路支持到400W。最近又看到另一款机型的资料,让我产生了更多的联想

上图为某1U单路服务器的CPU散热器,是不是比传统的面积更大了?具体用在哪款机型下文中我会交代。

机架每U风冷散热极限多少瓦?

大家还记得3年多前我讨论过的《1U双路风冷350W?点评方升服务器散热设计》吗?由于今天CPU已经发展到500W,风冷技术又卷了一点,但毕竟还是有局限的。

这里拿NVIDIADGX B200做个参照。8GPU为了风冷,已经提高到10U机箱。整个系统最大估计功耗达到14.3kW,相当于平均每Rack U要能散出的热量为1430W

这样来看,1U风冷服务器的电源1500W也就差不多了。而更高密度的机型,比如像Dell的M7725 1OU 2节点双路EPYC 9005机型,还有我在一周前提到的浪潮2U 4节点双路500W CPU高密度服务器(42700/3200W电源模块,相当于每个U至少有2700W 1+1),都是引入了液冷。

关于风冷2x 400W CPU1U双路服务器,由于Dell R6725没有看到详细资料,下面我先参考下HPE DL365 Gen11的结构:

HP ProLiant DL365 Gen11支持不超过400WAMD EPYC 9004/9005两代CPU,包括Classic经典大核心和Dense高密度核心。

上图的CPU散热器是流行的“双向展翅”设计,DL365 Gen11除了风冷也能支持液冷。

冷板液冷配置的DL365 Gen11参考图

HPQuickSpec文档中,提到了在某些SSD存储配置下,如果CPU超出320W,必须选择DLC液冷。

看完这些我在想:既然风冷能有限支持到2400W CPU,要是1U单路500W可行吗?

如上图:我还参考了ASUS(华硕)的RS520QA E13 RS8U服务器,2U 4节点单路400W CPU风冷的设计。折算下来也是每Rack U 800WCPU总功耗。但我们并不能以这个数字来判断风冷单路CPU功率的极限,因为发热单元与散热片接触的区域和面积也是不同的

PowerEdge R470单路服务器的启示

本文开头列出的散热器图片,就是来自Dell R470。如果看对应的数字系列命名,这之前的Dell服务器还是15G里面双CPUR450。不过在第 3 代英特尔至强可扩展处理器时期核心数较少,再加上机型定位的原因,R450也没有支持R650系列那些高端CPU,所以如今干脆用1Xeon 6E来换代了。

R470支持最多144Xeon 6 E-Core(能效核,或称小核,没有HT超线程)——与之前发布的R670R770 CSP都采用同样的CPU SocketR470区别在于单路。88 lane PCIe 5.0是指CPU支持的理论值,毕竟1U服务器用不到这么多。

如上表,看来Dell还是对R470做了限制,是不是与“大核”无缘了?因为R670R770都没有这样写——之前发布的2款服务器,后续应该有机会支持Xeon 6700及以下的P-series CPU

这里我尝试着帮Dell解释下:上一代16G服务器并不是完全取消了低端的“R460”,而是将其改为R660xs类似的还有顶替R560R760xs机型。从最近的新闻来看,17G这一代R470R570型号又恢复了

参考链接 https://www.dell.com/en-us/blog/dell-poweredge-servers-unmatched-performance-and-energy-efficiency/

PowerEdge R470也是可选Front I/O前出线,或者传统的Rear I/O

上图主要吸引到我的地方,就是位置偏左的CPU Socket,关键是上面的散热器形状(还记得本文开头那张图吗?)。

ark.intel.com网站上,目前已经发布的Xeon 6处理器,67xxE“小核”最高功耗只到330W400-500W TDP69xxP“大核”系列,需要搭配尺寸较大的CPU插座,在主板方面无法与当前已发布的Dell 17G服务器通用。

如我在之前文章中交待的,Xeon 6产品线中的更多型号系列,要晚一些才能发布。

Remote HSK风冷散热器提升几何?

35进风温度下支持到330W CPU,如果降到30就会有进一步的余地。类似地,既然1UCPU都能做到风冷400W,理论上单CPU应该可以做到更高TDP

Dell给这种新的CPU散热器命名为Remote HSK。我感觉按照它的设计思路,还有进一步发挥的空间吧?

PowerEdge R470主板上,为Remote HSK散热器专门留出的空位

Remote HSK的散热面积,应该还达不到传统散热器的2倍。上文我还提到过只从1CPU吸热的问题,以及热管的传热效率等,使它无法达到让风冷散热效果翻番。不过相比当前的400W CPU散热器,Remote HSK提高25%支持到500W还是有可能吧?

关于风冷(单路)1U 500W2U 600W+的猜想

单路服务器的CPU散热器尺寸,有机会做得比双路服务器更大些。这个理论没错吧?

上图引用自Dell PowerEdge R6615 1U服务器的文档。它的CPU在主板上也是偏左,并且是12个内存通道2 DPC一共24 DIMM插槽的最大内存设计。

红线区域是我假想出来的——如果在R6615机型基础上改进,也引入Remote HSK散热器设计,有没有可能支持风冷单路500WEPYC 9005 CPU呢?(前提是主板VR供电没有限制

进一步讨论,如果在2U服务器上也采用类似的Remote HSK散热器(同样针对单路),风冷的CPU支持能力可否从现在的500W提升到600W+

当然,我清楚当前R6715和R7715服务器CPU只支持到280W不是技术原因,而应该是市场策略——这个就超出了我的评论范围。我只负责yy技术:)


扩展阅读:《企业存储技术》文章分类索引更新(微信公众号合集标签)


:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。进一步交流,可以加我的微信:490834312。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)


尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage

长按二维码可直接识别关注


历史文章汇总http://www.toutiao.com/c/user/5821930387/

http://www.zhihu.com/column/huangliang



点击下方“阅读原文”,查看更多历史文章
↓↓↓