我们看好算力资本开支提升下的数据中心电气系统的投资机会。
国内算力资本开支加码,数据中心电气系统价值量占比较高,各链路环节有望显著受益。
根据Bloomberg一致预期,2024年北美TOP4的云厂商合计资本开支高达2182亿美元,同增44.2%;2024年中国阿里、腾讯、百度的资本开支合计约131亿美元,同增37.3%。2025年Bloomberg一致预期中国TOP3资本开支达到158.3亿美元,同增21%。考虑到尚未统计字节等厂商的增量,我们认为实际资本开支要远大于目前的一致预期。我们参考施耐德电气的拆分,电气系统占数据中心建设成本约为45~50%。
数据中心的电气系统相对复杂,多种技术路线并行。
10kV~20kV左右超高压交流电经过一系列的变化最终转化为0.8V~1V左右的超低压直流电,进而为GPU供电。这一系列的电能制式变化既需要完善的供电系统也需要多级的备电架构,以低压PDU为界也可以系统划分为强电侧和弱电侧电源。目前国内数据中心大多采用2N架构,海外数据中心RR架构应用较多。同时数据中心以往多采用UPS,但HVDC和巴拿马也有渗透率提升的潜力。
我们预计未来2025-28年国内数据中心带来的新增装机功率复合增速有望达到25%。
我们测算(2024-25E)整体数据中心带来的各环节市场规模相对较小。但随着算力的持续增长以及AIDC投建,我们预计整体市场有望持续快速扩容。我们测算2025-28年市场空间的CAGR:AI服务器AC/DC(58%)>锂电蓄电池(51%)> HVDC(51%)>灾备电源(30%)>变压器=开关柜=ATS(25%)>铅酸蓄电池(24%)= BBU(24%)>通用服务器AC/DC(23%)>UPS(18%)。多数环节大多享受整体新增装机功率增速,但部分环节存在渗透率提升、通胀情况导致整体增速超过行业增长。
我们核心看好以下主线:1、
英伟达产业链:
高功率电源、BBU、超级电容;
2、新技术渗透率提升:
HVDC、巴拿马、锂电蓄电池等;
3、通胀属性品种:
灾备电源及AC/DC电源;
4、具备功率弹性和国产替代空间强电环节。
AI催化云计算厂商资本开支加码,国内厂商2025年资本开支大幅上行
国内外云厂商加大AI算力资本开支,CAPEX持续加速上行。
大模型的持续不断迭代引发各大云计算厂商巨头在AI算力领域投入的持续加码。根据Bloomberg一致预期(2025/1/18),2024年北美TOP4的云厂商合计资本开支高达2182亿美元,同比增长44.2%;中国阿里巴巴、腾讯、百度的资本开支合计约为131亿美元,同比增长37.3%。而进入2025年海内外厂商则进一步加大在算力资本开支的投入力度,例如微软计划2025年投资800亿美元用于数据中心扩建。与此同时我们也看到国内厂商在算力领域加大资本开支,而根据Bloomberg的一致预期,2025-26年国内百度、阿里、腾讯三家的资本开支有望达到158.3亿美元和167.5亿美元,分别同比增长20.6%和5.8%。此外字节等云计算巨头也在纷纷加码算力资本开支,近期我们看到字节跳动也在逐步加强算力资本开支,2025年1月在安徽芜湖拟投资80亿元建设涵盖2.2万台服务器的数据中心[1]
。考虑字节的增量尚未统计在图表1的国内云计算厂商资本开支之内,我们认为2025年实际的资本开支要远大于Bloomberg的一致预期,进而带动整体国内算力资本开支加速增长,进入一轮景气周期。
此外从逐季的资本开支来看,国内及海外的资本开支同比、环比均有显著改善。
国内云计算厂商在1-3Q24来看,资本开支的同比增速约为97~136%,呈现出非常明显的上行态势。
电气系统作为价值量占比较高的环节,算力资本开支下有望受益。
终端云厂商的算力资本开支一方面用于采购服务器,另一方面用于数据中心的基建。根据3Q24微软和谷歌的业绩交流会,微软3Q24资本开支149亿美元,云和AI支出的一半用于购买服务器,另外一半用于数据中心建设;谷歌3Q24资本开支131亿美元,其中60%用于服务器投资,40%用于数据中心投资。我们参考施耐德电气的数据中心价值量拆分(相关假设如下图的注),其中电气系统占比约为45~50%,而其中UPS、发电机组、开关柜、关键配电的占比约为35~40%,25~30%,15~20%,15~20%。
注:假设5MW数据中心设计容量,机柜平均功率密度6KW,2N配电、N+1配置的UPS
资料来源:
施耐德电气,中金公司研究部
数据中心的电气系统相对复杂,既包含了供电架构和备电架构,也包含了强电侧的电源和弱电侧的电源。
从配电网出来的10kV~20kV左右的超高压交流电经过一系列的变化最终转化为0.8V~1V左右的超低压直流电,进而为芯片级别的GPU进行供电。这一系列的电能制式变化既需要完善的供电系统也需要多级的备电系统,我们也以低压(精密)PDU为界可以将前端的电源划分为强电侧电源,后端的电源划分为弱电侧的电源。因此我们也可以以这两个视角来分别理解数据中心的电气系统。
备电架构
数据中心往往采用多级的备电架构,进而在分钟、小时级别完成多种维度意义上的备电。
►灾备电源(小时级别及以上):
这是数据中心的最后一道保障,在2N架构下当两路市电全部断电后灾备电源会通过ATS自动切换至柴油发电机组启动,通过柴油的燃烧来持续供电,进而提供小时级别以上的备电时长。
►UPS(10~15分钟级别):
UPS本质上是作为灾备电源的缓冲,当数据中心的市电宕机之后发动机无法立即启动,而在这一段时间内需要由UPS内置的电池迅速启动来为整体的数据中心进行供电。理论上一套灾备电源的发动机启动需要20-30s,但由于多机组并联电源平稳也仍需时间,同时考虑到灾备电源其备用的工作特性,存在无法立即切换至开机状态仍然需要人工干预的可能性,一般意义上需要留足3~4次左右的干预时间,平均每次3分钟左右,因此这也是UPS的备电时长往往设置在10~15分钟不等。具体的备电时长也跟数据中心的安全等级息息相关。
►BBU(4分钟左右或者更长):
相比于UPS,我们认为BBU是一种更加精细化的备电手段。理论上UPS作为集中式备电的典型架构无法处理市电正常工作,但低压配电PDU后端的线路出问题或者Powershelf出问题下的故障情景,而BBU作为柜内备用电池或者sidecar式的备用电池是可以进一步完善UPS这里的备电盲区。根据Open compute project官网[2]
,柜内的BBU shelf在设计的过程中标准版本被设计为4分钟左右的备电时长。此外根据Google,BBU在柜内体积足够的前提下也可以一定程度上替代UPS,此外我们也认为若采用Sidecar的模式,单独成柜的power sidecar体积足够因此也能够容纳足够的电池进而一定程度上发挥UPS的功能。
供电架构
供电架构我们更多需要从强电侧和弱电侧两个维度来进行理解
►强电侧:强电侧电源主要是指IT机柜之外的电源,在相对较高的电压平台下进行电能制式变化。
• 变压器:
电网传输的超高压的交流电(10kV)经过变压器进行第一步的降压进而转化至400V/480V左右进而供后端的电气设备进行处理。
• UPS:
UPS除了本身的备电功能之外还能提升电能质量。
• 开关柜:
开关柜以断路器为主,包括控制电器、保护电器等装配在封闭的或敞开的金属柜体内,作为电力系统中接受和分配电能的装置。开关柜既包括针对UPS-IT负载、暖通、照明负载等的输入配电柜,也包括针对不同机柜之间的输出配电柜。
►弱电侧:弱电侧电源主要是指柜内的电源,在PDU分配电能入柜之后逐步进行整流、进一步降压的变化,最终进行超低压级别的芯片供电。
• 弱电侧-AC/DC:
AC/DC主要是基于电能制式变化的角度对于Powershelf这一环节进行命名,在OCP的标准中主要是将400V/480V的交流电转化为48V/50V的直流电输出。具体来看,Powershelf是由6个PSU(Power supply unit)电源模块和1个PMC(Power monitor controller)监控模块组成。此外AC/DC环节在GB300之后来看,也逐步以解决方案的形式出现,同时包括超级电容和BBU彼此之间通过通讯接口互联。
•弱电侧-DC/DC:
DC/DC则进一步将48V/50V的直流电进行降压至0.8V~1V,一般而言DC/DC会采用分比式架构进行两步降压,分别是50V降至12V和12V降至0.8V。
基于供电冗余考虑,2N供电方案是目前数据中心机房采用的主流供电架构方式之一,大幅提升了负载用电的可靠性。
数据中心传统供配电系统有多种形式,其中2N系统由2套独立工作的UPS组成,两个单元互为备用。相较于单系统,2N系统可克服单电源系统存在的单点故障瓶颈,增加供电系统可靠性,适用于特别重要的大型数据中心IT设备,同时也增加了对于电力设备的需求。同时2N架构的系统结构简单,设备和线路之间容易实现隔离,运营成本适中,运维难度较低。
资料来源:科华数据官网,弱电技术网,电气时代,中金公司研究部
DR架构和RR架构
[3]在
2N架
构的基础上进一步简化供电系统的复杂度,减少数据中心电气系统的复杂度。
电气系统复杂度降低带来的好处也立竿见影,根据Vertiv预计以传统2N架构为基准,单位面积下DR架构的算力能够提升33%,RR架构的算力能够提升50%。
►
DR架构:
以下图为例,其中DR架构的每台变压器10kV进线都采用双电源系统切换,本质上是有三套互为备份的电气线路,任何一套的故障都不影响整体数据中心的运行,对比来看同样是三套负载,DR架构能够节省掉50%左右的电气系统配套(若2N架构需要6套变压器+UPS的电气线路)。DR架构在海外数据中心的应用相对较多,国内较少,也由于其设备和线路的强耦合关系导致故障时的分离难度和定位难度较高。
►RR架构:
RR架构本质上是N+1架构的一种,其有单独的一套系统(最右侧)为冗余备用系统,但除此之外的任何一套系统断电之后由该系统供电。对比来看,RR架构仍然能够较2N架构节省电气系统配套(例如下图中RR架构4套IT负载使用三套变压器+UPS链路,若2N架构需要8套),同时RR架构的设备和电缆线路可以物理隔离,但整体结构较为复杂运维难度较高,目前来看RR架构在三大通信运营商的通信机房较多使用,而数据中心使用相对较少。
智算中心也逐步开始使用混合式供电架构。
在实际使用过程中,我们仍然区分自建项目和出租项目的差异性,对于自建项目而言,DR/RR等架构能够更好地简化电气系统,提升效率降低占地面积等,但对于出租项目而言,更高的运维成本和复杂的拓扑结构可能也会降低出租的吸引力,因此需要综合不同的情景进行综合收益的考虑。基于此也逐步涌现出2N+DR架构的混合式供电架构,如下图。
图表7:智算中心的2N+3DR混合式供电架构示意图
从供电系统来看,UPS、HVDC、巴拿马、SST等也有望呈现多种路线并存且逐步演进的格局。
电气设备的特点是链路越短,发生能量转化的节点越少,且可能发生故障的节点也越少,因此效率也就越高同时可靠性也更高。UPS-HVDC-巴拿马等的演进路线本质就是一个不断简化链路做高集成度的过程。目前来看,行业仍然以UPS为主要的供电方案,但随着AIDC的逐步投建,HVDC、巴拿马电源、SST等更加简洁的方案也有望逐步启用。
算力的尽头是电力,算力能效X算力规模=算力能耗。
我们在这里试算数据中心带来的功率需求,算力能耗实际上是由算力规模和算力能效二者共同决定,一方面算力规模是由AI大模型本身的发展所决定,例如参数量、利用率、性能优化等等,另一方面算力能效则受到芯片层面、服务器层面、数据中心层面的多维影响。我们认为未来算力规模有望持续上行,算力能效则随着芯片迭代、液冷技术发展等有望进一步升级。
资料来源:《第七章AI的能耗焦虑:增长极限与绿色困境》陈济等,2024.6.30,中金研究院,中金公司研究部
图表10:英伟达过去8年平均每年算力单位能耗下降40%
资料来源:英伟达、华为、寒武纪官网,中金公司研究部
我们预计未来2025-28年中国数据中心带来的新增装机功率复合增速有望达到25%,国内数据中心带来的耗电量占中国全社会耗电量的比例远期有望逐步增长。
根据IDC报告《中国人工智能计算力发展评估》预测到2027年中国通用算力规模约为117EFLOPS(基于FP64计算),2023年底中国的智能算力规模约为414 EFLOPS(基于FP16),我们假设25-28年通用算力CAGR约为16%,而智能算力则分别假设55%CAGR的基准情景、63% CAGR的乐观情景和51% CAGR的保守情景假设。考虑到随着芯片迭代以及服务器冷却技术的进步整体算力能效有所提升,我们进一步综合推理和训练的占比结构变化测算基准假设、乐观假设、悲观假设下新增装机功率需求2025-28年期间的复合CAGR约为25%、30%、23%。
注1:
通用算力2025-27年假设参考《2023 - 2024 年中国人工智能计算力发展评估报告》
注2:智能算力2025-27年假设参考《第七章 AI 的能耗焦虑:增长极限与绿 色困境》陈济等,2024.6.30 对于2025-2030年的基准算力增速假设
资料来源:
Wind,信通院,IDC,华为、英伟达官网,中金公司研究部
我们预计相关环节在新增装机功率持续增长的情况下,也有望同步迎来增长机会。
我们基于基准情景假设和2N供电架构的假设来进行相关环节的市场空间测算。
►从市场空间的增速(2025-28年CAGR)角度来看:
AI服务器AC/DC(58%)>锂电蓄电池(51%)> HVDC(51%)>灾备电源(30%)>变压器=开关柜=ATS(25%)>铅酸蓄电池(24%)= BBU(24%)>通用服务器AC/DC(23%)>UPS(18%)。多数环节大多享受整体新增装机功率的增速,但部分环节存在渗透率提升、单位价值量增加的情况导致整体增速超过行业平均增长。
►从市场空间的规模来看:
我们认为当前来看(2024-25E)整体数据中心带来的各环节需求相对有限,我们测算2025年各环节市场空间大多在不足百亿的规模,其中灾备电源、开关柜、UPS等市场空间相对较大。但随着算力的持续扩容以及AIDC的持续投建,我们预计2027-2028年将会涌现更多的百亿元赛道。
注:
强电侧多数环节采用2N冗余架构的假设,灾备电源仅考虑一部分配有2N冗余的假设
资料来源:
Wind,相关公司官网,中金公司研究部