0 引言
世界能源委员会1995年对能源效率的定义为:减少提供同等能源服务的能源投入。对于能耗居高不下的数据中心,研究提高能源效率具有深远的社会效益和经济效益。除了能源效率之外,数据中心还有多项其他性能指标,按照国际标准组织ISO的定义统称为关键性能指标,或称为关键绩效指标,研究这些指标对于数据中心同样具有十分重要的意义。
在已经颁布的数据中心性能指标中最常见的是电能使用效率PUE。在我国,PUE不但是数据中心研究、设计、设备制造、建设和运维人员最为熟悉的数据中心能源效率指标,也是政府评价数据中心工程性能的主要指标。
除了PUE之外,2007年以后还出台了多项性能指标,虽然知名度远不及PUE,但是在评定数据中心的性能方面也有一定的参考价值,值得关注和研究。PUE在国际上一直是众说纷纭、莫衷一是的一项指标,2015年ASHRAE公开宣布,ASHRAE标准今后不再采用PUE这一指标,并于2016年下半年颁布了ASHRAE 90.4标准,提出了新的能源效率;绿色网格组织(TGG)也相继推出了新的能源性能指标。对PUE和数据中心性能指标的讨论一直是国际数据中心界的热门议题。
鉴于性能指标对于数据中心的重要性、国内与国际在这方面存在的差距,以及在采用PUE指标过程中存在的问题,有必要对数据中心的各项性能指标,尤其是对PUE进行深入地研究和讨论。
1 性能指标
ISO给出的关键性能指标的定义为:表示资源使用效率值或是给定系统的效率。数据中心的性能指标从2007年开始受到了世界各国的高度重视,相继推出了数十个性能指标。2015年之后,数据中心性能指标出现了较大变化,一系列新的性能指标相继被推出,再度引发了国际数据中心界对数据中心的性能指标,尤其是对能源效率的关注,并展开了广泛的讨论。
2 PUE
2.1 PUE和衍生效率的定义和计算方法
2.1.1 电能使用效率PUE
TGG和ASHRAE给出的PUE的定义相同:数据中心总能耗Et与IT设备能耗之比。
GB/T32910.3—2016给出的EEUE的定义为:数据中心总电能消耗与信息设备电能消耗之间的比值。其定义与PUE相同,不同的是把国际上通用的PUE(powerusage effectiveness)改成了EEUE(electricenergy usage effectiveness)。国内IT界和暖通空调界不少专业人士对于这一变更提出了不同的看法,根据Malone等人最初对PUE的定义,Et应为市电公用电表所测量的设备总功率,这里的Et就是通常所说的数据中心总的设备耗电量,与GB/T32910.3—2016所规定的Et应为采用电能计量仪表测量的数据中心总电能消耗的说法相同。笔者曾向ASHRAE有关权威人士咨询过,他们认为如果要将“power”用“electricenergy”来替代,则采用“electricenergy consumption”(耗电量)更准确。显然这一变更不利于国际交流。虽然这只是一个英文缩写词的变更,但因为涉及到专业术语,值得商榷。
ISO给出的PUE的定义略有不同:计算、测量和评估在同一时期数据中心总能耗与IT设备能耗之比。
2.1.2 部分电能使用效率pPUE
TGG和ASHRAE给出的pPUE的定义相同:某区间内数据中心总能耗与该区间内IT设备能耗之比。
区间(zone)或范围( boundary)可以是实体,如集装箱、房间、模块或建筑物,也可以是逻辑上的边界,如设备,或对数据中心有意义的边界。
ISO给出的pPUE的定义有所不同:某子系统内数据中心总能耗与IT设备总能耗之比。这里的“子系统”是指数据中心中某一部分耗能的基础设施组件,而且其能源效率是需要统计的,目前数据中心中典型的子系统是配电系统、网络设备和供冷系统。
2.1.3 设计电能使用效率dPUE
ASHRAE之所以在其标准中去除了PUE指标,其中一个主要原因是ASHRAE认为PUE不适合在数据中心设计阶段使用。为此ISO给出了设计电能使用效率dPUE,其定义为:由数据中心设计目标确定的预期PUE。
数据中心的能源效率可以根据以下条件在设计阶段加以预测:1)用户增长情况和期望值;2)能耗增加或减少的时间表。dPUE表示由设计人员定义的以最佳运行模式为基础的能耗目标,应考虑到由于数据中心所处地理位置不同而导致的气象参数(室外干球温度和湿度)的变化。
2.1.4 期间电能使用效率iPUE
ISO给出的期间电能使用效率iPUE的定义为:在指定时间测得的PUE,非全年值。
2.1.5 电能使用效率实测值EEUE-R
GB/T32910.3—2016给出的EEUE-R的定义为:根据数据中心各组成部分电能消耗测量值直接得出的数据中心电能使用效率。使用EEUE-R时应采用EEUE-Ra方式标明,其中a用以表明EEUE-R的覆盖时间周期,可以是年、月、周。
2.1.6 电能使用效率修正值EEUE-X
GB/T32910.3—2016给出的EEUE-X的定义为:考虑采用的制冷技术、负荷使用率、数据中心等级、所处地域气候环境不同产生的差异,而用于调整电能使用率实测值以补偿其系统差异的数值。
2.1.7 采用不同能源的PUE计算方法
数据中心通常采用的能源为电力,当采用其他能源时,计算PUE时需要采用能源转换系数加以修正。不同能源的转换系数修正是评估数据中心的一次能源使用量或燃料消耗量的一种方法,其目的是确保数据中心购买的不同形式的能源(如电、天然气、冷水)可以进行公平地比较。例如,如果一个数据中心购买当地公用事业公司提供的冷水,而另一个数据中心采用由电力生产的冷水,这就需要有一个系数能使得所使用的能源在相同的单位下进行比较,这个系数被称为能源转换系数,它是一个用来反映数据中心总的燃料消耗的系数。当数据中心除采用市电外,还使用一部分其他能源时,就需要对这种能源进行修正。
2.1.8 PUE和EEUE计算方法的比较
如果仅从定义来看,PUE和EEUE的计算方法十分简单,且完全相同。但是当考虑到计算条件的不同,需要对电能使用效率进行修正时,2种效率的计算方法则有所不同。
1)PUE已考虑到使用不同能源时的影响,并给出了修正值和计算方法;GB/T32910.3—2016未包括可再生能源利用率,按照计划这一部分将在GB/T32910.4《可再生能源利用率》中说明。
2)PUE还有若干衍生能源效率指标可供参考,其中ISO提出的dPUE弥补了传统PUE的不足;EEUE则有类似于iPUE的指标EEUE-Ra。
3)EEUE分级(见表1)与PUE分级(见表2)不同。
表1 EEUE分级要求
表2 PUE分级
4)EEUE同时考虑了安全等级、所处气候环境、空调制冷形式和IT设备负荷使用率的影响。ASHRAE最初给出了19个气候区的PUE最大限值,由于PUE已从ASHRAE标准中去除,所以目前的PUE未考虑气候的影响;ISO在计算dPUE时,要求考虑气候的影响,但是如何考虑未加说明;PUE也未考虑空调制冷形式和负荷使用率的影响,其中IT设备负荷率的影响较大,应加以考虑。
2.2 PUE和EEUE的测量位置和测量方法
2.2.1 PUE的测量位置和测量方法
根据IT设备测点位置的不同,PUE被分成3个类别,即PUE1初级(提供能源性能数据的基本评价)、PUE2中级(提供能源性能数据的中级评价)、PUE3高级(提供能源性能数据的高级评价)。
PUE1初级:在UPS设备输出端测量IT负载,可以通过UPS前面板、UPS输出的电能表以及公共UPS输出总线的单一电表(对于多个UPS模块而言)读取。在数据中心供电、散热、调节温度的电气和制冷设备的供电电网入口处测量进入数据中心的总能量。基本监控要求每月至少采集一次电能数据,测量过程中通常需要一些人工参与。
PUE2中级:通常在数据中心配电单元前面板或配电单元变压器二次侧的电能表读取,也可以进行单独的支路测量。从数据中心的电网入口处测量总能量,按照中等标准的检测要求进行能耗测量,要求每天至少采集一次电能数据。与初级相比,人工参与较少,以电子形式采集数据为主,可以实时记录数据,预判未来的趋势走向。
PUE3高级:通过监控带电能表的机架配电单元(即机架式电源插座)或IT设备,测量数据中心每台IT设备的负载(应该扣除非IT负载)。在数据中心供电的电网入口处测量总能量,按照高标准的检测要求进行能耗测量,要求至少每隔15min采集一次电能数据。在采集和记录数据时不应该有人工参与,通过自动化系统实时采集数据,并支持数据的广泛存储和趋势分析。所面临的挑战是以简单的方式采集数据,满足各种要求,最终获取数据中心的各种能量数据。
对于初级和中级测量流程,建议在一天的相同时间段测量,数据中心的负载尽量与上次测量时保持一致,进行每周对比时,测量时间应保持不变(例如每周周三)。
2.2.2 EEUE的测量位置和测量方法
EEUE的测量位置见图1。
图1 数据中心电能消耗测量点
1)Et测量位置在变压器低压侧,即A点;
2)当PDU无隔离变压器时,EIT测量位置在UPS输出端,即B点;
3)当PDU带隔离变压器时,EIT测量位置在PDU输出端,即C点;
4)大型数据中心宜对各主要系统的耗电量分别计量,即E1,E2,E3点;
5)柴油发电机馈电回路的电能应计入Et,即A1点;
6)当采用机柜风扇辅助降温时,EIT测量位置应为IT负载供电回路,即D点;
7)当EIT测量位置为UPS输出端供电回路,且UPS负载还包括UPS供电制冷、泵时,制冷、泵的能耗应从EIT中扣除,即扣除B1和B2点测得的电量。
2.2.3 PUE和EEUE的测量位置和测量方法的差异
1)PUE的Et测量位置在电网输入端、变电站之前。而GB/T32910.3—2016规定EEUE的Et测量位置在变压器低压侧。数据中心的建设有2种模式:①数据中心建筑单独设置,变电站自用,大型和超大型数据中心一般采用这种模式;②数据中心置于建筑物的某一部分,变电站共用,一般为小型或中型数据中心。由于供电局的收费都包括了变压器的损失,所以为了准确计算EEUE,对于前一种模式,Et测量位置应该在变压器的高压侧。
2)按照2.2.2节第6条,在计算EIT时,应减去机柜风机的能耗。应该指出的是,机柜风机不是辅助降温设备,起到降温作用的是来自空调设备的冷空气,降温的设备为空调换热器,机柜风机只是起到辅助传输冷风的作用,因此机柜风机不应作为辅助降温设备而计算其能耗。在GB/T32910.3征求意见时就有人提出:机柜风机的能耗很难测量,所以在实际工程中,计算PUE时,EIT均不会减去机柜风机的能耗。在美国,计算PUE时,机柜风机的能耗包括在EIT中。
3)PUE的测点明显多于GB/T32910.3—2016规定的EEUE的测点。
2.3 PUE存在的问题
1)最近两年国内外对以往所宣传的PUE水平进行了澄清。我国PUE的真实水平也缺乏权威调查结果。GB/T32910.3—2016根据国内实际状况,将一级节能型数据中心的EEUE放宽到1.0~1.6,其上限已经超过了国家有关部委提出的绿色数据中心PUE应低于1.5的要求,而二级比较节能型数据中心的EEUE规定为1.6~1.8,应该说这样的规定比较符合国情。
2)数据中心总能耗Et的测量位置直接影响到PUE的大小,因此应根据数据中心建筑物市电变压器所承担的荷载组成来决定其测量位置。
3)应考虑不同负荷率的影响。当负荷率低于30%时,不间断电源UPS的效率会急剧下降,PUE值相应上升。对于租赁式数据中心,由于用户的进入很难一步到位,所以数据中心开始运行后,在最初的一段时间内负荷率会较低,如果采用设计PUE,也就是满负荷时的PUE来评价或验收数据中心是不合理的。
4)数据中心的PUE低并非说明其碳排放也低。完全采用市电的数据中心与部分采用可再生能源(太阳能发电、风电等),以及以燃气冷热电三联供系统作为能源的数据中心相比,显然碳排放指标更高。数据中心的碳排放问题已经引起国际上广泛地关注,碳使用效率CUE已经成为数据中心重要的关键性能指标,国内对此的关注度还有待加强。
5)GB/T32910.3—2016规定,在计算EIT时,应减去机柜风机的耗能。关于机柜风机的能耗是否应属于IT设备的能耗,目前国内外有不同的看法,其中主流观点是服务器风机的能耗应属于IT设备的能耗,其原因有二:一是服务器风机是用户提供的IT设备中的一个组成部分,自然属于IT设备;二是由于目前服务器所采用的风机基本上均为无刷直流电动机驱动的风机(即所谓EC电机),风机的风量和功率随负荷变化而改变,因此很难测量风机的能耗。由于数据中心风机的设置对PUE的大小影响很大,需要认真分析。从实际使用和节能的角度出发,有人提出将服务器中的风机取消,而由空调风机取代。由于大风机的效率明显高于小风机,且初投资也可以减少,因此这种替代方法被认为是一个好主意,不过这是一个值得深入研究的课题。
6)国内相关标准有待进一步完善。GB/T32910.3—2016《数据中心资源利用第3部分:电能能效要求和测量方法》的发布,极大地弥补了国内标准在数据中心电能能效方面的不足;同时,GB/T32910.3—2016标准颁布后,也引起了国内学术界和工程界的热议。作为一个推荐性的国家标准如何与已经颁布执行的强制性行业标准YD 5193—2014《互联网数据中心(IDC)工程设计规范》相互协调?在标准更新或升级时,包括内容相似的国际标准ISOIEC 30134-2-2016在内的国外相关标准中有哪些内容值得借鉴和参考?标准在升级为强制性国家标准之前相关机构能否组织就其内容进行广泛的学术讨论?都是值得考虑的重要课题。ASHRAE在发布ASHRAE90.4标准时就说明,数据中心的标准建立在可持续发展的基础上,随着科学技术的高速发展,标准也需要不断更新和创新。
7)PUE的讨论已经相当多,事实上作为大数据中心的投资方和运营方,更关心的还是数据中心的运行费用,尤其是电费和水费。目前在数据中心关键性能指标中尚缺乏一个经济性指标,使得数据中心,尤其是大型数据中心和超大型数据中心的经济性无法体现。
2.4 PUE的比较
不同数据中心的PUE值不应直接进行比较,但是条件相似的数据中心可以从其他数据中心所提供的测量方法、测试结果,以及数据特性的差异中获益。为了使PUE比较结果更加公平,应全面考虑数据中心设备的使用时间、地理位置、恢复能力、服务器可用性、基础设施规模等。
3 其他性能指标
3.1 ASHRAE90.4
ASHRAE90.4-2016提出了2个新的能源效率指标,即暖通空调负载系数MLC和供电损失系数ELC。但这2个指标能否为国际IT界接受,还需待以时日。
3.1.1 暖通空调负载系数MLC
ASHRAE对MLC的定义为:暖通空调设备(包括制冷、空调、风机、水泵和冷却相关的所有设备)年总耗电量与IT设备年耗电量之比。
3.1.2 供电损失系数ELC
ASHRAE对ELC的定义为:所有的供电设备(包括UPS、变压器、电源分配单元、布线系统等)的总损失。
3.2 TGG白皮书68号
2016年,TGG在白皮书68号中提出了3个新的能源效率指标,即PUE比(PUEr)、IT设备热一致性(ITTC)和IT设备热容错性(ITTR),统称为绩效指标(PI)。这些指标与PUE相比,不但定义不容易理解,计算也十分困难,能否被IT界接受,还有待时间的考验。
3.2.1 PUE比
TGG对PUEr的定义为:预期的PUE(按TGG的PUE等级选择)与实测PUE之比。
3.2.2 IT设备热一致性ITTC
TGG对ITTC的定义为:IT设备在ASHRAE推荐的环境参数内运行的比例。
服务器的进风温度一般是按ASHRAE规定的18~27℃设计的,但是企业也可以按照自己设定的服务器进风温度进行设计,在此进风温度下,服务器可以安全运行。IT设备热一致性表示符合ASHRAE规定的服务器进风温度的IT负荷有多少,以及与总的IT负荷相比所占百分比是多少。例如一个IT设备总负荷为500kW的数据中心,其中满足ASHRAE规定的服务器进风温度的IT负荷为450kW,则该数据中心的IT设备热一致性为95%。
虽然TGG解释说,IT设备热一致性涉及的只是在正常运行条件下可接受的IT温度,但是IT设备热一致性仍然是一个很难计算的能源效率,因为必须知道:1)服务器进风温度的范围,包括ASHRAE规定的和企业自己规定的进风温度范围;2)测点位置,需要收集整个数据中心服务器各点的进风温度,由人工收集或利用数据中心基础设施管理(DCIM)软件来统计。
3.2.3 IT设备热容错性ITTR
TGG对ITTR的定义为:当冗余制冷设备停机,或出现故障,或正常维修时,究竟有多少IT设备在ASHRAE允许的或建议的送风温度32℃下送风。
按照TGG的解释,ITTR涉及的只是在出现冷却故障和正常维修运行条件下可接受的IT温度,但是ITTR也是一个很难确定的参数。ITTR的目的是当冗余冷却设备停机,出现冷却故障或在计划维护活动期间,确定IT设备在允许的入口温度参数下(<32℃)运行的百分比,以便确定数据中心冷却过程中的中断或计划外维护的性能。这个参数很难手算,因为它涉及到系统操作,被认为是“计划外的”条件,如冷却单元的损失。
3.3 数据中心平均效率CADE
数据中心平均效率CADE是由麦肯锡公司提出,尔后又被正常运行时间协会(UI)采用的一种能源效率。
CADE提出时自认为是一种优于其他数据中心能源效率的指标。该指标由于被UI所采用,所以直到目前仍然被数量众多的权威著作、文献认为是可以采用的数据中心性能指标之一。但是笔者发现这一性能指标的定义并不严谨,容易被误解。另外也难以测量和计算。该指标的提出者并未说明IT资产效率如何测量,只是建议ITAE的默认值取5%,所以这一指标迄今为止未能得到推广应用。
3.4 IT电能使用效率ITUE和总电能使用效率TUE
2013年,美国多个国家级实验室鉴于PUE的不完善,提出了2个新的能源效率——总电能使用效率TUE和IT电能使用效率ITUE。
提出ITUE和TUE的目的是解决由于计算机技术的发展而使得数据中心计算机配件(指中央处理器、内存、存储器、网络系统,不包括IT设备中的电源、变压器和机柜风机)的能耗减少时,PUE反而增加的矛盾。但是这2个性能指标也未得到广泛应用。
3.5 单位能源数据中心效率DPPE
单位能源数据中心效率DPPE是日本绿色IT促进协会(GIPC)和美国能源部、环保协会、绿色网格,欧盟、欧共体、英国计算机协会共同提出的一种数据中心性能指标。GIPC试图将此性能指标提升为国际标准指标。
3.6 水利用效率WUE
TGG提出的水利用效率WUE的定义为:数据中心总的用水量与IT设备年耗电量之比。
数据中心的用水包括:冷却塔补水、加湿耗水、机房日常用水。根据ASHRAE的调查结果,数据中心基本上无需加湿,所以数据中心的用水主要为冷却塔补水。采用江河水或海水作为自然冷却冷源时,由于只是取冷,未消耗水,可以不予考虑。
民用建筑集中空调系统由于总的冷却水量不大,所以判断集中空调系统的性能时,并无用水量效率之类的指标。而数据中心由于全年制冷,全年的耗水量居高不下,已经引起了国内外,尤其是水资源贫乏的国家和地区的高度重视。如何降低数据中心的耗水量,WUE指标是值得深入研究的一个课题。
3.7 碳使用效率CUE
TGG提出的碳使用效率CUE的定义为:数据中心总的碳排放量与IT设备年耗电量之比。
CUE虽然形式简单,但是计算数据中心总的碳排放量却很容易出错。碳排放量应严格按照联合国气象组织颁布的计算方法进行计算统计。
本文刊登于《暖通空调》2017年第4期
作者:湖南大学 殷平
【近期活动】
5月23日•北京 第3届数据中心机房空调系统论坛
【关注“暖通空调”】
1、微信号搜索“hvac1971”或“暖通空调”。
2、点击右上角按钮,选择“关注官方账号”。
关于《暖通空调》杂志
《暖通空调》创刊于1971年,是中国建筑科学类核心期刊,国家期刊奖最高奖项获奖期刊,入选2013年、2015年中国“百强科技期刊”,获得中国政府出版奖提名奖。中国暖通空调行业唯一的中央级科技期刊。本刊以实用技术为主,兼具学术性和信息性,在行业中最具影响力,被誉为权威刊物,深受广大读者喜爱,发行量在国内同行业刊物中遥遥领先。
杂志订购
2017年《暖通空调》杂志(共12期) 240元(平邮)
点击左下角”微商城“,直接微信购买
邮局订阅代号2-758