专栏名称: 数据中心运维管理
专注于数据中心基础设施运维与运营管理,分享运行维护经验,分享数据中心行业发展趋势及新技术应用。
目录
相关文章推荐
Java基基  ·  SpringBoot ... ·  2 天前  
51好读  ›  专栏  ›  数据中心运维管理

UPS故障或貌似故障解析

数据中心运维管理  · 公众号  · 数据库  · 2017-01-21 20:55

正文

尽管UPS电源都在尽职尽责地保护着IT设备的正常运行,但故障也是很难避免的。据统计,UPS电源本身的原因造成故障比例不足30%,自然因素和人为的因素造成故障的比例占全部故障数的60%~70%。故障或貌似故障的原因可归纳如下几种。这里吧引起人们恐慌和惊动厂家的一切机器现象统一成为“故障”。
  
  一、怀疑“故障”
  
  所谓怀疑故障,顾名思义,是指由于值机人员缺乏基本的分析能力和没有很好地阅读说明书导致的误会。有一些10kVA以下小容量的UPS电源,大都没有采用液晶显示,而是用4~5只发光二极管LED竖向排列成“棒”状指示灯,以形象地表示电池电压或负载的百分比,这种按百分比表示的方法,在装机时未经进一步校准一般是不太精确的。而大多数用户的注意力都集中在指示的精确度上,但也有的出现了大误会。例如,在一次重要的飞机校飞中,一测控站突然惊呼UPS电源带不上负载了!因为他发现负载指示灯都没有被点亮。这一非常时间惊动了上级领导和供应商,就在人们等待“维修”的时候,由该UPS电源供电的设备扔在正常工作。一场虚惊的原因是值班员发现负载指示灯不亮。随机说明书上清楚地写着,当负载在30%以上时,最下面的一个指示灯才被点亮。
  
  又如,某UPS电源双机冗余并联系统正常运行时,值班员突然发现其中一台UPS电源的控制板上有两盏灯点亮,而另一台的控制板上则只有一盏登点亮,这二者的差异引起了恐慌,于是急招厂家修理。原来双机并联时,主机亮两盏灯而副机只亮一盏灯,在产品说明书上已有说明。
  
  二、知识性“故障”
 
 
  知识性故障主要是由于一些机器管理员自持经验丰富而实际是既缺乏基本理论只是又缺乏实践经验所致。例如,有一双30kVAUPS电源冗余并联系统,后面带一通信机。通信机电源刚一捷通就烧坏冒烟了,换了一台又烧毁了,又换了三台,这才工作正常。于是通信机厂家提出此故障是由于UPS电源三相输出电压的零点漂移而造成这一相电压过高所致,急招UPS电源厂家立即解决问题。经现场测量,UPS电源的三相电压都为220V,三项电流不足10%,又何谈零点漂移呢?实际查明是通信机厂家的电源有质量问题。
  
  在早起的传统双变换UPS电源中,由于三相逆变采用了统一控制,因此在三相负载极端不平衡的情况下就会产生零点漂移,使三相相电压有很大差异。后来采用了对三相相电压分别控制与统一控制相结合的方法后,情况大有好转,可以使三相相电压的不平衡度小鱼2%。而近来的三相半桥逆变采用了分别控制,而且三相电压在统一相位的控制下各完全独立,及时在三相负载100%不平衡的条件下,也可以使三相相电压的不平衡度小于1%,这就为“非三进单出UPS电源不可”的用户提供了选择的空间。
  
  三、操作故障
  
  ①为了使UPS电源安全可靠地开机运行,各种产品都有自己“特定”的一套操作程序。所谓“特定”,就是说各种品牌的UPS电源的设计思路不同,在操作上也各有各的考虑,并将其写进了随机的“操作手册”。按照“手册”程序操作,就可完全保证安全,否则就可能或必然出问题。然而,有的操作员以为电源很简单,不看说明书就按照自己的理解任意操作,结果造成了损失。
  
  ②无意识操作。例如,在维修期间,拆卸某一连接很牢靠的器件时,不小心碰坏了临近的脆弱器件而未被发现,修理完毕后加电时造成了二次故障。
  
  ③带电检查故障时,测了表笔探头误将电路或器件两点碰短路,形成重复故障。
  
  ④连接外部电池时,误将极性接错,烧毁了逆变器;有的电池链接末端被拧紧或节耗电池后忘记了闭合电池开关,在市电一场时,UPS电源因电池不能放电而停机。
  
  ⑤输入/输出线链接不牢,会造成交流电断电假象故障;供电局进行线路维修或该着时更改了原本的相序,因而导致UPS电源不能启动或切换;UPS电源加电后忘了启动逆变器,一直是旁路供电,市电出现故障时UPS电源也停止供电。
  
  ⑥值班人员在机房或机房附近的值班室乱放食物,找来老鼠啃咬电缆或钻入机器内部导致故障。
  
  ⑦不合理的布线。例如,将无屏蔽的远程信号线与交流功率线并行靠近走线。导致该部分控制信号紊乱,造成故障。
  
  四、延误故障
  
  ①机器已经告警,由于值班员的疏忽而未及时发现与处理,由此而导致后来的故障。换而言之,如果及时发现时处理就可以避免后来的故障。例如,在飞机双机并联UPS电源系统中,负载被均分到两台机器上,有的UPS电源有时会由于某种条件的巧合而导致一台逆变器关机,系统就自动被地将故障UPS电源的负载转到另一台上,这是面板或监视器上会有显示告警。值班员及时或市电故障时间较长,另一台UPS电源就会转旁路或提前断电。
  
  ②电池在非理想的情况下运行时,尤其在长期没有充放电的情况下,更要加强监视,一经发现容量有明显降低,就立即更换。因为电池时效的速度有快有慢,有的是瞬间的,今天测量是好的,很可能明天就彻底坏了。
  
  ③车载或舰载UPS电源的保险丝和接插件在不停地震动中容易松动,从而造成故障。保险丝长期在通电的情况下运行,会发热软化过程的同时受震动弯曲下垂,如不及时更换,随时都可能断裂,造成故障。
  
  五、维护不当或不及时导致的故障
  

  ①对UPS电源的定期维护是必要的,还应有一套严格的管理程序。不按规定要求进行定期或不定期保养是导致机器故障的重要原因。例如,UPS电源因长期不维护而导致机器工作不稳定、停机、不能启动和烧毁元器件等。代开机壳才发现,夹杂着导电离子的灰尘充满全机、覆盖了电路板、填满了绝缘的空气隙,混合着潮湿的空气破坏了电路的正常工作。用吹风机将这些异物清理掉就可一切归于正常。
  
  ②UPS电源维护完毕,工程师将市电输入开关闭合,而恰恰忘了启动逆变器,一旦市电停电,逆变器不工作而使电池无法放电,导致UPS电源的输出同时掉电。
  
  ③电池运行期限已到,一部分电池明显失败,按规定应全部更换,而用户为了节约,就将“将就能用”的电池保留,只更换那些再也无法继续使用的电池。新电池的作用不但得不到充分发挥,反而导致机器连续出故障。
  
  六、经验故障
  
  经验故障是不可缺少的,是不可多得的财富。但经验有其相对性,即在一种UPS电源上得到的经验不一定完全适合另一种,否则就会导致故障。
  
  ①以为具有单击操作经验的人员去启动一并联系统的UPS电源,按照他以往的经验启动逆变器后再去搬动输出开关,结果将逆变器烧毁。他不知道在这集中机器上并机时是先闭合输出开关而后再去启动逆变器。
  
  ②有的维修人员在维修一种UPS电源时,有几次输入保险丝断了,当场更换后就正常了。而恰恰在一次更换中引起了严重的连续故障。实际上导致保险丝熔断的原因很多,保险丝本身的质量不好会提前损坏,发热的保险丝在不停地震动中会断裂,输入整流器和滤波电容的穿通,逆变器一壁两个功率管的同时导通与几串等都会导致输入保险丝熔断。
  
  ③有的人对某品牌UPS电源特别熟悉,当改UPS电源不能启动时,就用改锥捅了一下直流继电器即可。而当另以品牌UPS电源上采用同样方法时,则烧毁了逆变器。
  
  七、交接故障
  
  交接故障主要是管理人员的前后配合不好造成的。
  
  ①实际管理机器而未被培训的人员和到厂家培训的人员不是同一批人。
  
  ②前面值机人员对机器进行的工作没有向后来者交代。例如,前面值机人员移动机器位置时而将UPS电源的外接电池组断开,时候又未向后来者交代,结果造成了市电和UPS电源同时停电的故障。
  
  八、环境故障
  
  环境故障是用户不重视机器的运行环境或没有能力优化环境造成的。
  
  ①有的用户将UPS电源放在了既无空调又无通风的环境中,夏季的室温高达40℃,又潮又湿,导致电池提前失效。
  
  ②有的地方供电条件很差,不但电压波动大而且还经常停电。工作在这种环境下的UPS电源电池经常放电,用户未向供货商提出快充电的要求,使电池长期处于亏点状态,也会导致电池早期失效。
  
  ③在雷电多发地或工业电干扰严重的地方,用户在输入配电盘内未配置一定级别的防雷器或浪涌控制器,致使UPS电源被损坏的现象时有发生。
  
  九、选型故障

  造型故障主要是用点者的一些糊涂概念造成的。例如,把UPS电源的效率当成了功率因数,把输入功率因数当成了负载功率因数和把视在功率当成了有功功率等;认为UPS电源负载功率因数越大越好,不懂得计算机之类的负载在目前不但需要有功功率更需要无功功率等。结果购回的UPS电源容量不是太大了就是太小了,选小了的UPS电源就会因频繁的过载而跳闸。
  
  十、商务故障
  
  商务故障主要是用户对供应商在价格和其他条件上的过分苛刻而造成的。
  
  ①UPS电源和其他机器一样,看起来有着同样的外壳、同样的内部电路环节等,但外壳的材料和元器件在质量上有着天壤之别,因此在造价上也相差很远。二者在一些功能和可靠性上不可同日而语。有些使用者不了解这些区别,而一味地要求不同档次的机器具有同等价格。供应商为了生意,不得不降低元器件的质量,结果使可靠性降低,故障率增加。甚至有的UPS电源压价太狠,容量合同签的是100kVA而拿到的确实60kVA的机器,原因是某厂家对二者采用的是同一机壳。
  
  ②有的使用者要求供货商对寿命为3~5年的抵挡电池做3年的免费担保,这本来是一个不太合适的要求,因从某种意义上讲,相当于在不清楚用户使用环境的情况下的终身免费担保。为了生意,供货商当然应允,日后也照样履行合同。但由于不断的故障、不断地更换电池,使UPS电源频频停机,给用户造成损失。


相关文章


UPS的防雷误区与防护方案

柴油发电机组与UPS匹配

机房UPS电源如何选择

UPS设计工程的实施技术

UPS蓄电池维护的必要性与建议

专注于数据中心基础设施运维与运营管理,分享运行维护经验,分享数据中心行业发展趋势及新技术应用。

合作交流:wj2012bj

QQ交流群: 108888484

投稿邮箱:[email protected]


数据中心运维管理

ID:wj-yunwei


▲长按二维码"识别"关注