咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
设为首页 | 收藏本页
UPS常见故障及处理方法
  • 尽管UPS的供电架构设计方面已尽可能做到完善,但在UPS运行过程中,仍会不可避免地出现UPS单机故障的情形,如果不能及时处理,有可能造成故障扩大,影响数据中心供电的可靠性。表1列出了UPS的一些常见故障及处理方法。
  • 尽管UPS的供电架构设计方面已尽可能做到完善,但在UPS运行过程中,仍会不可避免地出现UPS单机故障的情形,如果不能及时处理,有可能造成故障扩大,影响数据中心供电的可靠性。

      当UPS出现故障影响供电安全时,值班运维人员须依据EOP文件组织实施应急处置工作。下面为某数据中心EOP文件中某一场景示例,展示了UPS出现相应故障时的应急处理流程。
      
      1、EOP文件示例1
      
      以下为某数据中心EOP文件中的一部分内容,描述了IT负载UPS单机或多机故障的场景及处理方法。
      
      场景:IT负载UPS单机或多机故障
      
      1.1场景描述
      
      为某数据中心2#楼2~4层IT系统配置16×3台500kVA的UPS,每层配置16台UPS,2~4层的2-1号配电室每两组4台UPS和2-2号配电室对应的两组4台UPS组成2N架构,为IT系统提供A/B两路UPS电源。
      
      IT负载UPS故障分单机故障和多机(二台、三台、四台)故障两种情况。
      
      当班运维人员4人,1人在ECC值守监控系统,3人按计划巡视不同区域,监控突然报警配电室IT负载UPS单机或多机故障,ECC人员通过对讲机呼叫值班长、电气岗运维人员,通知电气监控报警内容。
      
      该事件为严重性突发事件,事件等级为二级。
      
      1.2ECC指挥
      
      1.2.1初步原因分析及影响判断
      
      IT负载UPS单机或多机(二台、三台、四台)的整流或逆变模块故障,造成无法正常运行或无法并机逆变输出,影响下级列头柜供电。
      
      1.2.2汇报流程
      
      ECC监控员1名、暖通岗运维人员1名、电气岗运维人员1名、值班长1名。监控员执行监盘工作,在事件告警2min内派事件单,并通报给其他值班员及值班长。值班长在5min内将事件告警信息上报运维经理、运维主管,并与现场处理人员通过对讲机保持联系,掌握事件进程和处理结果,及时向上级汇报。值班长和一名电气岗运维人员现场查看报故障UPS界面告警信息。
      
      1.2.3指挥口令
      
      ECC指挥人员应具备掌握全局的能力,应将报警内容完整复述给现场处理故障人员。
      
      1.3现场处理过程
      
      1.3.1现场检查核实
      
      运维人员现场查看UPS界面告警信息,查看IT负载UPS是单机故障还是多机(二台、三台、四台)故障,并确认故障原因是UPS主机部件损坏,汇报运维经理、运维主管并联系厂家进行维修处理。
      
      1.3.2现场处理方法
      
      现场查看报故障UPS界面告警信息,如果无法复位,则确定为UPS部件故障,并按照UPS负载率决定UPS的工作模式,将故障UPS隔离出来,查看下级负载供电正常,最后联系厂家进行处理。
      
      1.3.3现场处理步骤
      
      现场处理步骤具体如下:
      
      (1)运维人员巡检发现或动环监控告警IT负载并机UPS故障。
      
      (2)查看UPS告警信息,进行故障复位,若故障无法复位,则确认为UPS单机或多机故障。
      
      (3)如UPS为一两台故障,需计算该并机系统总负载,该总负载若不大于剩余UPS容量的一半(45%),则将故障UPS退出并机系统,负载由另两台UPS继续供电。
      
      (4)如该总负载大于剩余容量的一半(45%),则将该UPS整个并机系统转维修旁路,负载由维修旁路继续供电。
      
      (5)如UPS为三台故障,则一种情况为负载容量大于单机容量而使整个系统转静态旁路;另一种情况为负载容量不大于单机容量,剩余这台UPS不会转静态旁路,正常工作,这种情况又分为以下两种具体情形:
      
      负载容量不大于单机容量,但是大于单机容量的45%,则运维人员将单机转静态旁路工作,再将整个系统转维修旁路,负载由维修旁路继续供电。
      
      负载容量小于单机容量的45%,负载由剩余的单机UPS继续供电,运维人员将故障UPS退出并机系统进行维修。
      
      (6)如并机系统四台UPS全部故障,则系统转静态旁路工作,运维人员再转维修旁路,负载由维修旁路继续供电。
      
      (7)检查UPS主机,判断故障类型(整流、逆变故障等),分析故障产生原因,联系厂家进行现场支援,并恢复UPS系统。
      
      (8)事件闭环后编写事件报告。
      
      数据中心基础设施运营管理
      
      专注数据中心基础设施规划设计、建造施工、测试验证及运营管理,分享行业发展趋势及新技术应用。
      
      2、EOP文件示例2
      
      以下为某数据中心EOP文件中的一部分内容,描述了UPS外部断路器故障的场景及处理方法,供读者参考。
      
      场景:UPS外部断路器故障(框架断路器)
      
      UPS外部断路器分为UPS外部输入断路器和UPS外部输出断路器,UPS外部输入断路器分为UPS外部主输入断路器、UPS外部旁路输入断路器、UPS外部维修旁路输入断路器。
      
      场景:一台断路器故障。
      
      2.1场景描述
      
      情况一:当班运维人员4人,1人在ECC值守监控系统,3人按计划巡视不同区域,监控报警XX机房XXUPS外部输入断路器跳闸告警。
      
      情况二:当班运维人员4人,1人在ECC值守监控系统,3人按计划巡视不同区域,监控报警XX机房XXUPS外部输出断路器跳闸告警。
      
      另外,外部维修旁路故障是指UPS负载已经切换到维修旁路供电模式下发生断路器故障。
      
      ECC值守人员通过对讲机呼叫值班长及其他电气岗运维人员,通知电气监控报警内容。
      
      该事件为严重性事件,事件等级为二级。
      
      2.2ECC指挥
      
      2.2.1初步原因分析及影响判断
      
      初步判断为断路器本体故障,影响下级UPS工作,影响下级列头柜、弱电设备或动力设备供电。
      
      2.2.2汇报流程
      
      ECC监控员1名、暖通岗运维人员1名、电气岗运维人员1名、值班长1名。监控员执行监盘工作,在事件告警2min内派事件单,并通报给其他值班员及值班长。值班长在5min内将事件告警信息上报运维经理、运维主管,并与现场处理人员通过对讲机保持联系,掌握事件进程和处理结果,及时向上级汇报。
      
      2.2.3指挥口令
      
      ECC指挥人员应具备掌握全局的能力,应将报警内容完整复述给现场处理故障人员。
      
      2.3现场处理过程
      
      2.3.1现场检查核实
      
      情况一:运维人员现场查看是UPS外部主输入断路器还是UPS外部旁路输入断路器或UPS外部维修旁路输入断路器故障,检查发现UPS整流器关机、蓄电池逆变放电或者静态旁路故障等告警信息。
      
      情况二:运维人员现场查看UPS外部输出断路器跳闸,UPS负载由另一路承担。故障由ECC人员汇报值班长,值班长汇报上级主管和运维经理。
      
      2.3.2现场处理方法
      
      运维人员现场查看故障断路器已分闸,将其摇出至分离位,在备件中找到一台同款的低压断路器替代。查看另一路供电正常,下级负载UPS、列头柜供电正常。排查故障断路器本体及二次控制线,将故障原因排查出来并处理。
      
      2.3.3现场处理步骤
      
      现场处理步骤具体如下:
      
      (1)运维人员巡检发现或监控系统报UPS外部输入或输出断路器故障,确认故障断路器已分闸,将其摇出至分离位。
      
      (2)检查运行正常一侧的变压器与对应UPS正常。
      
      (3)对于弱电系统UPS:
      
      如果是UPS的外部主输入断路器故障,则将UPS切换到内部维修旁路供电。
      
      如果是UPS的外部输出断路器故障,则将UPS切换到维修供电模式。
      
      (4)对于暖通动力系统UPS,如果单台外部断路器故障:
      
      如果是UPS的外部主输入或旁路输入断路器故障,看剩余UPS的负荷率是否大于90%,如果大于则将UPS并机系统切换到外部维修旁路供电,如果小于则仍然保持UPS并机系统供电,只将故障断路器对应的那台UPS退出运行
      
      如果是UPS的外部维修输入断路器故障,则在故障处理前闭合3台内部维修旁路开关,故障修复后,在确认外部维修断路器闭合的情况下,再断开3台内部维修旁路开关。
      
      如果是UPS的外部输出断路器故障,则看剩余UPS的负荷率是否大于或小于全部UPS负荷的90%容量,如果大于则将UPS系统切换到外部维修旁路供电,如果小于则仍然保持UPS并机系统供电,只将故障断路器对应的那台UPS退出运行,检修故障断路器。
      
      (5)对于IT负载UPS,如果单台外部断路器故障:
      
      如果是UPS的外部主输入断路器故障,剩余UPS仍然能够承担动力负荷,尽快在附件中找到一台同款的低压断路器替代故障断路器。
      
      如果是UPS的外部维修输入断路器故障,则在故障处理前闭合4台内部维修旁路开关,故障修复后,在确认外部维修断路器闭合的情况下,再断开4台内部维修旁路开关。
      
      (6)排查UPS外部输入或输出断路器故障原因,如果现场故障解决则恢复原工作模式。
      
      (7)如果现场不能解决故障问题,
      
      编辑:Harris
      
      

  •