1 直流电源系统绝缘监测工作原理
(1)绝缘检测功能
VERTIV高压直流电源直流输出标配母线绝缘监测功能,该功能由HDU实现,实时显示当前母线对地阻值。当系统选配了EGU01模块时,则不但支持母线绝缘检测,还能够实现支路绝缘检测,能够显示每个支路对地阻值,当某个支路发生绝缘下降时,产生对应告警。在实际应用中,母线绝缘监测和支路绝缘监测采取不同的监测原理实现,两者相结合,组成了一个完整的HVDC绝缘监测系统。
(2)直流母线的绝缘监测原理
HDU主机实时监测电源系统直流母排对地的绝缘状况,当发现直流母排对地绝缘故障时,计算出接地电阻值。主机在两种情况下启动:①正负母线对地电压不平衡时启动;②定时启动。目前高压直流电源采用直流法进行绝缘检测,其原理图如图1所示。
当绝缘功能使能后,正负母排对地各投入一个150kΩ电阻,测量正负母排对地的电压U1和U2;然后根据测量结果控制K1或K2,对正和负母排投入一对400kΩ和300kΩ或者300kΩ和400kΩ的电阻,再测量正负母排对地电压U1'和U2'。可列出一个二元一次方程组,通过方程组可以计算出正负母排对地阻值。
(3)直流支路的绝缘监测原理
由于主机不能发现是哪个支路接地,为了准确的判断直流电源系统绝缘下降的故障点,一般通过对电源系统的支路输出进行漏电流检测,根据漏电流的大小来判断绝缘电阻的对应的大小,给出支路绝缘故障的告警,其原理图如图2所示。
如图2所示,正负极性的电缆同时穿过漏电流传感器,在没有绝缘下降的情况下,正负极电缆通过的直流电流大小相等,方向相反,这样在直流互感器上不会产生感应信号。当有一极发生绝缘下降的时候,通过正负极的电流则不会再相等,这时互感器感应出这个电流差的信号。
支路巡检是通过对正或负母排对地分别投入30kΩ电阻,然后通过互感器测量正负母排之间的电流差值I,再根据主路检测的绝缘故障结果列出计算方程,从而计算出支路对地电阻值。
2 绝缘故障在维护过程中的难点
通过上面的介绍,绝缘监测仪的工作原理应该已经理解。但是需要提醒的是,在实际维护过程中,会发现绝缘异常点通常很难定位,排查过程也受到很多限制,很难操作。原因如下:
①HVDC系统复杂:实际应用中,HVDC直流
输出正负母排上会挂接各种各样的设备(详见图3),所有这些设备的对地电阻并联在一起,就形成了正负极对地的等效电阻。因此,母排上任何一点的绝缘下降均会导致系统绝缘故障,也就是说系统绝缘故障的原因可能是挂在母排上的任意设备或任意点的绝缘下降。故障排查时,需要用排除法一个设备一个设备的排除挂接在母排上的所有设备,包括整流模块、蓄电池、母排绝缘端子、直流电表、各个负载支路等等。
②绝缘故障排查困难
从图3可以看出整个系统非常庞大,挂接在母排上的设备繁杂多样,系统接线复杂且要跨区域穿插,配置有蓄电池储能设备,运行时都是高压大电流。这些都决定了故障排查时操作时风险很高,但数据中心设备对系统的可靠性要求又非常高。其中最最关键的是负载设备一般不许停电检修,这对只能靠排查法来找故障点的问题处理方法,提出来很大的挑战,甚至可以说是一筹莫展、无能为力。
3 HVDC电源系统绝缘故障案例
(1)故障描述
2019.11.05,VERTIV某客户一套高压直流设备报绝缘告警,告警记录为“绝缘电阻不平衡”,故障一直持续,无法消除。客户要求我司到现场分析原因,协助排查故障,保证设备运行安全。具体告警记录见图4。
(2)设备信息
①系统基本信息
系统型号:NetSureHVTE01CN1
系统编码:01070728
交流输入:380-415V~3W+PE3×204A50Hz/60Hz
直流输出:240V/1200AMAX360kW
配置信息:24个R240-15K整流模块,2组1000A电池,有负载支路绝缘监测负载信息:5路负载,每路负载几十安培电流。
②系统外观(见图5)
客户现场设备采用的是VERTIV典型的三柜系统,配置为360kW。
③高压直流供电系统框架(见图6)
系统总共5路负载支路输出,每个支路带绝缘监测功能。
(3)事件检查和前期处理过程
办事处交付同事应客户要求,及时赶赴现场了解和确认了相关情况:
①系统告警记录为“绝缘电阻不平衡”,为当前告警记录,告警无法消除,情况与客户反馈一致,故障确实存在。
②按照以往经验,交替拔出了所有电源模块,以排查电源模块绝缘异常,结果告警仍然没有消失,与电源模块无关。
③为了排除电池绝缘异常,和客户维护人员一起,也切断过电池开关,将电池从母排切除,结果告警仍然存在,与电池电路无关。
④同时更换了配电监控板-HDU板,绝缘告警还是存在,与HDU板也无关。现场直流柜5个支路都接有负载,客户不同意停电检查,需要尽量缩小故障范围,减少对负载设备的停电影响。我司交付工程师在现场想尽了办法,问题仍然无法解决问题,请求公司支持。
(4)现场分析处理
①第一次现场分析
·确认故障现象:系统告警记录为“绝缘电阻不平衡”,主监控M822E和配电监控HDU都有相应的当前告警记录,且告警无法消除,情况与客户反馈和前期分析的情况一致,故障确实存在;
·“绝缘电阻不平衡”的触发逻辑:主机在进行绝缘管理时,首先会根据正、负母排对地电压的差值进行“绝缘电阻不平衡”告警。工作原理是:在主机开启绝缘功能后,会一直投入一组150kΩ电阻,称为固定臂,此时正、负母排对地的电压值约为276.5/2=138.5(V)。在没有发生绝缘故障的时候,正、负母排对地之间分压电阻(即固定臂)相差较小,正、负母排对地电压相差也就较小,不会触发告警。如果正、负母排对地的电压之差大于电压告警点(默认60V),说明正、负母排对地存在故障电阻,即触发“绝缘电阻不平衡”告警;
·正负母排对地电压差确认:用万用表直流电压档分别测试直流输出母排正、负极对地的电压,正母排对地电压为179.8V,负母排对地电压为96.7V,电压差值为83.1V,明显超过60V。可以确认绝缘监测系统工作正常,系统确实存在绝缘故障点,排除了绝缘监控的误告警;
·系统直流配电及绝缘监测原理图如图7所示,从图7可见,本电源系统影响母排对地绝缘的因素主要有:整流柜内的整流模块和直流汇流排、直流配电柜内的母排、配电监控HDU、蓄电池支路、直流防雷器、直流柜内的辅助电源、支路绝缘监控设备EGU01、5个负载支路。其中,整流模块、蓄电池支路、配电监控HDU前期已经做了排除,而整流柜内的直流汇流排、直流配电柜内的母排在负载没有全部断电的情况下无法进行排查,而对负载全部断电排查很显然不可能(通过对5个负载支路做排查不可能)。剩下能做的是对直流防雷器、直流柜内的辅助电源、支路绝缘监控设备EGU01进行排查;
·对剩余可能的部件进行排查:取下直流防雷器、取下直流柜内的辅助电源、取下支路绝缘监控设备EGU01。结果显示正、负母排对地电压差一直没有变化,证明绝缘异常和这些部件没有关系;
·分析推理结论:可以确定,问题出在整流柜内的直流汇流排,或直流配电柜内的母排,或某个负载支路(即5个负载支路中的某个支路或多个支路)。而且根据经验,我们几乎可以肯定是客户负载支路的问题,但到目前为止,我们仍然拿不出可以说服客户的数据或者证据,而且客户仍然坚持让我们尽量缩小故障排查范围(指负载支路);·由于当天EGU01的通信一直没能连上,监控的相关数据没法读取,现场已经没有办法继续分析处理,于是先屏蔽了相关告警,等待下次现场分析。如何找到负载支路绝缘异常的证据或数据,是我们面临的挑战。
②第二次现场分析
第二次现场分析,我们提前做了多种设想和研讨,同时也做了充分的准备。
·告警逻辑的深入分析和理解:只有“绝缘电阻不平衡”告警,而没有产生“主路绝缘告警”,是故障难以判断的主要原因。因为现场系统绝缘监测系统是可正常工作的,又配置了支路绝缘监测,如果绝缘电阻值下降到门槛值(默认值<28kΩ),即主路发现绝缘故障时,主机会直接或者通过从机发送巡检命令给EGU01,同时投切30kΩ电阻来配合支路的故障电阻检测,从而能自动找出绝缘异常负载支路。但很显然,目前系统的绝缘电阻值没有达到报绝缘故障的门槛值,支路绝缘监测没有启动;
·软、硬件装备的准备:工具准备:USB转485通信线缆、绝缘测试电阻(20kΩ/3W)、螺丝刀、斜口钳等。备件准备:配电监控HDU板、支路绝缘监测模块EGU01;仪器设备:正负12V辅助电源、开口霍尔电流传感器、便携电脑、万用表、钳型表;软件准备:EGU01后台工具,并且在公司内部对EGU01进行了后台连接,读取相关数据。
·问题的突破口:从支路绝缘监测原理可以发现,支路绝缘检测电路,正负极性的电缆是同时穿过漏电流传感器,在没有绝缘下降的情况下,正负极电缆通过的直流电流大小相等,方向相反,这样在直流互感器上不会产生感应信号。当有一极发生绝缘下降的时候,通过正负极的电流则不会再相等,这时互感器会感应出这个电流差的信号。支路绝缘监测仪,会采集到对应的数据,尽管没有达到告警的门槛。因此读取支路绝缘监测仪EGU01的采集数据,是找到问题原因的关键。读取支路绝缘监测仪EGU01的采集数据,首先必要保证电脑后台与EGU01之间要通信正常,这和后台软件、USB转485通信线缆、电脑COM口、波特率、支路绝缘监测模块EGU01都有直接的关联。第一次现场分析读不到数据,通信连不上是主要原因。其次,必须要使电源系统的EGU01启动支路巡检,只有在支路巡检启动的前提下,EGU01才能够采集支路相关的绝缘数据。那么,如何使EGU01启动支路巡检呢?根据绝缘监测系统工作逻辑,只有在主路发现绝缘故障时,即绝缘电阻值下降到门槛值时(默认值<28kΩ),主机才会直接或者通过从机发送巡检命令给EGU01,同时投切30kΩ电阻来配合支路的故障电阻检测。我们想到的办法是模拟绝缘故障的发生,用一条20kΩ的电阻线缆(自制),连接高压直流输出正母排对地,或负母排对地,从而启动主路和支路巡检;
·其他的办法准备:在读取EGU01数据无效的情况下,我们准备用开口霍尔电流传感器,加上辅助电源后,用万用表读取漏电流转换为电压的电压值,根据电压值的差异,来判断故障产生的负载支路。但实际上我们并没有走到这一步,用读EGU01监控数据的方发,我们已经可以解决了问题;
·触发主路和支路绝缘告警:到现场后,我们放开了前期屏蔽的绝缘告警,用模拟绝缘故障的方法触发主路和支路绝缘告警,结果如下:用20kΩ电阻线缆将正母排对地连接,系统告警消失。用20kΩ电阻线缆将负母排对地连接时,系统相继告“绝缘电阻不平衡”告警和“主路绝缘告警”。
从模拟试验的情况,说明系统绝缘异常发生在负母排,用20kΩ电阻将正母排对地短接,反而均衡了正负母排对地电阻,无法模拟出故障。因此需通过短接各支路的负排,来触发支路的巡检,继而读取相关数据;
·EGU01监控数据:打开EGU01后台监控软件,通过RS485连接EGU01支路绝缘检测模块。分别对第1路、第2路、第3路、第4路、第5路负母排,用20K电阻对地连接后,查看EGU01监控数据,可以发现第4#支路电阻和第4#支路传感器电压和与1#、2#、3#、5#有明显差别,可以判断4#支路有绝缘异常。
(5)分析结论和对策
通过分别对第1路、第2路、第3路、第4路、第5路负母排用20kΩ电阻接地短接,触发系统主路和支路绝缘告警,然后分析EGU01监控数据。可以发现4#支路电阻和4#支路传感器电压和与1#、2#、3#、5#的数据有明显差别,从而可以判断4#负载支路存在绝缘异常。客户可以申请4#负载支路停电验证和排除故障。
(6)客户申请负载停电验证和排除故障
通过我们的跟踪了解,客户在一周后对4#负载支路进行了停电排查,并且据客户反馈,当将4#负载支路从系统切除后,电源系统“绝缘电阻不平衡”告警立即消失,系统恢复正常。后面的问题我就不关心了,听说客户通知了服务器厂商在继续分析找原因。但4#负载支路从系统切除后,电源系统恢复了正常,这个事实验证了我们的分析结论,同时说明我们的分析思路、分析方法是正确的,是可以推广的。
4 直流电源系统绝缘故障的现场解决方案
(1)HVDC告警逻辑梳理
①绝缘不平衡告警:如果正负母排对地的电压之差大于电压告警点(默认60V),说明正负母排对地存在故障电阻。HDU首先发出“绝缘电阻不平衡”告警;
②主路绝缘告警:在发生绝缘电阻不平衡或者定时巡检时间到的情况下,主机会根据正负排对地电流平衡原理,进行电阻投切,然后列方程计算出故障电阻。若母排对地电阻值低于28kΩ告警阀值,则产生“主路绝缘告警”。根据计算的准确值,还会产生告警“正母排绝缘故障”,“负母排绝缘故障”或“正负母排绝缘故障”;
③支路绝缘故障:在主路发现绝缘故障时,主机会直接或者通过从机发送巡检命令给EGU,同时投切30kΩ电阻来配合支路的故障电阻检测。如果EGU发现阻值小于电阻告警限值,则告支路绝缘故障,并上传给相应的监控。模拟负载支路绝缘异常产生的告警情况,详见图8。
(2)问题分析处理思路
①确认故障现象:例如确认主监控M822E和配电监控HDU是否都告“绝缘电阻不平衡”告警,且告警无法消除;
②正负母排对地电压差确认:用万用表直流电压档分别测试直流输出母排正负极对地的电压,正负母排对地电压差是否超过60V,排除了绝缘监控的误告警;
③EGU01连接后台监控:通过USB/485转换线缆,连接电脑和EGU01,打开EGU01后台调试软件,确认通信连接成功,能够读取监控数据;
④模拟主路、支路绝缘故障:用20K电阻将正负母排、各个支路对地短接,触发系统主路和支路绝缘告警,应该看到监控屏上有相应的告警产生;
⑤EGU01绝缘数据分析:主要是对比各支路电阻和各支路传感器电压,如果某个支路的数据有明显差别,从而可以判断此负载支路存在绝缘异常;⑥如果支路绝缘数据无异常,那就要考虑用排除法逐一排查挂接在母排上的其他各个部件。
(3)软硬件工具和装备的准备工具准备
USB转485通信线缆、绝缘测试电阻线(20K/3W)、螺丝刀、斜口钳等;备件准备:配电监控HDU板、支路绝缘监测模块EGU01;仪器设备:正负12V辅助电源、开口霍尔电流传感器、笔记本电脑、万用表、钳型表;软件准备:EGU01后台工具(最新版),并且在公司内部对EGU01进行了后台连接,读取相关数据。
(4)后台软件的使用和后台通信的连接
首先要保证电脑COM口正常、USB/485转换接口线缆正常、接线正确、EGU01正常。其次要在EGU01后台调试软件主界面完成相关参数设置,如图9所示。
波特率:9600;
通讯口:COM1(选电脑实际的通讯口);
子站地址:80;
然后设置按键,会提示是否配置成功;
最后选择EGU01绝缘检测页面,看到监控数据是否有显示,有即表示通信成功。
(5)触发支路绝缘监测启动
方法是模拟主路、支路绝缘故障,即用20K电阻将正负母排、各个支路对地短接,触发系统主路和支路绝缘告警。用20kΩ电阻将正负母排对地连接,可以判断出是正母排还是负母排对地绝缘故障。用20kΩ电阻将各负载支路对地连接,可以触发支路绝缘告警。触发系统主路和支路绝缘告警,应该看到监控屏上有相应的告警产生。
(6)分析和判断绝缘监控数据
主要对比两类数据:即“支路电阻”和“支路传感器电压”。一般情况下,如果某个支路的绝缘数据和其他没有对地短接电阻的支路的绝缘数据相比,存在明显差异,那这个支路就是存在问题的支路。操作上可以多做几次模拟故障,多对比几路支路的数据,从而减少误判。
5 结束语
在高压直流电源系统中,正、负母排对地的绝缘正常,是保证系统安全、人员安全的必要条件。日常维护中,我们会受到很多现场条件的限制,比如客户端负载不能断电排查,给我们的维护工作带来了很多困难,甚至是束手无策。但出现问题必须得解决,我们唯一能做到是,通过我们对系统工作原理的更加深入的学习和了解,通过对其运行逻辑的深入剖析,去寻找问题解决的突破口。然后理顺问题的分析思路,确定问题分析的具体方案,准备好相应的工具、设备和仪器,到现场去最终验证和找到问题解决办法,并最终解决难题。这个问题,我前后跑了两次现场,在内部研究、讨论了很多种分析和测试方案,并最终解决的现场问题,觉得对大家解决类似问题有较大的参考价值,于是我整理了以上分析过程和经验,希望能给大家带来帮助。
参考文献
[1]廖革文.直流系统绝缘监测的原理和应用VertivCo服务,2019.2.27.
[2]钟景华等著.中国数据中心运维管理指南[M].北京:机械工业出版社,2016.
[3]中国通信企业协会通信网络运营专业委员会|编著.数据中心基础设施维护规程[M].北京:电子工业
出版社,2016.[4]王兼仁.变电站绝缘在线监测系统[J].电站系统工程,2010,18(1):57-59.
作者简介
吴洪波,DC-Power技术支持工程师。主要从事通信电源与高压直流电源技术支持工作。
编辑:Harris