数据中心在线式UPS市场中,工频机、高频机和模块机是三种常见的机型,模块化UPS以其下特性逐渐成为行业关注的焦点:
①功率模块可实现在线热插拔,在配电容量和蓄电池后备时间满足的情况下,可实现在线按需扩容;
②可以根据负载率调整在线工作功率模块的数量,使剩余模块很容易到达最佳运行效率点,从而获得系统的最高运行效率;
③因其可以调整在线运行功率模块的数量,不工作的功率模块将成为冗余备份模块,形成“N+X”冗余系统(N为非冗余功率模块数量,X为冗余功率模块数量),提高了系统的可靠性。
1 模块化UPS可靠性分析
假设该主机内系统中各UPS功率模块之统计上是相互独立,即不存在相关性。下面重点从模块化UPS冗余功率模块数量对系统可靠性的影响和功率模块自身可靠度对主机可靠性影响两个方面对模块化UPS可靠性进行定量计算和定性分析。
(1)模块化UPS冗余功率模块数量对系统可靠性的影响
①N+0配置方式可靠度分析
UPS主机采用N+0时,即功率模块系统不存在冗余度,当一个小容量功率模块出现故障,剩余模块不能负担负载容量,将会影响UPS整机的正常运行,此时逻辑上各功率模块可靠性为串联关系,此时可靠度数学模型为:
(1)
式中RS(t)表示模块化UPS主机的可靠度,Ri(t)表示功率模块的可靠度。
在行业内采用小容量功率模块堆叠方式构成大容量UPS的机型,因其不能做到故障退出,任何一个功率模块故障均会影响UPS整机的正常运行,对其进行可靠性分析时应采用该模型。
②N+1配置方式可靠度分析
由参考文献1可知,并联系统可靠度数学模型可用下面模型进行描述:
(2)
当UPS系统内部存在一个功率模块冗余时,主机内任何一个功率模块故障均不会影响UPS整机的运行,只有当两个及以上功率模块出现运行故障时才会影响系统的正常运行,逻辑上相当于CN2个“1+1”系统串联运行,此时的可靠度数学模型为(假设各模块可靠度相等,即Ri(t)为恒定值):
当N≥2时
(3)
当N<2时RS(t)按单模块考虑。
③N+2配置方式可靠度分析
当UPS系统内部存在两个功率模块冗余时,主机内任何两个UPS功率模块故障均不会影响UPS整机的运行,只有当三个及以上功率模块出现运行故障时才会影响UPS主机的正常运行,逻辑上相当于CN3个“1+2”系统串联运行,此时的可靠度数学模型为
当N≥3时
(4)
当N<3时按单模块及式(3)考虑。
④N+3配置方式可靠度分析
当UPS系统内部存在三个功率模块冗余时,系统内任何三个功率模块故障均不会影响UPS主机的运行,只有当四个及以上功率模块出现运行故障时才会影响UPS主机正常运行,逻辑上相当于CN4个“1+3”系统串联运行,此时的可靠度数学模型为
当N≥4时(5)
当N<4时按单模块、式(3)及式(4)考虑。根据公式(2)~(4),下面以一个主机10个模块为例(为方便分析假设单功率模块可靠度为0.9),分别画出上述四种不同冗余数量与可靠度对应关系的曲线,如图1所示
从图1中可以看出:
①“N+0”可靠度曲线是一个递减的曲线,主机的可靠度在一个功率模块时达到最大值,而后随着主机内并机功率模块数量的增加可靠度曲线出现递减趋势;
②“N+1”配置时,主机可靠度曲线在两个功率模块即“1+1”时达到最大值,而后随着功率模块数量增加出现递减趋势,当系统内功率模块数量为N=5时可靠度数值与单个模块的数值接近;
③“N+2”配置时,主机可靠度曲线在三个功率模块即“1+2”时达到最大值,而后随着功率模块数量增加出现递减趋势,当N值为9和10之间时可靠度数值与单个模块的数值接近;
④“N+3”配置时,主机可靠度曲线在四个功率模块即在“1+3”时达到最大值,而后随着功率模块数量增加出现递减趋势,当N值达到10时主机可靠度仍大于单模块可靠度。
从上述分析中可以看出随着冗余功率模块数量的增加系统可靠度随之增加,“N+X”系统可靠度的最大值出现在N数量为“1”时,即主机内所有功率模块在逻辑上都是并联运行关系。当N>1时则进入串联逻辑,此时系统可靠度随着并联功率模块数量的增加而降低。
(2)模块化UPS功率模块容量对系统可靠性的影响
在实际设计时应考虑模块“颗粒度”即模块容量大小对系统可靠性的影响,当按《数据中心设计规范》GB50174-2017第8.1.7条、公式(8.1.7-1)进行设计时UPS应留有余量,UPS基本容量不应小于1.2倍计算负荷,即:
E≥1.2P (6)
式中E——不间断电源系统的基本容量(kW/kVA);
P——电子信息设备的计算负荷(kW/kVA)
由式(6)可知“余量”容量为:
(7)
由式(7)可知,满足标准设计要求的“余量”容量最小值为,即其值不是必须为这一值,它可以取更大的值。因模块化UPS具备根据负载率调整在线工作功率模块的数量,剩余模块进入休眠备份状态的功能,即当实际负载容量小于UPS容量时,就会有一部分功率模块进入休眠状态。然而当功率模块容量过大,大于“余量”容量时,所有功率模块均在线工作,无法实现部分模块的休眠。
由图1可知当系统中存在冗余功率模块时,系统可靠性将大大提高。为此,当实际负载容量不超UPS容量时,为提高系统可靠性应使单体功率模块容量不大于“余量”容量,使UPS内部功率模块形成“N+X”系统。当X=1时为最经济配置,即功率模块最大容量为UPS单机容量的倍,否则按标准设计时主机内部功率模块形不成冗余而使系统可靠性降低。
例如,目前数据中心经常使用的400kVA、500kVA、600kVA的UPS,为实现至少一个独立模块的功率冗余,功率模块容量不应大于为400×=67kVA、500×=84kVA、600×=100kVA。
另外,功率模块的容量并不是越小越好,从图1可以看出N数值越大系统可靠性越低;也不是X数值越大越好,X数值太大则会使系统成本升高、性价比降低,也使系统的负载率降低,运行效率低下。因此在选择功率模块容量及主机容量时应综合考虑各方面因素以达到最优配置。
(3)功率模块自身可靠度对主机可靠性影响
下面以“N+1”配置方式即式(2)研究主机可靠性与功率模块可靠性的关系。取功率模块“Ri=0.85”、“Ri=0.9”和“Ri=0.95”三种可靠度数值,图2给出了相应的可靠度曲线。
从图2中可以看出,在主机内功率模块都采用“N+1”配置方式时,在平面坐标系中不同可靠度曲线所处位置的高低与功率模块可靠度数值大小一致,在功率模块“Ri=0.95”时可靠度最高、在“Ri=0.9”时次之,在“Ri=0.85”最低。说明在功率模块配置方式一样时,功率模块的可靠度是决定UPS主机可靠度的关键因素。
2 功率模块设计和实际应用应注意的问题
模块化UPS的设计理念区别于塔式设计的UPS,其所有的功率模块层叠在同一个机架当中,且都是水平摆放,在进行风道设计时不能利用自然对流只能依靠风扇强制风冷降温;为提高功率密度,模块间距离及模块内部器件间距离设计的都很小;对安规设计和散热设计提出了非常高的要求。
在数据中心配电设计时通常只考虑一次故障,但模块化UPS由于其特殊的物理架构不仅应考虑一次故障而且应考虑由一次故障引起的二次故障。例如,当某个功率模块内部电路由于绝缘破坏、电气间隙和爬电距离余量过小等原因导致两极间具备燃弧条件时出现电弧性短路,其短路电流由于受阻抗影响数值不大,不会引起断路器等保护器件的马上动作。致使其持续时间长、温度高且伴随等离子体辐射,很容易引起模块起火。高温使临近模块绝缘被破坏、产生的烟雾内所含导电物质使爬电距离和电气间隙被破坏。进入连锁反应,主机内所有模块都有可能会出现故障甚至燃烧。因此功率模块在允许的情况下应预留足够的空间以提高污染等级,避免发生电弧短路等二次故障,平衡可靠性和功率密度,不违背使用不间断电源的初衷。
此外,模块化UPS在组成并联系统时其失效模式不同于传统的塔式UPS并联方式。例如,系统由两台500kVA模块化UPS并联而成,功率模块容量为50kVA。某一时刻负载容量为940kVA,两台UPS均分负载,即单机带载量为470kVA,假设其中一台UPS中的一个模块因故障退出,此时UPS剩余容量变为450kVA,处于过载状态,一段时间后转旁路工作,随之整个系统都转旁路工作由市电直接供电,系统将处于不可靠状态。此时系统中两台UPS内可使用的功率模块总容量是大于负载容量的,有没有一种控制算法可以不受主机柜边界的限制,将两个主机柜内的功率模块无差别的融合在一起。由参考文献1和参考文献2可知,如果功率模块采用伊顿专利的HotSync®热同步控制算法,可实现并机系统内一个模块退出后,剩余功率模块不受主机柜边界的限制自动均分负载,达到不同主机内的功率模块无差别的融合成一个整体的目的,即不同容量的UPS并机。
3 伊顿在提升功率模块可靠性方面做的工作
伊顿始终把UPS的可靠性放在第一位,在提升模块化UPS可靠性主要做了以下工作:
①采用改善三电平电路,保证拓扑结构的可靠性;
②使用了SiC混合型IGBT封装模块,集成了第三代碳化硅半导体技术与第六代IGBT半导体技术,使IGBT模块具备更好的抗冲击性、过电流保护和更高的效率,解决了分立器件在大功率应用下,外部并联的批次匹配和均流问题,保证了核心器件的可靠性;
③对电路板进行了三防保护、优化了风道布局,避免了环境因素对主机的影响,模块采用4U设计为安规设计预留充足的空间;
④使用了长寿命、免维护、更安全的油浸式铝壳薄膜电容,相对于目前市场上大部分模块化UPS使用的塑壳薄膜型电容,可以从根本上降低湿度和温度应力对电容寿命的影响,避免了电容在失效模式下的起火风险;
⑤使用了行内可靠性最高的“热同步”并机技术,功率模块间无信息交互通信,消除由并机方式带来的可靠性降低的隐患。该技术允许不同容量的UPS并联,避免了传统并机系统中一台UPS中的某个功率模块故障导致并机系统中各UPS容量不一致产生的主机间均流问题的发生;
⑥100kAIC超高短路分断能力,能够及时分断负载或线路出现的短路电流,静态旁路模块标配快速熔丝保护以确保短路故障下的安全操作;
⑦提供基于云技术的了PredictPulse7x24h远程监控服务,实时监控和器件级的诊断分析预测,一旦发现异常,将通过伊顿完善的服务网络,提供第一时间进行运维服务。
4 结束语
综上所述,模块化UPS冗余功率模块数量、功率模块容量以及功率模块可靠度决定了数据中心模块化UPS供配电系统的可靠性。为获得更高的可靠度,UPS应选择最佳颗粒度的功率模块容量和机架容量,用以实现UPS内部和供电系统的“N+X”冗余。尽可能通过各种方式提高功率模块电路设计、器件选择和安规设计的可靠度;除考虑冗余、功率模块可靠性之外还应考虑静态旁路、蓄电池、并联控制方式和一次故障保护机制等辅助系统的可靠度,只有所有子系统无短板整个系统的可靠性才能提升。
参考文献
《数据中心UPS供电系统中并机台数与可靠性的关系分析》曾显达、徐华锋
《数据中心UPS供电系统中并机技术与可靠性的关系分析》曾显达、周文县、徐华锋
《新一代绿色数据中心的规划与设计》钟景华、朱利伟、曹播、丁麒钢等《数据中心设计规范》GB50174-2017
作者简介
曾显达,伊顿电源(上海)有限公司高级应用架构师,从事UPS技术工作和数据中心架构设计多年,对UPS产品及供配电系统有较深入的研究。
王星,伊顿电源(上海)有限公司高级应用架构师,具有多年在数据中心基础架构设计和UPS应用技术领域的从业经验,对数据中心一体化架构和UPS产品有较深入的研究理解。
徐华锋,伊顿电源(上海)有限公司应用架构经理。05年至今一直从事UPS相关技术工作,对UPS产品、供配电系统以及数据中心的架构设计有较深入的研究。
编辑:Harris