1 系统故障率分析
随着模块化UPS系统内模块并联数量的增加,系统的故障率也会显著上升[1]。而系统的故障率与后期运行维护成本TCO相关联,系统故障率越高,TCO运维成本也越高。TCO的成本包括模块的维修费用、运维人员的工作量、物流管理费用等。故障模块的更换会涉及到更换新模块、人工维修成本的增加,以及对客户运行所产生的困扰。虽然功率模块的故障不至于引起UPS系统的输出中断,但是必须对此引起足够重视。
为了解决以上问题,需要考虑在设计中提高功率模块的MTBF值,这个MTBF值必须大大高于传统的MTBF值。MTBF即平均无故障时间,是指产品从一次故障到下一次故障的平均时间,是衡量一个产品的可靠性指标,单位为h。平均无故障时间MTBF=1/λ,λ为故障率。按照MTBF的定义,传统的功率模块MTBFM值在300000h左右。本文所讨论的MTBFM数值均指功率模块本身,不包含在静态旁路的工作。由于功率模块的故障率λM是单个功率模块的故障率,如果系统由K个模块并联组成的话,系统的故障率为
在模块化系统的使用寿命中,模块故障的次数为
式中,TS为系统发生故障的时间频次。
通过以上公式得出:在功率模块的数量与系统使用时间确定的条件下,模块的故障次数取决于模块的MTBFM。MTBFM越高,模块故障的次数N越小。
2 举例
一套模块化UPS系统由24只模块组成,使用寿命为15年。假设它的MTBFM是传统的300000h,则将会在15年内发生11次模块故障(参见公式2)。图1中的1~11表示在15年中30万小时MTBF的模块发生故障次数。
在以上30万小时MTBF的UPS系统的使用寿命中,用户会遇到较高的故障发生次数,更换故障模块所产生的成本将极大的影响用户总拥有成本TCO。这种情况下,只有通过提高模块本身的MTBF来降低故障次数。
如果模块的MTBF为100万小时,结果就会好很多,在15年中仅有3次模块故障。图2中的1~3表示在15年中100万小时MTBF的模块发生故障次数。
另一个评估MTBF值对模块化UPS重要性的方法,是计算功率模块在UPS系统中发生故障的时间频次TM为
同样按24只模块的系统举例,每个模块的MTBF是30万小时,由公式(3)得平均故障发生的时间TM为1.43年。如果模块的MTBF是100万小时,则平均故障发生的时间TM显著改善为4.76年。30万小时MTBF与100万小时MTBF在24只模块并联冗余系统中的故障时间比较如图3所示。
通过以上分析可以得出清晰的结论:为了避免频繁的内部故障,模块化UPS系统的功率模块MTBF必须远远高于传统的30万小时。
3 运行成本比较
通过以上分析比较,100万小时MTBF的模块在15年内仅发生3次故障,而30万小时MTBF的模块要发生11次故障。值得注意的是更换故障模块将会产生额外的费用成本,这些故障成本不仅仅是模块更换、模块维修的成本费用,还有物流、协调管理、服务方面的人工成本。
为了量化TCO(总体拥有成本)的成本差异,假设模块的采购成本为100%,故障模块的成本为150%(加上维修成本、物流、人工费等),TCO成本的差异计算如下:
式中,¥1为维修费用,¥2为采购费用。
图4表示30万小时MTBF与100万小时MTBF模块在24只模块并联冗余系统中的TCO成本比较。
由于故障率高,30万小时MTBF的模块将大大增加TCO运行成本,后期将增加63%故障模块的更换成本。由此可以看出30万小时MTBF功率模块有以下缺点:
①高故障率;
②高TCO;
③低系统可用性。
以上几点也印证了用户对模块化UPS最大的顾虑,由于功率模块数量过多并联叠加对整个UPS系统的可靠性产生负面影响,这也是模块化UPS市场增长的一个制约因素[1]。为了改进这个问题,模块化UPS功率模块的MTBF应要达到1000000h。
要达到这个数值,需要对功率模块进行创新化设计。同时,数值必须是通过权威认证、要是实际验证的,而非一个随便说说的字面数据。
4 功率模块可靠性的评估
对于应用在数据中心的模块化UPS,为了提高功率模块的可靠性与坚韧性,必须在功率模块的设计上采用更严谨的方式与步骤:
①模块MTBF指标定位;
②设计阶段的可靠性提升措施;
③模块寿命及MTBF计算;
④根据贝叶斯定理的坚韧性、耐久性、可靠性设计[2];
⑤坚韧性、耐久性、可靠性测试;
⑥模块MTBF确认与置信;
⑦MTBF与现场数据的比较。
5 SOCOMECMODULYSGP独特的模块化UPS解决方案
MODULYS GP系列模块化UPS专为可靠性而设计,而不是为降低产品成本设计。MODULYS GP模块化UPS采用“永葆活力”的理念,功率模块的MTBF达100万小时,并经权威第三方测试认证。
MODULYSGP的高可靠性设计,主要有体现在以下方面:
①采用高可靠性的元件。功率模块内部的电容、IGBT、二极管、电阻、电感、滤波等元器件均采用高品质的国际一流供应商的产品,例如在低压信号模块中使用薄膜电容器替代普通电解电容。
②放大元器件的设计余量。模块内各元器件的设计余量放大15%。
③降低模块内的元器件工作温度。如图5所示,通过模块的热导模拟设计与实际热导测试,优化模块内元器件的工作温度。
④减少元件数量与连接电缆的数量。与30万小时MTBF的模块相比,减少36%元件数量,减少30%连接电缆数量。
⑤优化生产工艺与流程。运用X光机检查模块内关键部位的焊点,杜绝焊接过程带来的模块生产质量问题,提高模块品质。
⑥通过国际权威第三方的严酷坚韧性、耐久性、可靠性测试。测试包括:震动、电磁干扰、浪涌冲击、高温短路、步进应力、耐受测试等。
6 结束语
本文阐述了功率模块的MTBF对模块化UPS系统工作可靠性的影响和由于系统内部故障所引起的运维成本增加。通过分析,传统300000hMTBF的功率模块会在模块化UPS的使用寿命中产生较高的故障率,这将降低模块化UPS的工作可靠性,同时大大增加用户的TCO成本。系统的故障率若要在可接受范围,模块化UPS功率模块MTBF应至少达1000000h,并且MTBF值必须通过权威第三方机构的实际测试与认证。
参考文献
[1]Modular UPS Market,Global Forecastto 2020-Markets&Markets 2015.
[2]Bayesian Statistics Applied to Reliability Analysis and Prediction-AllanT.Mense-statistical design methods.com,May2016
作者简介
陈浩,溯高美索克曼电气(上海)有限公司CP事业部售前技术经理,具有二十多年电源行业从业经验,致力于UPS、ATS等关键电源解决方案的研究工作。
编辑:Harris