一、集中供电与分区供电系统的结构比较
在一个机房中除去主要的信息运行设备外,还有保障其运行的其它设备,比如供电系统、空调系统、消防系统、保安系统和综合监控系统,等等。在这些系统中首当其冲的就是供电系统,因为不论其它设备如何高级,如何可靠,一旦供电中断,其他一切就都会陷于瘫痪。而供配电系统又包括电源系统、配电系统和综合监控系统。图1所示就是一个机房的系统构成实况,该图中UPS是一个模块化结构加PDU供电系统和配电系统为众多的IT机柜供电。
在小于400kVA容量的数据中心机房系统中采用n+x模块化电源供电系统,对提高系统的可靠性与可用性是很有帮助的。即使大于400kVA的中大型机房采用n+x模块化电源供电系统也更有其优越性,图2就示出了大型机房分区供电的情况。图中表示的是将一个大型机房系统分成了5个区,每个区由一套UPS供电,这样划分的根据是:不论多么大的系统都是由多台机器构成,一般说任何一单台设备的用电量大都不超过几十千伏安(巨型机除外),都是多台设备由一台UPS供电,这样一来就使整个系统的设备有了分组配电的可能。
具体做法就是将各组设备按一定要求划分,这样既给了系统边扩充边投资和将资金有效利用的便利条件。
二、分区供电系统的主要优势
1.可以合理利用资金
这样做的优点是避免了一次性投入大量资金而见效缓慢的弊病。往往为了供电一次到位,一大笔资金投进去了,而用电设备迟迟不能齐备,一拖就是几个月甚至几年。比如某一金融数据中心,按照要求一次就购置了1,600kVA(2×800kVA)的UPS,用电设备计划占用5个楼层,但直到三年后的用电量也只有300kVA!如果采用分区供电就避免了这些弊病。
2.可以降低和避免整个系统全部同时瘫痪的可能性
分区供电给备份系统创造了安全环境。集中供电时,一般都选用大容量的塔式机UPS,比如上述的2×800kVA=1600kVA(另有一台800kVA冗余,构成了1+1系统),如果其中有两台同时故障,按计划容量就会导致整个系统因供电不足而关机。如果分区供电,按上述的例子分成16个区,即使其中两个甚至三个区故障也仅仅是一小部分,也不会全部瘫痪。
3.使供电系统的可维护性大为提高
如果分区后的供电设备又采用了n+x模块化冗余UPS结构,即使一个区供电故障,用热插拔的方法将故障模块更换掉就可以了。因为在上述例子中有多个分区采用同样规格的n+x模块化冗余UPS,因此备用模块式足够多,所以更换起来就很快,即使用户的非专业人员在UPS告警信息的指导下也可以迅速地更换故障模块。
如果是集中供电就不那么方便了。比如上面的例子,假如其中一台800kVA的UPS故障,首先用户的非专业人员不能也没有能力参与修理,首先要通知厂家,当然如果该UPS已托管给厂家远程监控就方便一些,但仍存在厂家修理的情况,即是不是这种修理就能一次成功?没有100%把握。不像一个UPS故障模块换掉就可以了,即使万一这个模块不行,在上述例子中如果多备份一个模块,再换一个就行了。而这种大容量UPS的备用有两个就不错了,而整机模块化因标准化程度高也可统一备用多个。
4.使主要设备的多重冗余供电有了可能
分区供电为主要设备供电时可以双冗余、三冗余和N冗余。在一个大系统中必然有一个或几个设备是关键的,为其供电电源设备的可靠性或可用性要求万无一失。在集中供电的情况下一般采用最多的是n+1,n+2者少之又少,尤其是大容量情况下,供电系统模式定下来了,其可靠性也就定了,比如上述的2×800kVA=1600kVA的例子是1+1,其冗余度也就到此为止,一次故障时间中只允许一台UPS故障。因此,一旦有一台UPS故障,在这一台UPS修复以前就不允许有第二台再出现故障,尤其是在400kVA以上的用电场合,其UPS的容量也很大,一台故障后的修复时间一般不会很短,有时甚至拉的时间很长。比如由于交通问题厂家不能及时赶到、感到后备件缺乏、维修工程师素质不高等因素使故障不能及时解决。而分区供电后,一则备件可以共享,二者可允许两个以上模块同时故障。
图3给出了UPS集中供电和分区供电时的机房利用率比较效果图,采用分区供电后由于省去了集中供电时的UPS专用机房,机房利用率提高了,供电和被供电设备的数量增加了,使得分区供电的灵活性和冗余性大为提高,从而提高了系统的可靠性与可用性。
三、集中供电与分区供电系统的可靠性比较
图4示出了一种高可靠分区供电系统。图中各分区都采用的是n+x模块化结构UPS,其中的关键负载得到了多台n+x模块化结构UPS供电的保障。
为了有一个量的概念,假设所有UPS(不论是模块结构还是柜式结构)的可靠性都是0.99,为了用统一标准比较,再假设每个分系统也是2+1。图4给出了单机冗余与模块化结构再冗余时的可靠性数学模型,下面就根据这些模型计算它们的可靠性。
1.单机2+1冗余系统的可靠性
这是一般用得较多的一种供电方案,其可靠性数学模型如图6.4(a)所示。
上述1600kVA的2+1系统例子中,系统的可靠性也正是3个“9”,其不可靠性是1-RD≈0.9992,也就是十万分之二。
2.双2+1冗余模块结构再冗余时的可靠性
这要以图6.4中的“关键负载”供电为例,在此图中关键负载时双电源输入,这两个电源分别来自两个分区的N+X模块化结构UPS,其供电系统的可靠性数学模型如图5(b)所示。其可靠性为:
其可靠性比上述单独的2+1高出4个“9”。这是多么大的区别!当然N+X模块化结构UPS,,当X=1时,N越大则系统的可靠性越低,为了有一个数量的概念,不妨做一个大略的计算。
3.两个多模块并联系统再冗余时的可靠性
一般分区中大都是多模块并联,前面所述,一般说在N+1模块冗余并联系统中,N越大则系统的可靠性越低,但在图4的结构中如果只取两个多模块并联系统为关键负载冗余供电,如果仍作上面的单机可靠性数据假设,以ARRAYUPS为例,因为这个UPS有8个15kVA模块,可作7+1冗余,即105kVA+15kVA。这时单机系统的可靠性为:
式中R1是单台ARRAYUPS作7+1组合时的可靠性。
从上式的计算可以看出,即使在7+1组合时,其可靠性也比单台时高一个数量级,如果在此可靠性数据的情况下由两台这样的分区供电系统(ARRAY)除去带本身的负载外,还向关键负载冗余供电,在这种情况下的系统可靠性数学模型如图6所示,根据该模型计算得的系统可靠Rm型如下:
从这个计算结果中可明显地看出,即使N+X模块化结构UPS在7+1组合时,两个分区供电的UPS再冗余向关键负载供电时,其关键负载仍能够得到了6个“9”的供电可靠性,这是其一;其二,这种可靠性是可变的,当负载所需功率作一个15kVA减小时,其系统的可靠性就提高一个数量级,这是单机冗余所无法做到的。比如上述例子中容量为2×800VA+800VA冗余时,只有负载容量减小800VA时,才可使系统的可靠性提升。
上面的例子不过是两个分区电源向一个关键负载供电得到的可靠性结果,而且还可以三个区、四个区,一直到N个区的n+x模块化结构UPS同时向关键负载冗余供电,可想而知,其可靠性和可用性是多么高啊!
四、关于对模块化结构的误解
还有一种说法:当模块并联多到8个以上时,其系统可靠性还不如一个单台UPS。上述7+1的例子就是8个模块并联。上面假设单个模块的可靠性是2个“9”,7+1的8个模块并联后上升到3个“9”,比单个模块的可靠性还高一个数量级。如果并联书在增加,是不是增加到某一个数量时,其可靠性就真的不如单个模块大呢?这个疑问是来自多方面的,不搞清楚这个问题,对n+x模块化结构UPS的推广将使一个障碍。
1.从数学的角度看n+x冗余并联
首先由几个假设:n是不等无穷大的正整数;X是等于或大于1的正整数;可靠性数据为小于零的正数。如果在串联模块数最多(设为N),并联模块数最少(设为1),单个模块UPS的可靠性用一个具体数据0.99,那么系统的可靠性表达式RN就是:
只要能够证明在N为任何值时RN≥0.99就可以了。首先看式(6-5)的(1-0.99N)项,因为只有这一项和并联模块数N有关,当N→∞时,0.99N→0,(1-0.99N)=1,这时的RN=0.99,这是最极限的情况。但实际中N不可能是无穷大,而且是一个小于100的数值,就是说永远是这个关系,即(1-0.99N)>0。
上述的讨论就证明了只有串联模块数为无穷大再与一个同样模块并联时,系统的可靠性才与一个模块的相等,否则N+1系统的可靠性永远大于单个模块的可靠性。这里假设单个模块的可靠性是0.99,如果取其它的值也同样得出这样的结果。因此,上述的说法只是一种猜测,毫无根据。
2.从可用性角度看N+X冗余并联
从可用性的角度看,无论N为何值,N+X冗余并联结构永远是单台UPS所无法比拟的。单台UPS故障就意味着它的供电中断,负载再也无法得到它的保护;而N+X冗余并联结构中一个UPS模块故障时,供电仍可继续。
所以,那种‘当模块并联多到8个以上时,其系统可靠性还不如一个单台UPS’的说法是一种人云亦云的误解。尤其是在X>1的配置情况下,模块化系统的可靠性大增,而且是成数倍增加。为了说明问题,仍以上述的8模块系统为例,将7+1组合改为6+2组合时的系统可靠性。人假设每个单元的可靠性为0.99,这时的系统可靠性表达式为:
根据此时算得的系统可靠性为:
这个结果和7+1组合时的系统可靠性0.999321相比又搞了两个数量级,比单个UPS模块的可靠性高了3个数量级,这就很说明问题了。
作者简介
鸿韬,高级工程师,多年从事数据中心供电设计与运维工作。
编辑:Harris