如今的数据中心行业,面临着数据和网络容量成倍增长的需求,以及电力分配和电力基础设施解决方案拓扑结构改变的挑战,这其中包括防止数据中心设施或系统因断电出现异常和故障,具有更广泛的电力可靠性的UPS供电系统。
UPS供电系统的可靠性并不仅仅以其运行时间来计算(几小时或几天),还要通过事件的(在“多年来单一事件测量”)的数目来衡量。对于传统关键任务的数据中心来说,其故障事件的数量与其发生的重要事件的数量相同。
UPS行业对这些通过设备和配电冗余,以提高可靠性的UPS供电系统保护拓扑结构进行了回应。UPS供电系统采用冗余结构无疑提高了可靠性、效率、以及负载分担水平,但由于其冗余配置,增加了设备,使其资本支出(CAPEX)和运营支出(OPEX)的成本不断上升。
通常UPS供电系统采用冗余拓扑,其可靠性水平较高。根据调查机构UptimeInstitute提供的数据,TierIV级数据中心每年发生的事故小于一个,每一年的停机时间上于0.8小时。而人们往往会问这样的问题:“这么高的可靠性,企业要付出什么样的代价?”和“人们到底需要什么样的数据中心?”或者简单地说,“如何才能将数据中心的规模和功能与其供电系统进行正确的匹配?”
适合的冗余度和可靠性
随着数据中心市场多样化,某些领域和应用程序只需要很少的关键电源保护(例如,Uptime Institute处理云计算社交媒体或搜索引擎的一级数据中心)。而其他的可保证100%的正常运行时间的服务级别协议(SLA)的托管数据中心的要求更高一些,例如,运行视频流媒体,电子商务和金融/股票交易这些关键任务应用的数据中心,其数据中心评级可为TierIII/IV级。还有一些对正常运行时间和可靠性有着更高要求的数据中心,其评级可为TierII或TierIII级。
Uptime Institute对于每个数据中心等级的排名,通常对应UPS供电系统采取冗余拓扑的级别。这些拓扑结构可以采用多种不同的配置来实现。最佳的UPS系统的选择取决于重要的因素,包括冗余、负载功率(千瓦或千瓦)、故障隔离,负荷分担,资产利用率,容量扩展和所有权的CAPEX和OPEX测得的总拥有成本(TCO)。
N系统拓扑
N系统是最基本的关键供电拓扑结构,其中“N”是用千瓦衡量的负载能力。这种供电系统其实并没有冗余的UPS模块,因此UPS供电系统的可靠性不高。
图1 N系统拓扑
N系统的拓扑结构也有多个“单一”的故障点,每年故障事件为一到两个,因此这是不太可靠的拓扑结构。而这个单一的故障点被定义一旦失效,那么整个系统就将停止工作。而对于某些风险低的业务,如内部信息技术(IT)等,其故障对一个企业或大型集团的用户并不会产生太大影响,这种拓扑结构才能说是有效的。
N系统的拓扑结构的主要优点是配置和运营成本低(不含与非计划停机相关的成本)。另一个优点是这种系统的资产利用率高。一个N系统拓扑结构的UPS模块,其设计负载可以达到全负荷额定值的80%到90%。
N+1系统拓扑
“N+1”系统拓扑为了提高可靠性,添加了冗余组件。“N”是与总负载相等的载荷能力,“1”是指在UPS供电系统中一个额外进行冗余保护的UPS。这些系统通常为UPS模块并联结构,但这种拓扑仍然有多个单点故障的风险,如UPS模块的输出并联总线。“N+1”系统并没有冗余分配路径,因此如果有单点故障的话,每年也许会有发生一个事件。
图2“N+1”并联冗余UPS供电系统拓扑
而“N+1”并联冗余拓扑通常适用于那些提供基于互联网服务的低依赖性企业。
“N+1”系统的拓扑结构,具有较少的冗余元件和较高的利用率,其初始成本和运营成本较低。而其较高的利用率取决于负载的模块或发电机的数量。其满负荷额定值为UPS功率模块总和的80%到90%,而系统会增加额外的模块和发电机。例如,一个UPS系统由2个功率模块组成,那么正常情况下,一个功率模块分担40%到50%的负载量,而一个“N+1”系统由5个模块组成,那么每个模块的负载量最高只能达到25%。
块冗余系统拓扑
该并联的电源架构的另一个变化是块冗余系统拓扑结构。这种方法采用一种经济的方式来提高系统的可靠性,而无需一个完整的2N系统。它依赖于静态转换开关(STS)和UPS模块的即时处理,以实现有效的载荷,而冗余的UPS具有承担和转移负载的能力,这可以在大多数的块冗余拓扑中实现。然而,STS开关也是一个单点故障。虽然这个系统中UPS模块的利用率得到提高,但其带载率也只到70%~75%。
图3 块冗余系统拓扑
共享冗余(4N/3)系统拓扑结构
共享冗余4N/3系统的拓扑结构与块冗余拓扑非常相似,在多条路径分布着不同的负载,并且所有UPS模块都被加载。而4N/3和3N/2系统都是共享冗余拓扑的最常见形式,并且这些拓扑的UPS利用率水平通常在60%~70%的范围内。如在3N/2拓扑中,其UPS的最大负荷的利用率可以理解为2兆瓦的负载除以3兆瓦的UPS容量,其效率等于67%。
图4 4N/3共享冗余系统
如图4所示,这种拓扑结构还需要额外的电缆和配电基础设施,这增加了初始资本和安装成本,并使系统在节省成本上更加困难。此外,该系统在UPS输出配电方面仍具有单点故障。
无论是块冗余系统和共享冗余系统都比“N+1”冗余系统可靠性要高,其故障率每年不到一个事件。这种性能非常适合于大多数组织中的数据和应用程序的实时传递,服务交付等核心业务。但这两种冗余系统面临的挑战是,其UPS最大利用率通常小于70%~75%,而实际使用时由于其容量有限,效率还要少得多。块冗余或共享冗余系统中,UPS和关键电力资产并没有得到充分利用,而供电系统实际部署的关键负载可能会经常变化,这是因为数据中心运营中,经常会有添加、删除、升级或转移IT负载、服务器等设备的情况。
“N+N”双系统冗余拓扑
“N+N”双系统冗余拓扑构采用了两个独立的冗余的配电系统。这种拓扑结构可以设计成在每个系统有N个模块或“N+1”个模块。两个独立的系统在某些设计中的可维护性和可容错能力更高。
图5“N+N”双系统冗余拓扑
“N+N”双系统冗余拓扑结构提供了非常高的可靠性,但它也有最高的初始成本和TCO,以及资产利用率低(负载率最大只能达到40%到45%)的缺点。而这样可靠性高的拓扑结构,五年只有一个到两个的计划外中断。这种设计通常用于可靠性和可用性要求非常高的企业或金融服务行业。
总结
数据中心产业是动态的和不断变化的。UPS供电系统可靠性的变化,是由数据中心的“使命”和“关键业务”的需求所决定的。现有的系统拓扑结构的演变表明,数据中心市场中可以提供一系列不同配置的UPS系统。“N+N”双系统可以提供最佳水平的高可靠性,然而其成本也非常高。其他的冗余供电系统(N或N+1)虽然可以降低成本,但其可靠性相比较低。这些因素使得企业采用UPS供电系统时,不得不在高昂的成本、高可靠性和利用率之间进行权衡。
UPS行业的下一个挑战将是寻找一个可以提供适当的冗余和可靠性水平的新的系统解决方案,同时可以降低企业的资本支出和运营成本,并使其总体拥有成本更低。
编译:Harris