本文通过对数据机房分级的分析,引申到对机房核心设备UPS的分级,根据不间断电源的设计架构、稳定性、可用性以及可维护性等方面对UPS进行了系统化的分级分析,期待为数据中心从业者在UPS选型方面提供专业参考意见。
数据中心机房分级由来已久,可根据机房选址、建筑结构、机房环境、安全管理及机房的使用性质及由于场地设备故障导致电子信息系统运行中断在经济和社会上造成的损失或影响程度,分为A、B、C三级。那么引申而来,对于数据中心的核心设备—UPS,也可根据使用场景、可靠性等分级,便于从业者区分和选型。
一、数据机房分级
IT圈从业的朋友,甭管您是卖IT设备的,或者卖UPS的,又或者是搞数据机房基础设施设计、建设或运维管理的,没有一个不对数据机房的分级如数家珍,那么为啥大家都这么熟悉呢?
这就得从各种标准谈起了,不管是国家标准GB50174-2017,还是国际标准TIA942-B-2017,又或者是BICSI02-2014和EN50060系列标准,当然后两种可能没有前两种那么熟悉,总之一句话,尚有很多标准来定义和指导数据中心机房的建设等级。
那让我们来仔细研读一下国家标准GB50174-2017《数据中心设计规范》,文中说道:数据中心可根据机房选址、建筑结构、机房环境、安全管理及机房的使用性质及由于场地设备故障导致电子信息系统运行中断在经济和社会上造成的损失或影响程度,分为A、B、C三级。
1.A级数据中心
A级数据中心的基础设施宜按容错系统配置,在电子信息系统运行期间,基础设施应在一次意外事故后或单系统设备维护或检修时仍能保证电子信息系统正常运行。(摘自GB50174-2017第3.2.1条)
2.B级数据中心
B级数据中心的基础设施应按冗余要求配置,在电子信息系统运行期间,基础设施在冗余能力范围内,不得因设备故障而导致电子信息系统运行中断。(摘自GB50174-2017第3.2.4条)
3.C级数据中心
C级数据中心的基础设施应按基本需求设置,在基础设施正常运行情况下,应保证电子信息系统运行不中断。(摘自GB50174-2017第3.2.5条)
如果从供配电角度来看,C级数据中心并未对供电电源做出要求,而A级和B级数据中心分别做了如下要求:
1)A级数据中心应由双重电源供电,并应设置备用电源。备用电源宜采用独立于正常电源的柴油发电机组,也可采用供电网络中独立于正常电源的专用馈电线路。当正常电源发生故障时,备用电源应能承担数据中心正常运行所需要的用电负荷。后备柴油发电机组的性能等级不应低于G3级;A级数据中心发电机组应连续和不限时运行,发电机组的输出功率应满足数据中心最大平均负荷的需要。(摘自GB50174-2017第8.1.12条和第8.1.14条)
2)B级数据中心宜由双重电源供电,当只有一路电源时,应设置柴油发电机组作为备用电源。后备柴油发电机组的性能等级不应低于G3级。B级数据中心发电机组的输出功率可按限时500h运行功率选择。(摘自GB50174-2017第8.1.13条和第8.1.14条)
二、UPS分级
由数据机房分级理论推广到不间断电源系统进行讨论,首先我们要明确什么叫做不间断电源系统。可能很多人都会说:不间断电源系统不就是UPS吗?这么说的不光是圈外人,很多我们圈内人也都是这么认为的。那么这种观念,或者说认知有什么问题呢?首先让我们看下GB50174-2017对不间断电源系统的定义吧!(其它国际标准基本相同)
1.不间断电源系统定义
不间断电源系统,即由变流器、开关和储能装置组合构成的系统,在输入电源正常或故障时,输出交流或直流电能,在一定时间内,维持对负载供电的连续性。
看了这个定义,真可谓言简而意赅,那么我把自己对这段话的理解,再结合GB50174-2017的条文条款以及条文说明整理如下:
1)不间断电源系统并不是传统意义上的电源,既不能够作为双重电源中的任何一重,也不能够作为备用电源,因为它不能够持续不断地提供电能,仅要求在“一定时间内”提供电能。
2)不间断电源既然不是电源,那么它在配电链路中的作用是什么呢?“在输入电源正常或故障时”维持对负载的连续供电,“在输入电源故障时”这个我们好理解,那么“在输入电源正常时”这个要怎么理解呢?也就是我们常说的电源质量不佳时,比如闪断,尖峰浪涌等常见市电问题,如果没有不间断电源系统的过滤也会导致服务器宕机。说到这里就显而易见了,其主要作用就是“不间断”,不管是在输入电源故障时的互相转换,还是在输入电源质量不佳时的闪断,不间断电源系统都可以维持连续的不间断供电。
3)不间断电源既然不是电源,那么我们也就不能够强迫其能够生产或者说转换出电能来,也就自然而然可以理解不间断电源系统的构成里为什么包含有储能装置了!常用的储能装置,不管是铅酸电池,还是锂电池(最近很火的),还有慢慢或即将退出市场的镍氢电池、镍镉电池等,都是常用的静态储能装置,目前国外还出现了超级电容储能,生物电池储能;那么还有一种动态储能装置,就是历史悠久的飞轮储能装置,随着超导技术的成熟也在海外由一定范围的使用。
4)说到变流器,我们可以将其分为整流器和逆变器,这两种变流器都是电力电子装置,主要部件都是IGBT管,拓扑架构这里限于篇幅不能赘述。大家还记得不间断电源系统的定义里有这句话“在输入电源正常或故障时,输出交流或直流电能”吗,也就是说这里又将不间断电源分为包含整流器和逆变器两个变流器的交流不间断电源,以及仅包含整流器一个变流器的直流电源。说到这里,看官们估计恍然大悟,原来这里说的变流器就是我们经常提到的不间断电源啊(注意和不间断电源系统的区别)。
5)不间断电源系统的构成由三大部分组成:变流器、开关和储能装置,前面我们已分别阐述过“变流器和储能装置”,那么我们再探讨一下“开关”。开关根据装置的不同,大致分为隔离开关,负荷开关,熔丝-开关组合装置,接触器,断路器,那么这些开关或者说开关装置有什么不同呢?开关最初的主要功能是提供电气链路的断点,方便安装和维护;随着科技的进步和用电安全及智能化需求,增加了很多辅助功能,比如过载保护,短路保护,漏电保护,远程自动化
控制等。那么对于国标定义这里的“开关”,实质上是指变流器(即不间断电源)和市电以及负载之间需要提供的链路断点,还有不间断电源和储能装置(多为电池)之间的电气链路断点,也就是说这里的“开关”是指不间断电源(即变流器)外部的开关,但却是包含在不间断电源系统内的开关。各部分示意如图1。
国标GB50174-2017附录A的表A中明确要求不间断电源系统配置手动维修旁路开关,而不间断电源单机内部的手动维修旁路开关往往在实际运维中存在很大缺陷,比如无法让不间断电源箱体完全断电(因维修旁路经过箱体内部),又或者在机器寿命终期,无法在负载不断电的情况下进行更换机,因此增加了对系统级手动维修旁路开关的要求,即不间断电源外部的手动维修旁路开关,我们经常称之为外部手动维修旁路。
分析总结之后,我们不难发现不间断电源系统并不能叫做UPS(虽然UPS翻译过来就是不间断电源系统),UPS、开关和储能装置组合构成不间断电源系统,再详细一些来说,不间断电源系统由输入输出配电开关、外部手动维修旁路开关、UPS、电池以及电池开关组合构成完整系统。
2.UPS概览及分类
搞清楚了不间断电源的定义,那么我们在不同等级数据中心设计或建设时,又如何来选择不间断电源呢?
不同的群体选择也是不尽相同的,总包喜欢物美价廉的;运维人员喜欢维护方便,最好一辈子都不出故障的;业主喜欢稳定可靠的,最好能用半个世纪的…
当标准没有定义不间断电源的等级时,对应不同等级数据中心大家的选择都是笼统的,不清晰的,因此我们需要将数据机房分级理念推广至UPS分级。这里根据不间断电源的设计架构、稳定性、可用性以及可维护性等方面,将不间断电源分为主要的三类:大模块容错型UPS,塔式UPS和热插拔模块化UPS。
其中热插拔模块化UPS特征明显:
优势:模块颗粒度较小,往往单模块容量在25-60KVA(个别厂家有100KVA的),天生的优势就是机内冗余,即可以做N+1冗余,也可以做N+X冗余,因此在单路供电时,优势可以体现的淋漓尽致。此外,由于模块可热插拔,该类型UPS还具有在线扩容、在线维护的优势。
劣势:若不考虑机内冗余或在线扩容等需求,而是当作一个整体(即满载)使用时,因模块数量巨多,控制逻辑复杂混乱的同时故障点剧增,对于较大容量段的UPS,单从可靠性方面来说热插拔模块机并不如塔式机高。
综上,建议在单路供电或功率模块分期投入等场景下选用热插拔模块机,并采取N+X的机内冗余配置,下文不再对该类型UPS进行赘述。
以下我们将对行业中分类较为模糊的两类机型——大模块容错型UPS,塔式UPS进行对比,详见表1。
从图2可以看出,大模块容错型UPS无论是从可靠性、可维修性以及运行效率等各方面,都是优于塔式机的,因此将大模块容错型不间断电源分类为A级UPS,中型塔式为B级UPS。
其中可靠性作为UPS行业的重中之重,也是用户最为关注的核心。A级容错型UPS采用多重容错设计,从各个方面提升可靠性:
1)电气冗余容错——可应对主功率模块故障情况,每个UPM功率模块独立的电气结构,在UPS故障时还有50%以上的“容错”容量可以继续保持负载的供电;
2)控制冗余容错——可应对控制系统故障情况,A级UPS配置冗余控制系统,在控制系统故障时,其控制“容错”功能,保证UPS正常带载运行;
3)旁路独立容错——避免各种故障或炸机,当全部的UPM和中央控制模块和辅助电源坏掉时,安装在独立机柜(ISBM柜)的旁路模块(STS)仍可以正常带载工作,因为其具有独立的控制单元和独立的辅助电源,当UPM无法带载时,旁路模块可以无缝接过带载任务,保障负载不断电,实现UPS系统高级容错;
4)电池分组容错——避免电池汇流短路情况,电池可以分组接入不同的UPM功率模块,在故障及电池汇流排短路时,其“容错”隔离功能,可以保证其余UPM功率模块的后备时间不受影响;
5)空间分仓容错——避免炸机与火灾蔓延,每个UPM功率模块具有独立的机械防护结构,在UPS故障炸机时,其“容错”隔离功能,保证其它功率模块的安全运行。
综上所述,A级大模块容错型UPS可靠性远优于B级塔式UPS。
行业中主流机型分级
前面我们已经对UPS进行分类和分级,那么市场上主流品牌都有哪些机型与之对应呢?以下我们将根据搜集到的市场资料统计,供大家选型参考,表2为A级UPS主流机型。表3为B级UPS主流机型。下表中塔式一体机的定义是指该UPS的泰尔测试报告是依据YD/T-1095标准来检测的,而不是依据模块化UPS的YD/-2165来检测的。
三、总结
数据中心行业从业者不仅需要在数据中心机房建设中关注数据机房的分级,还应关注UPS的分级。UPS作为核心设备,它的选型直接影响了数据中心关键负载能否长期安全可靠运行。
本文中根据不间断电源的设计架构、稳定性、可用性以及可维护性等方面,将不间断电源分为主要的三类:大模块容错型UPS、塔式UPS和热插拔模块化UPS,并着重对比了大模块容错型UPS、塔式UPS,将大模块容错型UPS分级为A类UPS,塔式UPS分类为B类UPS。另外,还为各位看官汇总了行业主流机型,以供选型参考。
作者简介
张爱国:中兴通讯股份有限公司2004年毕业于西安交通大学,先后任职山特电子(深圳)有限公司,克劳瑞德电子(深圳)有限公司,伊顿电源(上海)有限公司,中兴通讯股份有限公司,先后从事UPS研发,配电系统开发及造价,IDC机房产品规划及方案规划工作,一直耕耘在电源产品及IDC规划领域,倡导极简方案和扁平架构观念。
陈璐:2012年毕业于西安交通大学,任职伊顿电源(上海)有限公司,数据中心行业十年从业经验,伊顿资深架构师。
编辑:Harris
本文通过对数据机房分级的分析,引申到对机房核心设备UPS的分级,根据不间断电源的设计架构、稳定性、可用性以及可维护性等方面对UPS进行了系统化的分级分析,期待为数据中心从业者在UPS选型方面提供专业参考意见。