2 现代数据中心供电系统设计理念的变化
目前数据中心供电系统存在的问题普遍处于已经建成投入运行的各种规模和用途的数据中心中。问题以各种形式暴露出来,使用户感到不解和困惑,这是供电设备厂商和供电系统设计者必须面对的实际问题。暴露问题,解决问题,在解决问题的同时,数据中心建造技术不断的进步,这是一个渐变的过程。在这个过程中,正是这些客观存在的问题促使着供电技术的进步和供电系统设计理念的变化。
2.1 研究工作从单台设备向整个供电系统转变
一个完整的不停电供电系统中除了关键设备UPS以外,还可能有(输入或输出)变压器、瞬态电压浪涌抑制器、电网进线开关柜、负载配电柜、柴油发电机组、交流稳压器、隔离或升降压变压器、电池系统、各种开关、防雷设备、断路器、保险、转插,上百乃至几百个级连接点和相应的传输线。所有这些在系统中都会形成单路径故障点,由于这些部件和环节在可靠性模型中的串联特性,以及它们之间的相互影响,使得系统的可靠性大幅度降低。电源设备厂商和供电系统设计者意识到:在不断提高关键设备的性能和可靠性的同时,还必须加强对整个供电系统的研究。所研究的问题包括:
(1)系统中各种设备和环节的相互匹配和可靠性问题;
(2)系统可用性和冗余配置问题;
(3)可修复和减少修复时间问题;
(4)UPS设备的模块化冗余系统结构问题;
(5)各种设备和环节连接技术的研究和连接的规范化问题;
(6)供电系统的布局(集中式、区域式、分散式)问题;
(7)系统的可维护性和集中管理问题;
(8)系统的可扩展性问题等。
2.2 对系统可靠性的研究向可用性研究转变
当代数据中心对供电系统的连续性提出了非常高的要求,厂商和用户已经形成这样一个共识:供电设备经过多年发展,在其性能指标已完全满足IT网络设备要求的情况下,真正能为用户带来价值的是其可用性。可用性在概念上它包含了系统中设备的可靠性、可管理性和可维护性。可用性定义为:系统在使用过程中,可以正常使用的时间与总时间之比。可用平均无故障工作时间MTBF和平均修复时间MTTR表示。可用性
从可用性定义和表达式来看,提高系统可用性的措施不外乎两种,一是提高可靠性MTBF,二是减少故障后的修复时间MTTR。这两种方法对提高系统可用性的作用有着明显的差别。
2.2.1 提高设备可靠性对提高系统可用性的局限性
根据可用性的定义,提高设备的MTBF即可提高可用性,当MTBF达到一定数据时,可用性就趋近于1,也就是说,设备永远不发生故障,系统可用性自然就是1。但实际情况是不可能的。提高设备可靠性是在产品生产阶段完成的,包括采用先进电路技术、可靠性电路设计、提高智能管理功能、可靠性热设计、电磁兼容性设计、生产工艺流程管理、产品测试等。
这些生产过程的严格执行可使产品的可靠性达到预期的水平,但是要使可靠性进一步提高以达到数据中心的要求,难度很大而效果是有限的。以UPS设备为例,组成UPS主机的上千个元器件和几千个接点,在可靠性等效图上是串连的,可靠性科学指出,链的强度取决于最薄弱的环节。整个系统的可靠性是这上千个元器件和几千个接点可靠性的乘积,所以要进一步提高整机的可靠性,就必然要求组成整机的所有元器件的可靠性都有相应的提高。因为受到元器件、部件工艺和技术革新及发展的限制,做为整机厂家,单靠电路技术和生产流程管理是做不到的。即使能有所提高,效果也是很有限的。(御风)