随着技术、设备、运营方针等方面日新月异的应用,在对多个机柜进行批量故障处理或改造时,由于存在可靠性低、便利性差等缺点,人们已不再满足于传统保障方案,仅为IT设备提供临时电源,而对之提出了新的期待。本文根据数据中心的主要使用场景,如IT设备电源模块维修、调试及机柜PDU改造、扩容等,对不同场景下所涉及到的各种功能需求进行探讨论证,开发出一种新型的运维工具,降低企业设备的TCO。
1 传统保障方案
(1)电源线盘(见图1)
简单地说,电源线盘是指带电源线和插头并且可以移动的多孔插座,三相插头接入市电,插座为IT设备供电。
电源线盘的优点:节省空间,简单实用。
其缺点:
①电源线盘插孔少,不支持多台IT设备的并发处理(机柜中IT设备数量一般为16~48台),存在缺陷;
②不支持不间断供电;
③不支持可视化运维(各类数据的实时显示)。
(2)传统PDU
传统PDU如图2所示。
基本型PDU只是径直向IT设备简单地提供电源连接和输送路径,以满足数据中心简单、持续的电源需求。
传统PDU的优点:接口兼容性强,插拔动作频繁而不易损坏。
缺点:
①传统PDU存在距离短、缺少保护装置(漏电保护、过载告警等);
②不支持不间断供电;
③不支持可视化运维(各类数据的实时显示)。
3 移动智能电源
移动智能电源是一个集UPS、电源分配系统、可视化触控电脑为一体的可移动电源分配系统,可为机柜电源分配系统检修时提供不间断电源,实时监测IT设备的用电情况、负载电流发生阀值告警时及时触发,为IT设备提供电源保障,进而达到IT服务的不间断工作。
(1)设备图示及说明
移动智能电源设备的图示见图3。
(2)场景及功能描述
①使用场景
图4给出了移动智能电源在数据中心中,应用于设备电源模块故障替换场景和机柜电力改造的场景,在这些场景的操作包括但不限于如下内容:
•机柜故障PDU更换、改造;
•机柜故障空开(空气开关)的更换、改造;
•机柜输入电缆的改造;
•机柜改造(L支架、导轨的调整);
•设备(服务器、交换机)电源模块故障排查。
②功能描述
移动智能电源的主要功能如下:
•监测功能:通过可视化触控电脑界面查看监测的总负载电流、总电压、总功率、总电能,输出单元的电流、功率、电能。
•告警功能:通过可视化触控电脑的人机界面,设置输出单元的阈值,负载电流超出阈值时蜂鸣器告警、电脑显示界面对应的电流值变为红色。
•故障分析:可视化触控电脑自动采集智能PDU的故障及告警信息,作为日志记录到系统中,供用户进行故障分析的数据依据。
•续航时间:配置10kW铁锂电池及智能UPS系统,满载32A情况不间断电源续航能力达15min左右。
(3)关键模块介绍
①故障分析仪
•自动恢复断路保护:可以监测工作电路中的异常情况(比如短路),发生异常时,切断电路并发出报警,防止危害进一步扩大;并通过定时采样反馈电路异常情况是否消除,根据消除情况执行相应动作;
•断路器选择性保护:断路器的电源端(进线侧)与断路器的负载端(出线侧)的过流及速断保护配合,发生故障时,切除断路器的优先对象,不影响其余设备正常工作,本装置按16~100A配置;
•能耗监测系统:通过采集电压、电流、功率、电能等数据,同时对数据进行细分和统计,看服务器是否运行在最佳状态(比如电源模块风扇功耗较之前高),为有效的预防性检修提供数据,另也可为服务器团队进一步节能改造或设备升级提供准确的数据支撑。
②不间断电源
•UPS主机:UPS在市电正常时由市电进行整流提供直流电压给逆变器工作,由逆变器向负载提供交流电,在市电异常时逆变器由电池提供能量,保证不间断输出;
•铁锂电池:在市电异常或整流器不工作的情况下,由蓄电池单独为服务器等设备提供安全、稳定、可靠的电力保障,同时体现出重量轻、体积小的优点,适合车载安装。
③PDU模块组
支持各国制式标准的多种电源插座模块、支持各种长度尺寸的、超大负载电流的多规格电源分配产品、最大可配置N(10~16)位输出单元。
4 应用案例
某IDC机房1000+条PDU存在安全隐患,之前发生过多起因PDU问题引起的掉电,需要对重要的业务机柜进行PDU更换,根据替换工程实施后,就传统保障方案与采用移动智能电源的总结分析比较如下:
①运维效率
传统保障方案涉及提前接线、PDU或电源线盘固定等准备工作,单机柜替换平均用时约45min,结束后再对下一机柜进行操作;采用移动智能电源进行同内容变更,单机柜平均用时约25min,较传统保障方案减少20min,运维效率提升44%(按1000条计,减少40人日)。
②故障率
据历史数据分析,传统保障方案的历史故障率约为1%(市电闪断、PDU或电源线盘勿碰等);采用移动智能电源进行PDU替换,无掉电故障发生。
5 结束语
综上所述表明,在数据中心进行IT设备电源模块故障处理、机柜电力操作等变更时,与电源线盘/传统PDU相比,具有高效率、低故障率等优点,是一种较好的运维工具。
各保障方案优劣比较见表1。
如今,无论是外部大环境的大数据、IT消费者化、虚拟化以及云计算的发展趋势,还是内部关于传递完全可信、安全和灵活性服务的需求,都对数据中心的运营方式提出了更高的期待与要求。移动智能电源不仅高效顺利实现机柜(含模块)的替换或改造,同时取得较好的社会和经济效益。
作者简介
陈文环,男,现就职于阿里巴巴集团基础架构事业群,主要从事大型数据中心技术规范标准制定、项目的测试验收、基础设施的运营及培训体系建设等。
编辑:Harris
"));