不间断电源(UPS)是数据中心最重要的电源保障。当市电发生故障影响服务器机房供电时,UPS电源及时供电为用户提供应急电源,直到备用发电机开始工作提供持续电力为止。UPS电源确保用户的IT设备能够安全关闭,可以使其遭受破坏性数据丢失的风险降至最低。
无论采用哪一种UPS电源,都需要提供某种通信能力来警告即将发生的问题,无论这些问题是相对较小的问题,还是具有潜在灾难性后果的更基本的问题。
当然,如果没有触发适当的响应,就没有任何意义。因此,无论是在UPS设备显示屏上闪烁的灯光,自动发送给工作人员的信息,还是响亮的警报声,数据中心的UPS都需要随时密切监控。
对于简单的电源保护系统而言,只需具备声光警报即可。而对于数据中心中常见的更大、更复杂的系统来说,所采用现代UPS监控系统涉及更复杂的通信功能。
采用监控系统可以将UPS电源转变成真正的智能设备,不仅可以找出潜在的问题,还可以进行持续的战略分析、预防性维护,以及远程监控设备的能力。所有的这些措施和行动都将产生巨大的积极影响,并帮助用户的UPS系统在最佳性能和效率水平下运行。
简单易行——本地UPS监控
最基本的UPS监控类型采用无电压接触的形式,也称为干接点。这包括通过UPS本身或通过附件卡中的插槽提供的一组终端。来自这些终端的信号通常与建筑管理系统(BMS)或远程状态面板连接,并使UPS的警报和状态可以与位于同一地点的其他设备进行通信。
无电压通信在详细信息中提供了直接的“真/非真”响应,例如UPS电源是否运行在市电故障,电池电量达到阈值,发生UPS故障而使用电池等运行状态。
对于规模较小的安装,例如5kVA以下的UPS电源,光电隔离器可以用作无电压接触的替代品。这是用于隔离电路输入和输出部分的电子设备,以光为媒介实现电信号的传输,并可以共享类似的“真/非真”信息。
然而,在许多设置中,获取比这更加先进的信息不仅是可取的,而且更是必不可少的,这意味着更复杂的通信是至关重要的。诸如医院、化工厂等设施的情况就是如此,医院可以部署相对较小的服务器机房、建筑管理系统以及较小规模的数据中心。
诸如市电的电压、频率、电流,UPS的输出、频率和电流,或电池剩余时间等信息都可以在现场或从远程位置进行测量、传输和监测。这些关键统计信息可用于分析性能,并在出现故障或失效时,自动触发专用响应或系统关闭脚本。
这些信息可以使用RS-232标准连接发送,这是一种用于串行数据交换的标准协议,其中数据位通过相同的通信线路一次一个地按顺序发送。
大多数UPS电源配备一个RS-232端口和附加插槽,以便快速方便地连接到其他通信卡。对于覆盖距离较长的监控系统,可以使用RS-485或全双工RS-422标准。
另一种流行的交换数据的方法是Modbus,这是一种开放协议,它已成为连接工业电子设备的最常用方法。Modbus允许通过一个单一的RS-232或RS-485连接实现串行通信。
而PROFIBUS是一种更精简、速度更快的Modbus协议,是自动化技术中公认的现场总线通信标准。
扩展——现代数据中心的高级网络通信
虽然上述标准和协议适用于许多设施,但数据中心内还有另一种常用的基于网络的解决方案。
构成本地网络一部分的UPS可以配备简单网络管理协议(SNMP)功能,这是一种独立于供应商和平台的协议,可以从中央位置对设备进行远程监控和控制。
实际上,这可以看到装有网络适配器的设备,它可以“说”(传输数据)以及“听”(接收外部命令和指令)。
基于SNMP的网络与用户友好的通讯软件(如Power Shield3平台)相结合,可将数据中心的UPS电源变成智能机器,使网络管理员能够实时访问诸如电池状态、负载水平和系统温度等重要信息。
这样的系统还提供了设置电子邮件或短信提醒的功能,以便在发生警报时立即发出警报,并且如果停电后电源没有迅速提供电源,则可以远程关闭数据中心服务器。
像这样的网络设置实际上鼓励预防性的UPS维护和良好的事务管理。可以记录电源干扰,预先提示低电池容量等等。所有这些宝贵的事实和数据都可通过网络即时分析,无论是现场还是远程由用户值得信赖的UPS维护提供商进行分析。
网络环境甚至可以帮助提高大型数据中心的运营效率。来自同一网络上几十台UPS的信息可以被收集和研究,并用于优化负载管理。
进入云端:远程监控甚至遍及全球
基于网络的方法提供的远程监控功能真正在分散在不同地点的大型数据中心设施中发现的庞大的电源保护系统中实现。
连接到同一网络的UPS设备通常分布数百甚至数千英里。有些甚至安置在无人值守的地点,这使得远程监控绝对必不可少。
当然,这样的配置给数据中心管理人员和网络管理员带来了巨大的压力,无论何时都需要知道发生了什么,这就是许多用户选择通过添加外部UPS远程监控服务将平台作为整体维护计划的一部分的原因。
这个安全的基于云计算的设施对系统性能起着额外的监控作用。因此,企业的内部管理人员不仅能够对警报和潜在故障保持警惕,而且来自维护团队的经过全面培训的技术人员也能够全天候监控和分析UPS设备的数据。
这种额外的保护层降低了没有采用响应报警的风险,也确保了许多潜在的故障在达到临界阶段之前被主动识别和修复。
编辑:Harris