一、前言
数据中心基本设施管理系统(DCIM)是一种数据采集、加工解决、记录分析的数据管理平台。系统监测的数据,一方面用来实时反映设备目前的运营状态指标,以便数据中心大楼维护管理人员第一时间发现问题,及时消除,避免对数据中心所支撑的各个业务应用的影响;另一方面,按照一定的逻辑和配备,保存历史监控数据,用于精细化定位、后来事故追踪、查询记录和趋势分析。
本项目波及的监控对象涉及数据中心供配电动力状况及其有关设备、机房环境状况及其有关设备、大楼冷水机组设备。这些在数据中心承当不同功能的设备,类型多,数量多,参数多,连接多,并且它们自身也可以构成一种个相对独立的硬件系统。因此,需要通过一种统一的监控管理平台,集成这些系统,实现7×24h的全面集中监控和管理,保障机房安全稳定运营。通过部署DCIM系统达到如下几方面的目的:
为机房内各系统及设备运营提供高度稳定可靠的监控信息资源;节省机房运营管理费用,达到短期投资长期受益的目的;保证提高机房大楼管理工作效率并提供安全舒服的工作环境;系统软/硬件均采用模块化构造设计,适应发展需要,做到具有可扩展性、可变性,适应环境的变化和工作性质的多样化。
二、管理系统的设计
从数据中心的性质和用途出发,为长远发展考虑,采用“某些数据中心基本设施管理(DCIM)软件”做为整个数据中心的上位管理平台。某些基本设施管理平台具有十分良好的开放性和扩展性,并结合近年在行业内的积累与经验与产品固有的技术优势。可较好地满足运维团队对数据中心的运营与决策根据。该产品满足如下功能特性:
1)系统提供大楼-楼层-机房视图、专业的供配电拓扑图、定制化大屏展示图;
2)系统具有强大的联动管理功能,当事件发生某一时间时,系统将根据预定义的子系统(设备)联动关系表联动相应子系统。同步设立时间段来管理联动控制触发的时间;
3)系统具有强大的监控管理能力,提供设备监控、资产管理、容量管理、事件告警管理、能效管理、移动巡检和服务祈求等功能;
4)具有和谐的操作界面,易安装和操作和维护;
5)系统通过Internet/Intranet就可以监视和控制系统的运营状态。内具有的图形和趋势图等功能对系统控制设备的运营状态、环境设备的参数制效果进行实时和历史的监控。
1.项目包括的内容
1)动环系统:新建动环系统,并集成至基本设施管理平台。柴油发电机、变压器、低压柜电量仪UPS、EPS、ATS蓄电池、精密空调、新风机、温湿度、机柜温度(每个机柜3个探测器)、漏水监测、氢气浓度、红外双鉴视频系统:新建视频系统,并集成至基本设施管理平台。
2)门禁系统:新建门禁系统,并集成至基本设施管理平台。
3)第三方系统集成:集成视频系统、门禁系统、BA系统、极初期探测系统、消防告警系统
2.管理系统的架构
1)系统架构层
系统架构如图1(a)所示,分四层架构构成:数据采集层、数据解决层、管理服务层和展示层。
数据采集层由各类型传感器(如:温湿度传感器、漏水控制器等),智能设备的通讯接口(如:UPS的智能接口、精密空调的智能接口等)、串口服务器等构成。现场的传感器通过RS485接口接入串口服务器,串口服务器通过网络将数据送至监控层。
2)数据解决层
由冷通道工业平板、数据解决服务器、动环系统服务器、第三方被集成系统服务器及有关软件构成。该层通过以太网或总线接入实现现场合有动力环境设备的监控信息汇聚、存储、预解决、联动等功能,再将数据通过以太网上传至管理服务层。冷通道工业平板:自带RS485、RS232、DI、DO、LAN接口,可直接接入冷通道内的列头柜、温湿度传感器、机柜温度传感器、天窗磁锁信号等设备。可显示冷通道内电力使用状况(冷通道实时耗电量、各个支路负载状况及实时电流使用状况和支路开关状态)、环境设备运营参数、天窗状态、通道门开关状态、资产明细如图1(c)所示。
数据解决服务器:实现冷通道以外的所有动力环境设备的监控信息汇聚及解决。动力环境监控系统服务器是将一期和二期既有的监控系统进行替代及新增,分别部署2台服务器,以实现双机热备的架构,保证一期和二期动环成为独立可运营的一套系统。最后通过数据接口将数据接入管理服务层。
第三方被集成系统:通过被集成的第三方系统服务器及软件开放数据接口,提供OPC、SNMP、Webservice、Socket、SDK等接口或开发工具实现对视频系统、门禁系统、BA系统、极初期探测系统、消防告警系统的集成。
3)管理服务层
由2台(双机热备)基本设施管理系统服务器和软件构成。基本设施管理服务器通过网络接入数据解决层的数据。实现数据集中监控、资产管理、容量管理、能效管理、界面管理、报警管理、微信运维管理、报表管理、联动管理、远程管理、日记管理、数据管理、权限管理、配备管理等功能。满足7×24×365天长时间正常运营。
4)展示层
通过C/S和B/S方式实现页面查看、对外告警、报表查看、权限管理、系统配备等功能。机房运维人员可通过管理客户端软件构成(安装于值班电脑)、处在监控系统同一网段Web访问、微信客户端等方式实现与整套系统的交互,通过展示信息以便管理者随时理解机房目前的运营状况并辅助决策管理动作。
3.串口设计
串口类设备阐明机房监控系统的监控对象可分为智能设备、非智能两类:
1)对于被监控的智能设备,如UPS、精密空调,在设备采购时,必须选用带有主流通讯接口的智能设备,同步规定提供的通讯合同满足监控需求。
2)对于非智能类设备或其她,必须选用带有主流通讯接口的智能设备,或传感器加智能终端的方式对其监控,如:温湿度、漏水、烟感等。串口特性阐明对于采用串口通讯的监控设备或被监控对象,在使用串口通讯时,接到同一种串口的设备需遵循如下原则:
(1)串口参数一致,涉及波特率、校验位等。B、设备可编址。C、设备合同相似。D、通过手拉手进行总线连接,串口总线通讯采用轮询方式,总线上挂接设备越多,通讯周期就越长。轮询常量如表1所示:
(2)一种端口的采集周期=设备1采集周期+...+设备N采集周期+(同一端口下设备个数*0.1s)+采集周期间隔。
单个串口设备接入设备量
系统建设时,系统设计的单个串口设备数量满足如表2规定。
4.双总线(A/B路)设计
数据采集层整体采用2N冗余设计,分为A/B双路,每个区域(单个房间或相邻两个房间)配备2台串口服务器,将A路的列头柜和精密空调接入A串口服务器,B路的列头柜和精密空调接入B串口服务器,如图2所示。
5.系统性能
基本设施管理系统服务器和前端数据解决服务器采用WindowsServer操作系统,数据库采用MySQL,系统支持B/S、C/S架构;系统支持RS232、RS485、RS422、TCP/IP、SNMP、OPC、DDE、MODBUS、ASCII、LONKWORKS、BACNET、C-BUS等多种原则化合同和接口,以用于迅速以便的将各监控对象集成到系统中,支持主流品牌的UPS、空调、电量仪的数据接入,避免合同开发;系统提供登录功能,值班人员可以浏览动力环境,图像,门禁,资产管理,容量管理、运维管理等多套系统;涉及电子地图导航、组态页面,设备监控,实时信号和图像监控等内容;系统软件提供机房平面图、配电图,以便维护和扩容;系统提供微信运维客户端,可通过客户端实现监控信息进行查看、告警接受、流程审批、运维派单等;系统支持100万以上测点,日记可在系统中保存一年以上;系统可支持至少100个客户端同步连接访问;系统硬件(采集器)支持多点部署、灵活扩容;支持系统平滑升级(后续升级扩容,只需接入新增设备,无需新增平台或服务器等系统性费用);系统具有自诊断功能,对软硬件故障可以自动重启恢复,在重启后有关数据可以补采;当供电意外中断并恢复供应后,系统应从软、硬件两个方面进行自动恢复;系统采用双机热备架构;基本设施监控管理系统必须实时、精确的显示所有监控信息,达到但不限于:远程监控数据刷新时间<6s;短信报警发出响应时间<30s;一种信号周期完毕对管辖范畴内所有设备的数据采集、存储和显示控制在6s内;系统前端配备多台串口服务器,中心平台配备一套双机热备的服务器。通过我司特有的“多通道数据采集”软件,平台的整体性能不单独依托服务器的CPU解决能力,通过多进程的数据解决方式,可保证在数据点超过10万以上的状况下,信号周期在极短的时间内完毕对管辖范畴内所有设备的数据采集和控制,实时监控众多对象,系统仍能保持极高的实时性;系统采用开放式的架构设计,可迅速实现平台扩容,针对后续动环设备可迅速以便的接入。
三、实现动力环境的监控手段
1.监测环节
1)变压器监测
(1)监测内容:监测变压器的输入电压、电流、开关状态等信息;监控变压器的三相绕组温度;在变压器过高或异常时,该项状态会变红色,同步产生报警事件进行记录存储,并第一时间发出手机短信、电话、语音、声光、微信等对外报警;历史曲线记录,可查询一年内相应参数的历史曲线及具体时间的参数值(涉及最大值、最小值),并可将历史曲线导出为EXCEL格式,以便管理员全面理解变压器的运营状态。
(2)监测实现:通过变压器提供的RS232智能通讯口及通讯合同,通过通讯转换模块将RS232转成RS485后,采用总线的方式将变压器的监控信号通过总线上传至数据采集服务器,通过数据采集服务器将数据上传到解决层和管理层,由监控平台软件实时监测变压器的状态和报警信息,如图3所示。
2)发电机监测
(1)监测内容:实时监视发电机的输出电压、电流、功率、油压、水温、转速等参数(能监测到的具体内容由厂家的合同决定,不同品牌、型号的发电机所监控到的内容不同),如图4所示;一旦发电机浮现报警状况,该项状态会变红色,同步产生报警事件进行记录存储,并第一时间发出手机短信、电话、语音、声光、微信等对外报警;历史曲线记录,可查询一年内相应参数的历史曲线及具体时间的参数值,并可将历史曲线导出为EXCEL格式,以便管理员全面理解机房内发电机的运营状况。
(2)实现方式:通过发电机提供的RS485智能接口及通讯合同,采用总线的方式将发电机的监控信号上传至数据采集服务器,通过数据采集服务器将数据上传到解决层和管理层,由监控平台软件实时监测发电机各部件的工作状态及运营参数。
3)列头柜监测
(1)监测内容:实时监测列头柜的相电压、线电压、相电流、频率、功率因数、有功功率、无功功率、开关状态等参数;通过图表直观的展示列头柜整体的运营数据;一旦列头柜有告警,该项状态会变红色,同步产生报警事件进行记录存储,并第一时间发出手机短信、电话、语音、声光、微信等对外报警;
历史曲线记录,可查询一年内相应参数的历史曲线及具体时间的参数值,并可将历史曲线导出为EXCEL格式,以便管理员全面理解列头柜的运营状况。
(2)监测实现:通过列头柜提供的RS485智能接口及通讯合同,采用总线的方式将列头柜的监控信号上传冷通道工业平板(实现数据采集、解决、存储、显示),通过工业平板将数据上传到解决层和管理层,由监控平台软件实时监测列头柜的运营状态,如图5所示。
4)电量仪监测
(1)监测内容:实时监测电量仪的相电压、线电压、相电流、频率、功率因数、有功功率、无功功率等参数;通过图表直观的展示电量仪的运营数据;一旦电量仪有告警,该项状态会变红色,同步产生报警事件进行记录存储,并第一时间发出手机短信、电话、语音、声光、微信等对外报警;历史曲线记录,可查询一年内相应参数的历史曲线及具体时间的参数值,并可将历史曲线导出为EXCEL格式,以便管理员全面理解电量仪的运营状况。
(2)监测实现:通过电量仪的RS485智能接口和通讯合同采用总线的方式将设备监控信号直接上传至数据采集服务器,通过数据采集服务器将数据上传到解决层和管理层,由监控平台软件实时监测电量仪的运营状态,如图6所示。
5)UPS监测
(1)监测内容:实时监视UPS整流器、逆变器、电池(电池健康检测,含电压电流等数值)、旁路、负载等各部分的运营状态与参数(监测的具体内容根据不同品牌和合同会有所不同);通过图表警,该项状态会变红色,同步产生报警事件进行记录存储,并第一时间发出手机短信、电话、语音、声光、微信等对外报警;历史曲线记录,可查询一年内相应参数的历史曲线及具体时间的参数值(涉及最大值、最小值),并可将历史曲线导出为EXCEL格式,以便管理员全面理解UPS的运营状况。
(2)监测实现:实现阐明:通过UPS提供通讯口及通讯合同,将UPS的数据信号经通讯转换模块将RS232转换成RS485,采用总线的方式将UPS的监控信号上传至数据采集服务器,通过数据采集服务器将数据上传到解决层和管理层,由监控平台软件实时监测UPS的各项运营参数、工作状态和报警信息,如图7所示。
6)EPS监测
(1)监测内容:实时监视EPS整流器、逆变器、电池(电池健康检测,含电压电流等数值)、旁路、负载等各部分的运营状态与参数(监测的具体内容根据不同品牌和合同会有所不同);通过图表直观的展示EPS整体的运营数据;一旦EPS有告警,该项状态会变红色,同步产生报警事件进行记录存储,并第一时间发出手机短信、电话、语音、声光、微信等对外报警;历史曲线记录,可查询一年内相应参数的历史曲线及具体时间的参数值(涉及最大值、最小值),并可将历史曲线导出为EXCEL格式,以便管理员全面理解UPS的运营状况。
(2)监测实现:实现阐明:通过EPS提供通讯口及通讯合同,将EPS的数据信号经通讯转换模块将RS232转换成RS485,采用总线的方式将EPS的监控信号直接上传至数据采集服务器,通过数据采集服务器将数据上传到解决层和管理层,由监控平台软件实时监测EPS的各项运营参数、工作状态和报警信息,如图8所示。
7)ATS监测
(1)监测内容
•实时监测ATS设备的常用、备用电源线电压、频率参数,以及常用、备用电源的开/关状态;
•通过图表直观的展示ATS的状态;
•一旦ATS浮现报警状况,该项状态会变红色,同步产生报警事件进行记录存储,并第一时间发出手机短信、电话、语音、声光、微信等对外报警;通过动态的电子地图,可实时显示ATS数据。
(未完待续)
编辑:Harris