咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
数据中心测试验证的最佳实践(下)
  • 近10年来,欧美的数据中心客户已经把测试验证作为数据中心工程质量管理的规定动作,国内近几年建设的大型数据中心也都开始把测试验证作为必须的要求。但相对起国外,行业人士预计还有80%的国内数据中心没有聘用专业的第三方机构进行数据中心的测试验证,这为数据中心的稳健运行埋下了隐患。文中对数据中心测试验证的对象、内容和测试仪器以及测试验证常见问题和分析予以较详尽的论述。
  • ④消防系统
      
      数据中心如果发生火灾,会毁坏计算机设备,中断正常的系统运行,甚至危及工作人员的生命,所以消防系统非常重要。对于消防系统的测试验证工作主要就是检查报警系统、灭火系统、排烟系统是否能够在早期发现火灾隐患,准确及时报警,在火灾发生后快速灭火,并将有害气体排出。有关消防系统的测试验证主要工作内容见表4。
      
      ⑤装饰装修系统
      
      数据中心基础设施为用户的业务需求提供支撑,同时它也是一个建筑主体,需要满足设备、人员对装饰装修方面的相关要求。装饰装修系统的测试验证工作主要是对地板、吊顶、门窗、墙体等是否符合规范的检查。有关装饰装修系统的测试验证主要工作内容见表5。
      
      ⑥故障模拟
      
      故障模拟测试是借助假负载营造数据中心上线后的实际运行情况,然后模拟机房运行中可能出现的故障,来验证各系统在出现故障情况下的反应是否符合设计预期,从而判断机房的抗故障能力和设计等级。故障模拟测试不但是验证机房实际运行能力的重要手段,也为运维团队提供应对紧急状况的实践经验,运维人员应该在故障模拟测试过程中了解系统的薄弱环节、总结有可能出现的故障特征、制定最佳应对流程,才能在以后的运维工作中遇到故障不慌乱,及时准确地采取措施,将故障对系统运行的影响降到最低。有关故障模拟的测试验证主要工作内容见表6。
      
      以上按照验证对象来划分的测试验证工作并不能覆盖所有内容,针对项目做具体的方案时还应该考虑设计图纸、设备配置、客户需求等因素来增减条目,才能真正符合验证系统是否满足运行要求的目标。
      
      4 常见问题及案例分享
      
      (1) 测试验证中出现的常见问题
      
      在测试验证过程中,一些设备性能、系统联动方面的问题就暴露出来,这也正是我们做测试验证工作的目的。如果这些问题不及时发现,进行整改,机房上线后就可能出现无法弥补的损失。按照验证对象分类角度,列举相关系统测试验证中出现的常见问题及其危害,分别见表7至表11。
      
      

    (2) 案例介绍
      
      北京某大型IDC数据中心,总建筑面积25552.51m2,地下1层,地上2层,建筑高度(最高处)19.9m,是原有建筑改造工程。该项目共分三期进行,以二期的第一阶段为例,测试验证工作共涉及4个机房,766个机柜。
      
      测试验证团队针对电气系统、空调系统、智能建筑系统、消防系统、装饰装修系统进行了测试验证工作,共完成77大类测试项目,实时记录4809个数据,其中4400个数据在正常范围内,409个数据偏离正常值。经过对非正常数据的分析,总结出19个问题,主要包括:UPS室空调气流短路,无法有效地给UPS散热;UPS室上面线槽距离UPS太近,UPS散热效果不好;4个机房均为负压,机房密闭性差;PMS、BMS无法正常显示监控数据,仍需继续进行调试;变压器失电后,PMS系统中UPS上口配电柜没有声光报警;机柜运行参数中通讯故障,监控室无数据显示:CCTV系统摄像头编号未编写,软件中无法看到是在什么房间什么位置;CCTV软件中无地图,无法判定是什么位置的摄像头;门禁系统软件地图个别地方与实际不符,需要重新调整,需要添加房间编号;门禁系统延迟时间太长,门状态改变之后至少需要1.5min之后,软件中的状态方能改变;温湿度监控系统现场没有标签,误差值较大;干接点测试中变压器模拟故障时,干接点系统无声光报警;空调的过滤网没有进行固定。这些问题如果不在机房上线前解决,将为机房运行带来非常大的隐患,也为运维工作增加了难度。
      
      用户在收到这些问题反馈之后,及时进行了整改,复测全部合格。目前该数据中心二期已经上线运行,运行状况良好,测试验证工作达到了预期的目标。
      
      5 结束语
      
      测试验证是一个确保系统设计、安装、功能测试、系统联调、运行状态与设计意图相符合的过程,是设施获得良好功能和可靠运行过程中的重要组成部分。一个好的测试验证不应仅满足“测试”相关的设备功能指标,更重要的是“验证”系统是否可以满足运行阶段的要求。运维人员也应利用测试验证的过程,熟悉未来的管理对象,验证设备操作流程的正确性,增加实际操作和应对突发事件的经验。
      
      另外,部分用户认为测试验证工作只与新建项目有关,其实不尽然,测试验证同样也适用于扩建、改造项目和日常的维护活动。对已经运行的数据中心做测试验证,通常称为“健康评估”,就是通过仪表测量、观察、分析等方式,找出隐藏的运行隐患,确保基础设施达到功能要求,实现预期的可靠性和可用性。用户应考虑将“健康评估”作为一种常态的测试验证形式,融入到日常的操作和维护工作中。
      
      作者简介
      
      王茜,北京中科仙络咨询服务有限公司技术及服务中心总经理,《数据中心场地基础设施运维管理标准》起草成员,《银行数据中心基础设施建设与运维管理》编委会成员,《从运维菜鸟到大咖,你还有多远——数据中心设施运维指南》编写成员,UptimeATD、ATS认证工程师。毕业于大连理工大学,制冷与低温工程硕士学位,先后工作于阿尔西制冷工程技术有限公司、博悦能集团,曾经从事制冷空调系列产品的研发设计,东南亚电信市场制冷设备的业务拓展,数据中心基础设施主设备的产品管理等工作。2011年加入博悦能集团,担任中科仙络咨询服务有限公司技术及服务中心总经理,是数据中心全生命周期技术咨询服务和Uptime认证方面的专家。
      
      编辑:Harris
      
       "));

  •