咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
数据中心暖通与电气并存环节的巡检
  • 随着数据中心不断发展,其设备数量和电力负荷也不断增加,为了保证数据中心的运转效率和安全性,需要对其暖通和电气系统进行定期巡检。本论文主要研究数据中心暖通与电气并存环节巡检方法,旨在提高数据中心的运转效率和防范安全隐患。
  •  一、概述
      
         随着数据中心的快速发展,数据中心内基础设施维护变得愈发重要。数据中心运维巡检的主要目的是保障设备“安全、可靠、持续”的正常运行,提高设备的利用率,降低损耗和维护成本,进而使得数据中心的运行更加高效。但关于基础设施运维的巡检还缺少系统性的研究,造成基础设施维护的脱节,对数据中心的稳定运转具有较大的影响。

      1.1 研究的背景及意义

         随着信息存储的方式不断革新,数据中心在各个领域的重要性越来越突出。数据中心由一系列复杂的系统组成,为其配套设备提供良好的运行基础,然而,在相关系统设备使用过程中也会遇到一些问题,如设备温度过高、电气故障等,这些问题将对数据中心的稳定性和安全性产生负面影响,甚至可能导致数据泄露等不良后果。因此,对数据中心进行定期的巡检和维护显得尤为重要。

    目前,数据中心巡检的方法主要集中在电气巡检和暖通巡检两个方面。电气巡检主要是检查数据中心的电源系统、UPS系统、照明系统等运行状态是否正常、稳定,若其运行出现异常、或者某设备发生故障,需要及时修复,以保证各个系统能够正常稳定运行。暖通巡检则主要是通过检查温度、湿度、空气流通等方面,保证数据中心的温度稳定在一个适宜的范围,防止因温度异常导致设备故障和数据丢失等后果。为了数据中心的不间断运行,同时达到效率、稳定、低能耗,针对数据中心巡检过程中存在的问题,分析了电气巡检和暖通巡检的重要性,同时引入并环巡检方法设计系统。旨在提出一种针对数据中心暖通与电气并存环节巡检的方法,减少管理人员的工作难度、减少操作失误的风险,同时也使得管理工作更加有效、省时,以提高数据中心巡检的效率和质量。

    1.2国内外研究现状

    数据中心作为信息技术和经济发展中的重要组成部分,其运营效率和安全性备受关注。对于数据中心的巡检方式,国内外学者和专家们也已经开展了一系列的研以探讨更加高效的巡检方法。

    1)国内研究现状

    在国内,一些学者和专家着重于数据中心冷却问题,如在冬季采用自由冷却等措施,或者研究数据中心间的热交换技术。在电气方面,一些学者关注于UPS电源等的可靠性和稳定性,并通过网络监测等手段实现远程控制和故障诊断等。同时,巡检系统也在数据中心安全管理中得到广泛的应用。

    有的从数据中心的结构、维护情况和维护管理方向入手,分析了数据中心运维中的隐患,探讨了数据中心在运行维护过程中采取的安全措施,从而实现数据中心的安全运行维护。

    有的认为数据中心维护管理的力度大大落后于数据中心设计和建设能力。因此,对数据中心的维护巡检思路进行分析,探索提升维护巡检能力的最佳实践。随意从数据中心巡检运维角度出发,参照当下的实际情况提出可行的巡检运维策略,使得巡检运维的整体质量有大幅提升,如此一来,数据中心才会更加稳定,推动数据中心发展的进程。

       2)国外研究现状

          在国外,德国的研究者提出了一种整合了暖通、电气共同巡检的数据中心集成设计方法,以提高数据中心的能源利用效率和运营可靠性。美国的学者研究了数据中心的热效应和供电系统的高可靠性,提出了一种兼备高性能和高可靠性的数据中心设计理念。

    国外关于数据中心巡检方法的问题,学者们进行了多方面的研究,使用、实施和发展了各种方法和模型。在本研究中,通过调查发展中国家和IT基础设施的维护管理问题,努力总结了这一主题的大多数研究,还将讨论各工业部门采用的方法和模式,这种方法可以帮助寻找新的方法,为发展中国家制定一个优化的维修管理计划和框架。

    Saha(2016)指出:每个系统的维护阶段都是非常重要的,特别是在发展中国家,由于几个关键部件一直在运行,需要一个适当的维护管理系统来证明各种维护工作,以监测直流运行、查找部件故障和提供修复策略。一些学者强调了巡检的重要性,他们对各种巡检方案进行了研究,以做到节能减排,提高系统的可靠性、质量和性能。设计方法和技术的实施,同时最大限度地减少运营和维护成本[5]。

    为了探索一种更加高效的巡检方法,在之前理论基础上,本文提出了一种新的巡检思路,即通过相应系统设计的建立来实现限制电气巡检人员与暖通巡检人员并环巡检.

      二、数据中心并环巡检方法设计
      
         2.1电气巡检

    巡检工作的实施力度直接影响着数据中心性能的高效发挥和维持稳定时间的长短。对现有的电力系统进行巡检工作是提高设备运行稳定性的重要内容,而只有正确合理的进行巡检,再加以精心维护保养,才能最大程度保障数据中心的稳定性,为国民的经济发展提供有力保障。反之,将会降低数据中心的可靠性,极大程度影响设备生产的安全性和稳定性。

      为了保证电气设备的可靠性,要求数据中心电气运维人员认真做好电气设备的巡查工作,如电机工作状态等,提前发现设备的异常情况,以防止事故的产生。即通过定期检查维护和巡检人员根据设备的运行情况得做出判断。当下大部分企业更看重设备的工作效率,忽略巡检的重要性,这极大影响了设备运行的安全性和可靠性,所以要想保障设备的工作效率,就必须规范巡检的方法方式。

    2.2暖通巡检

    随着互联网行业高速发展,低容量的数据中心已经不能支撑庞大的数据,而能够容纳庞大数据的数据中心其机柜数量也及其庞大,成百上千的机柜,使得其能源损耗愈发严重,发热问题也愈发突出,这也使得暖通风险需要更加注意。

    传统的暖通系统主要采用房间级空调,从地板送风的冷却方式运行,但随着机架式、刀片式等设备的数量增加,机柜内功率、设备密度、发热程度都明显增加。暖通散热采用新风直接冷却。数据中心外的空气经过设备过滤后,调整温湿度,然后通过风扇送给数据中心所需机房降温,随后使用过的空气将排到室外。也有采用利用水冷却的方式,就近取用江湖水。

    2.3数据中心电气与暖通交汇

    电气专业与暖通专业关联密切,电气专业设计服务于暖通设计,电气模块所需资料暖通模块人员应及时提供,防止对设备的设计进度造成影响。需要提供的用电设备资料主要有空调系统、冷水机组等的位置及额定电压、额定容量和用电类型,如为消防或应急供电。在系统构造过程中,空调的风机口和机房内部设备的布置,也应给电气专业提供资料,相互协调;空调及排烟风管的走向及标高应与电气专业桥架的走向标高相协调,避免相互碰撞。但若暖通方面提供相关资料不及时,就会影响电气专业的设计效率。在构造过程中,需提供以下数据给电气专业:暖通设备平时用电量以及灭火用电设备型号等,使电气人员可以精准计算容量;暖通规划人员如果对电气消防规划存在纰漏,就容易为火灾的产生提供漏洞。消防设备由暖通方面进行规划,而大部分消防设备都需要由电信号来反馈信息,这就需要向电气方面提供设备的方位和操控条件。例如:系统中的防火闸门、进风通道及设备电机等。同时,两专业配合规划不周,也会埋下安全隐患。

    2.4数据中心电气巡检和暖通巡检交汇带来的风险

    数据中心系统的建设离不开暖通设备,而大多数设施都需要电气的配合,这也会导致两方交汇产生的问题分界模糊,从而造成双方巡检人员无法处理相应故障,造成隐患。例如昆山的金属加工厂爆炸,就是因为暖通系统发生电气短路而暖通排查人员不懂电气相关知识才造成了惨烈的后果。

    2.5提高数据中心巡检可靠性的方法设计

    当今安全问题已经成为了数据中心最不可忽视的问题,对此本文提出一种由门禁防线设计来保证巡检人共同巡检的方法,以提高数据中心的安全运行效率,门禁系统在数据中心安全建设方面得到相当大的重视。现今的安全系统主流是通过一些密码解锁和刷卡解锁,而这些解锁方式都需要人员近距离认证,对于数据中心来说这些没有特殊性的识别方式是不完善的,经常容易导致某巡检人员独自进入处理其他领域的故障。这就会让数据中心的安全运行不能够保障。而本文设计的并环巡检方法,可以从根本处理上述安全问题。

    该设计就是用各种门禁系统来限制巡检操作人员不能为单一专业的,加强电气专业与暖通专业共同巡检的配合,分析配合中产生的问题,确立彼此之间的职责,避免区分不明而使巡检发现的故障不能及时排除问题,因此暖通重点环节与电气加强配合就显得尤为重要,这也是本设计的初衷。本文通过三道防线的设计,解决并环巡检过程中的模糊问题,这三道防线分别是门禁卡系统、人脸识别系统和指纹识别系统,防线关系如图1所示。

    1)第一道防线系统的组成是用一套完整的门禁系统分为门口模块,用户模块、系统后台(监管中心)三大部分,其系统组成如图2所示。门口模块包括门禁的主机、锁具、闭门器,电源等装置。主机的功能是将开锁人的身份信息采集到的各种门禁记录等信息后传回到系统后台进行处理。用户模块包括IC卡、身份证等。系统后台负责提供监管服务,可对人员信息登记、门禁授权与出入情况进行监管,对储存的身份信息、登记、注销数据信息上传,此处采用COSON科松系列门禁系统。
       
    注意事项要求电气与暖通相关人员必须在该系统中使用个人身份证和有效专业证件进行登记,身份和证件与专业被核实一致才可下发通行卡,单人单卡,个人必须保管好自己的卡,如不慎丢失需要及时上报冻结。该套系统系统作为限制电气和暖通人员共同巡检,作为并环巡检方法设计的第一层保护,需要两专业巡检人员在进入相应机房前同时使用各自的磁卡,经过系统核实无误,才可解锁通行,如果发生单一人员刷卡或者卡上人员信息不匹配等异常情况,则无法进行开锁,同时系统后台将记录下相应信息并进行预警,这样可以让相关监管人员第一时间到达现场查看。

    2)第二道防线的设计构成由人脸图像提取分析仪、配套锁具、相应处理器、后备不间断电源、后台监测软件经过联网后组成。系统组成原理如图3所示。
       
    人脸图像提取分析仪:存储图像数据和识别记录,配合后台智能识别功能模块,是其核心部分。配套锁具:开锁的电动机构。与分析器二者连线要求采用2根1平方毫米的铜芯聚氯乙烯绝缘聚氯乙烯护套软电缆。解锁开关:出门解锁装置。与识别仪二者连线要求采用2根0.3平方毫米的铜芯聚氯乙烯绝缘聚氯乙烯护套软电缆。电源为整套系统供电。监测软件是利用远端电脑监测系统状况,管理图像数据。网络是使用稳定的网络进行系统的串联。

    系统原理是巡检人员在入职时首先要在人脸识别系统内进行图片采集、人脸定位、特征提取等工作,解锁时第一步需要进行刷卡验证身份,若双方巡检人员身份专业识别无误,则人脸分析激活运行,此时则需要之前的巡检人员对准图像识别框,仪器会采集人员信息,然后将信息送达后台对应的服务中心,服务中心借助数据库中的人脸信息进行比对,输出匹配情况,并判断其是否符合进入该机房巡检的条件。权限符合,门锁自动弹开,权限不符合,系统预警,报告监管人员,刷脸系统流程如图4所示。
       
    该系统设备与功能如表1所示。整套人脸识别门禁采用FC-8143T人脸门禁,FC-8143T具有百万高清摄像头、高速识别、双目活体识别、支持多人同时识别1:N人证核验任意模式等优势,识别准确率更是高达99.9%,各设备选型如表1所示。

    设备安装是将磁力锁、阴极锁、出门开关分别连接与电源箱与系统主机,再将读卡器消防输入、门磁、报警输出连接到另一电源箱与主机系统,之后将门铃与门铃控制板一同连接在主机上,最后将计算机TCO/IP连接交换机再连接在系统主机即可完成安装。

    3)第三道防线的设计在于随着5G时代的到来,数据信息愈发庞大,数据中心数量日益增加,为了数据信息的安全,数据中心必须稳定运作。由此引入前文的两道防线通过限制并环巡检从而保障稳定运作的基础保障,而数据中心内的一些关键设施的操作,也属于两专业巡检人员的工作,所以操作人员也应该由电气专业和暖通专业共同操作,以免在单独操作过程中因为不了解对方专业而产生误操作,第三道防线由指纹采集系统来保障。

    系统组成是在操作过程中,通过使用指纹采集识别限制并环操作。巡检人员在操作时需要双方巡检人员在相应的设备上进行指纹采集,只有指纹识别正确方可解锁进行相应的设备操控,否则将会预警报备后台监管人员。

    指纹锁系统由智能指纹采集识别模块,锁具控制模块,电源,控制MCI等5大部分组成,指纹锁采集识别模块对应关系如图5所示。

    系统原理是巡检人员需事先在指纹数据库采集个人指纹信息,在之后的操作设备中需进行识别时将所录指纹的手指摁压在采集设备上,系统将会进行指纹图像的采集,进行指纹图像的分割、图像增强等处理后提取指纹特征与指纹数据库进行对比,匹配成功将自动开锁,指纹解锁流程对应关系如图6所示。
         
    系统选型是采用FM-70型指纹识别模块,该模块以DSP处理器TMS320VC5416为核心,搭配其适配的以光学原理特制的指纹纹路采集传感器,能够完成指纹录入、搜索、比对、和信息储存等任务。主要包括指纹取集和指纹处理两部分,指纹取集采用型号为MBF200的指纹传感器,其分辨率为600DPI;指纹处理由高性能DSP处理器TMS320VC5416和FLASH等构成,指纹识别模块如图7所示。
         
    TMS320VC5416是国外制造的16位高效能信号处理集成芯片,从运算速率来说,若系统录制指纹与实际指纹的识别点数分别为a和b,则算法速度见式(2.1)。

    (a(a-1)b(b-1))(2.1)

    该芯片的主要特征是:

    1)运算速度超快。时钟频率高达300MHZ,内部配备的高速双乘加器构造最高可完成六百多万次/秒的运算。

    2)数据处理能力强。使用改良后的的哈佛结构,片上拥有双读写RAM,其空间为64KByte,仅需半个时钟周期就可完成一次读取或写入数据;含双路指令缓存器,空间为16KByte。

    3)编码密度高。指令集长度为7-bit到49-bit可变,代码量小,代码密度高。

    4)兼容性强。外部存储器总线模式可与8位、16位和32位兼容,外部存储器接口可与多种存储器实现并行连接,比如同步或异步存储器SRAM、SDRAM、SBSRAM等。

    5)片上外设多样。拥有12C串行总线接口,还有HPI接口、锁相环接口、时钟组件、多通道缓冲组件等。

    并环巡检系统在巡检中的应用制度与前文的三道防线协同组成数据中心电气暖通并存环节巡检方法,数据中心的设备操作种类繁多,内容广泛,具有不同的操作方法和步骤,值班人员必须使用操作单进行工作,否则很容易发生误操作事故,这样就形成了数据中心的入侵。如果规范填写操作单,将操作项目逐一填写完整,按票进行操作,就可防止数据中心发生不必要的误操作,保护数据中心运行的安全性,稳定性。

    操作监护制度认真执行的措施主要包括:操作单编号必须按顺序使用,操作单执行完成后的管理检查,操作单合格率的统计等。

    为了保障设备的稳定运行,就需要做好事故隐患排查,及时发现事故的隐患,消除事故隐患。真正做到“预防隐患”。在日常巡检工作中应该重视相关巡检模式,促使并环巡检方法设计真正实行,可减少数据中心运行故障概率,同时也要求巡检人秉持负责、态度端正、细心的原则,熟悉设备结构、性能和运行指数。在巡检过程中最少安排电气和暖通两个专业的人员进行巡检工作。

    巡检工作主要包括:判断变压器是否在正常工作,且查看是否有安全隐患:检查变压器的管套、外表是否干净、是否存在漏电现象;接地线良好;检查固定配件,如底座、栏杆有无生锈、腐蚀;检查电缆和母线能否正常工作;检查风冷系统的电气设备运行是否异常。

    恒温机房和相应气体通道巡检:暖通人员要巡查暖通设备是否常态运作,设备声音是否正常,冷凝水排放情况,无漏风现象。管道阀门有无跑水、冒水、滴水、漏水等现象,设备温度、压力等参数正常。

    并存环节巡检设计是在数据中心在发生运行异常时一般都会引起数据机房温度的变化,而温度不再恒定将会对数据中心机房内的核心数据储存设备造成非常严重的影响,会破坏数据中心的稳定运作,所以当故障发生后相关巡检人员要迅速、准确的找到故障,修复故障。同时为了防止不相关人员或者某巡检人员独自处理故障,电气巡检人员和暖通巡检人员需经过三道防线的权限核查方可一同前往现场检修。

    设备运行异常的恢复处理需要建立相关的应急运维制度,这需要值班员在各环节中严格按照计划执行,从制度层面保证并环巡检。其中巡检操作员工必须持有相应专业的实操证书来保证专业性。运维制度包括修复指令和修复指令复诵、操作单、操作监护、操作单管理等制度组成。其中修复指令和修复指令复诵制度是指相关负责运维人员下达修复指令进行故障的检修恢复,听令人要重复命令的内容,且确认无误后,依照传达的修复指令进行故障修复工作。除上诉人员外的其他人员都不能发出、受理指令。为了避免修复错误,需严格遵从电气暖通专业巡检员的审核,其他人员均无权发、受操作令,每次所下达的修复指令只能给一个操作任务,执行完毕后,再下达第二个指令,受令人同时间内只能接受一个指令。想要避免受令人发生错误,发令人所发指令应准确、清晰、使用正规的专业术语和设备准确名称和型号。为避免操作错误,值班调度员发布指令的全过程和听取指令的报告,都要录音并作好记录。

    凡涉及故障修复操作,均必须填写操作记录单,这就是操作单制度。操作单制度是防止数据中心入侵的重要组织措施。

    实操监护制度是在发生故障后应由负责暖通和电气的巡检人共同修复,分别进行实操和监护职责,运维实操中进行的唱票和复诵形成操作监护制度。这种制度是一种防止数据中心入侵的重要组织措施。

    在故障修复中,负责监护的人员要根据操作单的内容向实操人发布条令,直到故障修复。操作人应复述监护人读取的每项操作令,确保正确后,按照指令检查设备的方位、名称、编号、拉合方向等,经监护人检查无误后下达动令“对,执行”后,操作人方可操作。监护人时刻关注操作人员动作,发现有误立刻矫正。

    为防止步骤遗漏,顺序颠倒,应在每项操作任务完成后做好“完成”标记,待全部任务完成后经复查无误后,将操作任务、要点和时间详细记录在值班登记薄内。

    三、小结
      
    本文以数据中心基础设施巡检为核心,引入了数据中心暖通与电气并存环节巡检理念,以传统单一专业巡检入手,分析了巡检对数据中心的重要性,利用并环巡检方法设计,并基于门禁系统在以下几个方面达到了并存巡检的目的。

    1)首先对数据中心的电气巡检和暖通巡检组成做了简单陈述,分析了它们对数据中心的重要性。

    2)针对数据中心的巡检现状,提出了更加高效的并存环节巡检,结合定期巡检策略对数据中心的巡检方法进行设计。

    3)提出了建立针对并存环节巡检的巡检方法,将其引入数据中心巡检环节,并提出了通过不同的门禁系统来实现数据中心的并环巡检。

    通过相应的门禁系统,对所设计的数据中心暖通与电气并存环节巡检方法加以应用,提高了数据中心的运营效率并降低了故障发生率,初步取得了效能。

    本文的暖通与电气并存环节巡检方法取得了初步的成效,但仍然可以从以下几个方面进行改进并作深入的研究。暖通与电气并存环节巡检作为一种高效可靠的巡检方法,巡检人员需按时对相关设备进行巡检,并进行检查检测和分析研究。人工巡检是一种成本较高的方法,随着巡检人员的需求逐渐变大,在未来的研究方向上应该结合AI智能巡检与人工的运行调节系统优化,根据大数据的优势特点,探索更具经济性的巡检方法。

       作者简介
      
        岳东,华宇数通(北京)信息技术发展有限公司总经理。对于暖通专业设计、施工、运行管理从事多年、积累多项专利,对于公司管理具有丰富经验,正在撰写关于数据中心运维实施管理节能等的细节需要关注内容的丛书。

        编辑:Harris


     

  •