在大多数人的印象里认为数据中心和火灾没有太大关系,因为数据中心里除了电子设备就是电子设备,再加上数据中心具有完善的消防监控系统,认为就算有些火灾隐患也很快就消去了。然而,实际恰恰相反,数据中心却成了火灾的高发行业。
盘点火灾案例
2018年9月30日上午10点26分,据一知情市民介绍称,此次事发的具体地点为美国西海岸惠普大数据。“说来有点可笑,昨天我刚看到了他们的新闻,说是惠普全球大数据中心雏形初现,没想到今天就起了一把火,我想知道大数据中心的雏形还在么?会不会给烧没了!”
4月5日,拥有信息黄埔之称的北京邮电大学校园核心机房着火受损,众多北京高校校园网纷纷崩溃。据来自各校小伙伴们的消息,这一把火,可是烧掉了半个北京的校园网啊。
2015年10月13日,WindowsAzure上海数据中心发生故障,是由服务器所在机房着火断电引起,导致Azure基础设施离线无法提供正常服务,受影响的用户包括金融、互联网、房地产。
2015年5月26日早晨,远在美国亚利桑那州平顶山的苹果工厂发生火灾,起火点位于该公司数据处理中心屋顶光伏项目;
2015年1月10日亚马逊公司正在美国弗吉尼亚州建设的一座数据中心着火。
2014年7月20日重庆农商行数据中心发生重大火灾,整个机房全部烧毁,直接损失达到一个亿以上。
对于数据中心发生的故障,行业专家认为故障多发的原因还是在运维管理上,正所谓“三分技术,七分管理”,数据中心的故障大多源自于人祸。
怎样预防与处置机房火灾
数据中心火灾的主要特点是:散热困难、烟气量大、用电量大、电气火灾居多、火灾损失大、扑救难度大、节点易燃烧。
最需要普及的问题:七氟丙烷并非有毒,而是惰性,它的大量释放会挤占氧气的空间,空间中含氧量的迅速降低切断火源燃烧的条件,但是缺点是他喷放的时间只有短短的几秒,设置不合理可能无法一次性解决问题。其他配套设施的不妥善安装也会影响其效果。
绝对不能抱有的侥幸心理:我的机房还好,这么多年都没出过问题。应该清晰的认识到:我管理的机房还不够好,还需要多注意日常维护和演练。
如果你的机房是有人值守的机房,全天候有人近距离值班,怎样最大限度的保证机房安全?
一切前提是有一帮认真可靠的一线运维人员,愿意用专业的知识保护自身和机房的安全运行。
安装有极早期火灾预警探测装置;
配有气体消防灭火气体喷放装置,可通过消防主机自动启动;
日常每季度都检查整套消防装置的使用联动性;
日常工作中有建立火灾处置流程,将处置角色分配到合适的人身上;
装有环境监控系统,能够在告警发生后第一时间将信息传达到相关人员手中,启动处置流程;
第一,安装有极早期火灾预警探测装置是所有一切的前提,烟感、温感要在机房的合适部位监控这些环境要素,当发生任何一种告警都应当引起足够注意,因为气体灭火装置是在消防主机接收到烟感和温感同时报警后才会自动启动的。运维人员不能麻痹大意。这里有一点要提到,根据一位资深工程施工经理的反馈,机房环境他们做过测试,如果用传统型的烟雾探测器,在火灾发生早期敏感度较低,原因是机房内因为气流调节的关系,烟雾流动较快,早期烟雾浓度达不到探测对应的敏感度,只有到达一定浓度后才能产生告警,这时已经有点晚了。
第二,如果你安装了了气体消防主机,不论是二氧化碳的还是七氟丙烷的,都应该设置能够由消防主机启动,人员可以在30秒内停止,这里有个前提就是你的人员不能在内,必须马上逃离。要对逃离机房的路线绝对熟悉。扯远点的话就是逃生路径必须通畅不能堆放杂物,限于篇幅这个不展开来讲了。
第三,近期发生的一起特大行业事故,其中有一个原因就是发生事故的机房柜式气体灭火器从建成之日起就没有再进行过维护,事故发生后气体钢瓶已经不能使用,气压已经不足以喷放。所以,根据这期事故的原因和其他多起消防事故的成因来看,气体消防系统必须的也是务必要在半年、一年为单位进行全系统的测试该更换的及时更换,该检修的检修。
第四,就是跟日常监控过程有关了,重要的核心机房区域,必须建立值班人员火灾事故演练,简单的说就是,值班的人员都知道自己该干什么,根据日常演练的过程驾轻就熟的操作,避免事故扩大化,将损失降到最小值。如果光靠物理设备控制火灾蔓延未免有点太过想当然了。
第五,及时配备环境监控系统,要能够对消防信号干接点、消防主机、空调机、电路负载等进行实时监控,一有异常及时告警。及时处置,防患于未然。
最后,核心机房的运维细节繁多,质量控制手段的完善程度与机房承载的业务连续性是成正比的。除了日常运维,数据中心的应急预案也很重要,建设灾备系统正是其重要的环节一句话,只有平常日常建立完整的处理机制、流程、规章制度并加以遵守,才能从本源上确保机房安全。
编辑:Harris