1 机房技术的界定与特征分析
用户购买并运行机房设备的根本原因,在于期望负载设备能够连续不断地运行业务,因此用户最终追求的是设备正常运行的连续性,即可靠性和可用性。IT环境中的机房技术一般包括以下方面:综合布线、抗静电地板铺设、棚顶墙体装修、隔断装修、UPS供电系统、专用恒温恒湿空调、机房环境及动力设备监控系统、新风系统、漏水检测、地线系统、防雷系统、监控、消防、报警、屏蔽工程等。
(1)防静电地板铺设
机房工程的技术施工中,机房地面工程是一个很重要的组成部分。机房地板一般采用防静电活动地板。活动地板具有可拆卸的特点。因此,所有设备的导线电缆的连接、管道的连接及检修更换都很方便。
(2)隔断装修
为了保证机房内不出现内柱,机房建筑常采用大跨度结构。针对计算机系统的不同设备对环境的不同要求,便于空调控制、灰尘控制、噪音控制和机房管理,往往采用隔断墙将大的机房空间分隔成较小的功能区域。隔断墙要既轻又薄,还能隔音、隔热。机房外门窗多采用防火防盗门窗,机房内门窗一般采用无框大玻璃门,这样既保证机房的安全,又保证机房内有通透、明亮的效果。
(3)不间断电源系统
信息时代中要提高基础网络环境的可用性,不间断电源(UPS)系统是关键要素。计算机机房负载分为主设备负载和辅助设备负载。主设备负载指计算机及网络系统、计算机外部设备及机房监控系统,这部分供配电系统称为“设备供配电系统”,其供电质量要求非常高,应采用UPS供电来保证供电的稳定性和可靠性。辅助设备负载指空调设备、动力设备、照明设备、测试设备等,其供配电系统称为“辅助供配电系统”,其供电由市电直接供电。
(4)精密空调系统
机房精密空调系统的任务是为保证机房设备能够连续、稳定、可靠地运行,需要排出机房内设备及其它热源所散发的热量,维持机房内恒温恒湿状态,并控制机房的空气含尘量。为此要求机房精密空调系统具有送风、回风、加热、加湿、冷却、减湿和空气净化的能力。
机房精密空调系统是保证良好机房环境的最重要设备,应采用恒温恒湿精密空调系统。
(5)新风换气系统
机房新风换气系统主要有两个作用:其一给机房提供足够的新鲜空气,为工作人员创造良好的工作环境;其二维持机房对外的正压差,避免灰尘进入,保证机房有更好的洁净度。
机房内的气流组织形式应结合计算机系统要求和建筑条件综合考虑。新排风系统的风管及风口位置应配合空调系统和室内结构来合理布局。其风量根据空调送风量大小和机房操作人员数量而定。新风换气系统中应加装防火阀并能与消防系统联动,一但发生火灾事故,便能自动切断新风进入。如果机房是无人值守的则没必要设置新风换气系统。
(6)接地系统
机房接地系统是涉及多方面的综合性信息处理工程,是机房建设中的一项重要内容。接地系统是否良好是衡量一个机房建设质量的关键性问题之一。机房一般具有四种接地方式:交流工作地、安全保护地、直流工作地和防雷保护地。
(7)防雷系统
机房雷电分为直击雷和感应雷。对直击雷的防护主要由建筑物所装的避雷针完成,机房的防雷(包括机房电源系统和弱电信息系统防雷)工作主要是防感应雷引起的雷电浪涌和其他原因引起的过电压。
(8)监控系统
机房监控系统的规模不大,但是它是建立机房安全防范机制不可缺少的环节。它可以24小时监视并记录下机房内发生的任何事件。
(9)漏水检测系统
机房的水害来源主要有:机房顶棚屋面漏水、机房地面由于上下水管道堵塞造成漏水、空调系统排水管设计不当或损坏漏水、空调系统保温不好形成冷凝水。机房水患影响机房设备的正常运行甚至造成机房运行瘫痪。因此,机房漏水检测是机房建设和日常运行管理的重要内容之一。除施工时对水害重点注意外,还应安装漏水检测系统。
(10)机房环境及动力设备监控系统
随着社会信息化程度的不断提高,机房计算机系统的数量与日俱增,其环境设备也日益增多,机房环境设备(如供配电系统、UPS、空调、消防系统、保安系统等)必须时时刻刻为计算机系统提供正常的运行环境。因此,对机房动力设备及环境实施监控就显得尤为重要。
机房环境及动力设备监控系统主要是对机房设备的运行状态,温度、湿度、洁净度,供电的电压、电流、频率,配电系统的开关状态、测漏系统等进行实时监控并记录历史数据,实现对机房遥测、遥信、遥控、遥调的管理功能,为机房高效的管理和安全运营提供有力的保证。
2 我国机房技术的发展
2.1 我国机房发展历程
我国从1958年开始建设计算机机房,已经经历了50多年的时间,机房技术也经历了前期(1958~1978年),中期(1978~1990年),后期(1990~2000年)和现代(2000以后)四个时期。在这四个时期内,由于计算机技术的变化,对机房的技术要求也在发生变化,机房的设计理念、实施方法、管理模式等都在发生着变化。
(1)前期机房(1958~1978年)
前期的机房是为某台计算机(大、中、小型机)专门建设的,并没有统一的标准,完全是在摸索中建设的。这时的机房只有降温措施,但没有精密的温度控制,也没有测试和指标。采用的是风道送风,稳压器供电,没有对电力干扰(尖峰、浪涌)的防范,也没有严格的除尘措施。导致计算机系统稳定工作时间只有几十分钟到几个小时,往往一天就要发生几次故障。有时坏一次要修1~2天,遇停电等问题没有任何应对措施,可靠性和可用性极差。
(2)中期机房(1978~1990年)
由于计算机系统的产生,出现了专门为单个计算机系统设计的机房,有了专用的机柜(大、中、小型机柜),并且开始逐步制订标准,包括机房选址、面积等。机房制冷也从集中冷却到采用恒温恒湿的专用空调机,机房设计上引进了防静电概念,使用了防静电地板。在设备上也引进了UPS等设备。消防系统方面采用自动与半自动设备,具有大机房面积、宽设备运输通道,能够为单个指标进行测试和监控。机房除尘方面采用新风系统和机房正压防灰尘。这时候的计算机系统能稳定工作几天,并且已经开始引入模块化的概念。
(3)后期机房(1990~2000年)
IT设备逐渐小型化,服务器逐步成为主体,多台计算机、服务器联网,开始大量共用网络设备。数据的存储介质水平逐渐提高,对数据进行了更严格的保护,并广泛使用恒温恒湿的专用空调。在这个时期,机房技术已经相当成熟,供电系统、防雷系统、冷却系统、监控系统、安防系统、机房装修等已经各成体系,也根据各种经验、教训制定了比较全面的、适合当时IT技术水平的建设和施工标准。这时候的IT系统稳定工作时间为几十天、几个月,可用性和可靠性均有了大幅提升。但此时的服务器还是每台配备一套显示器键盘鼠标,KVM的概念也是刚刚开始,大大浪费了资源。
(4)现代机房(2000以后)
IT设备进一步小型化,所有设备都进入机架,机架成为机房IT设备的主体。具有更合理的可用性设计,更高的实用性、先进性、灵活可扩展性、可管理性、可维护性,设备更加标准化,并且加强了对数据保存环境的重视,对机房建设进行了更加严格的监测与监督。IT设备的工作时间基本上是连续的,可保持24小时不关机。这时候的系统能够稳定工作几个月或者更持久。
2.2 我国机房技术发展现状
在IT技术发展日新月异的今天,无论机房管理人员还是多年从事机房设备的专家,都面临着不断突破传统思维跟上IT技术发展的要求。机房中IT设备与10年前的IT设备相比,已经更新了4~5代,而应用软件的发展更是10年前所无法想象的。但是,用户最初接触IT技术的时候,看到的只是PC、服务器、网络设备,以及在其上运行的软件,而IT设备和业务应用对机房的环境要求也不是很高,当审视机房网络关键物理基础设施的构建方式时,发现很多用户仍然在沿用几十年前的方式。随着用户对信息依赖的加强,机房技术呈现以下特点:
(1)网络运行要求
用户需要确保网络365×24h不间断运行,IT系统可用性要求达到99.9%,甚至99.999%以上,这就要求相应的电源系统能够保证网络的运行。
(2)机柜设计要求
机架式设备,甚至刀片式设备越来越普及,单个机柜中的功率密度越来越高,这带来了机柜中的配电、布线、散热、监控等一系列问题。当机柜中的IT设备只有1~2台时,这些问题都不明显,但是当机柜中的IT设备到了10台甚至更多时,几十根电源线、数据线,如果不进行合理有序的配置、布线,很容易造成网络中断,而且如此高功率密度的设备如果不进行有效的散热,机柜内的温度超过IT设备正常温度时,系统也会宕机。
(3)用户业务发展对机房建设的需求
市场风云变幻,公司业务的发展情况很难准确预计,CEO对TCO(总体拥有成本)及ROI(投资回报率)的要求,使得CIO在预估机房规模时慎之又慎。传统的机房设计方式和技术无法实现可以方便扩展的网络基础设施,如果不按照未来的使用容量来建设机房,当公司发展后,只能将IT系统宕机,重新进行配电、布线等网络基础设施建设,这样带来的损失和资金浪费也是无法承受的。所以用户对网络基础设施容量的估计一般都大大超过目前可能达到的最大容量,而在实际应用中,可能只有10%的容量被利用,其他90%都闲置着、浪费着。这种超过现有规模的设备投资,不仅占用了大量资金、耗费更多的日常管理费用、增加设备折旧费用,而且每3~5年更新一次的IT技术使得超出现有使用功率的网络基础设施会被淘汰。
用户迫切需要一个新的机房设计方式,需要既能适应用户的当前需求,又能随着用户未来需求不断升级的网络基础设施方案。
(4)用户对机房管理的要求
以前只有电信、金融这样的行业大用户才会有容纳各种IT设备的机房,在这些用户中IT设备、电源设备、空调设备分别有IT技术人员、强电技术人员、机械技术人员等专人管理,各领域互不相关。其他行业的用户信息化程度不高,甚至没有正式机房。如今,各行各业的用户都拥有自己的机房和各种IT设备,对于很多用户来说,他们不希望在机房管理上配备太多人员,希望有IT运维人员就能将IT设备、UPS、配电、布线、空调、监控等各个环节管理起来。而传统的机房基础设施没有管理软件,更谈不上能够兼容IT接口进行远程管理。对具有易管理性的集成网络基础设施解决方案的需求日益明显。
总之,用户对IT系统的可靠性和可用性的需求,最终转嫁到机房技术上。不但要提供机房大环境还要提供机房小环境;机房设备要采用冗余设计和模块化设计,以提高可靠性和可用性;各系统统一规划以提高整个机房的可靠性和可用性;强调监控系统的作用;强调设计、施工的标准化;重视机房的日常管理;同时IT服务的外包要求也日益凸显。面对这样的用户需求,必须改变传统的机房设计技术,抓住技术革新潮流带来的机遇,为用户提供全方位的机房服务,增强竞争优势。
2.3 机房技术发展趋势—NCPI理念
计算机技术在不断发展,作为计算机(IT设备)的“家”——机房,也在随之发展,NCPI理念逐渐被认同并成为未来机房发展的趋势。机房技术要在高安全性、高可用性、高灵活性、机架化、节能性等方面的综合考虑下向前发展。
美国可用性研究中心在2002年提出了NCPI(网络关键物理基础设施)的概念。NCPI是机房中与IT系统紧密相关、关键的一部分,包括了与数据中心基础物理设施有关的全部内容,诸如不间断供电系统、空调制冷系统、IT设备(机架)微环境、系统管理、机房建设等方面。
美国可用性研究中心提出的NCPI设计理念指导、改变着传统的机房设计理念和建造方法,最明显地变化体现在以下四个方面:
(1)对供电系统的设计不能局限在只是通过变压器和主电源开关向机房提供满足功率容量和电压制式要求的动力电,而是要对整个机房乃至IT设备微环境(机架或机柜)的供电质量、可靠性和可用性、电力传输、各种设备的匹配和连接、电源的管理等一系列问题做全面的研究和设计。
(2)对机房空调制冷系统的研究和设计不能局限在保证机房内的温度和湿度,还要保证IT设备微环境的温度和湿度,这方面研究理念的一个重要变化是“如何把IT设备产生的热量有效地带走”,保证IT设备在最佳的温湿度环境下工作。
(3)对整个机房的集中管理得到所有系统设计和机房建设者的普遍重视,提高管理水平是提高系统可靠性和可用性的关键因素之一,同时也是提高使用维护水平、降低人为故障的有效措施.
(4)机房是作为固定资产投资建设的,在IT技术快速发展和变化周期缩短到3~5年的形势下,如何缩短建设周期和提高对应用需求迅速变化的适应能力变得尤为重要。
新的设计理念极大地影响着UPS、空调等机房设备的技术发展方向,也极大地影响和指导着IT服务企业一改传统的设备供应商为一体化系统解决方案提供商。随着信息技术的发展,NCPI的内容也将不断发展,成为所有网络赖以生存的基础,“一体化”和“集成化”也将成为新的发展趋势。■
作者简介
李东霞,女,(1969-),山西财经大学MBA硕士,工程师,山西广通博科技贸易有限公司总经理。主要从事软件开发、计算机整体机房规划和设计工作。