进入2014年的这一个多月时间里,DCIM产业的喜讯连连:ABB公司发布了DECATHLON的试用版,FACEBOOK宣布采用CA公司的DCIM系统,Geist公司发布了Environet的第4版,Raritan宣布了其DCIM为ChoiceHotels带来节能上的显着成效……随着企业数据中心建设的加快,对于数据中心基础设施的管理也日益受到IT负责人的重视,DCIM产业正要迎来蓬勃发展的一年。
数据中心管理的新难题
加速数据中心的建设已经成为越来越多的企业发展的必然需求,云计算和大数据可为企业发展提供强大的技术支持,需要更为高效的数据中心做基础。前不久IBM宣布将斥资逾12亿美元新建15个数据中心以拓展其云服务的消息占据了各大媒体的头条,近日Facebook需要一人管理2万台服务器的运维内幕曝光也得到了业内人士的共同关注。可见,高效数据中心的建设和管理问题依旧是业界的重点话题。
然而,数据中心在这数十年间的发展却经历了巨大变迁。当企业业务规模从本地拓展到了全国,甚至遍布全球,企业的数据中心也从早日只有几台服务器的机房发展成为大型数据中心,云计算和大数据的需求更是让大型数据中心得以成为数据中心建设的主流。相较于此前那几平米的简陋机房,大型数据中心会有成千上万的机柜,先进的风冷水冷混合动力控温系统淘汰掉了家用空调,UPS加EPS的综合容灾系统也已经取代了简单的插线板。为此,更为先进的基础设施运维管理成为了摆在数据中心管理建设的一道新难题。
然而,先进的基础设施配置并未能带给数据中心更为高效的运行,数据中心运维管理的弊病进一步凸显。在数据中心里,基础设施实际上包含了两个方面,一个是服务器、存储、交换机这类的支撑企业业务运作的核心IT设备,此部分设备由专门分配的IT运维人员管理;另一部分是支撑上述IT设备运行的UPS、空调等辅助系统,由相应的运维人员管理。然而,多年的实践表明,两部分运维人员并不能形成很好地配合。IT运维人员更多地只关注了IT技术问题的解决,而为另一部分管理人员所不屑,只将IT设备作为普通的建筑设施来看,同UPS、空调等辅助系统处于同样的管理等级。两部分管理人员的管理权之争问题在大型数据中心建设上更加凸显。
另外,数据中心的运维透明度低成为另一个新难题。在一般情况下,CEO很少具体管理数据中心事物,CIO会是实际的管理者。缺乏有效地数据中心智能管理系统,为CIO向CEO的汇报带来一定难度,如PUE的控制、真实的能耗情况、运维中的隐性成本、进一步投资的可行性等等,使CEO很难了解具体情况从而做出合理的改善决策。
DCIM解决大型数据中心运维管理难题
数据中心管理的复杂性和约束在日渐增多,如能源和环境的制约,使未来数据中心的建设、管理比以往任何时候都更具挑战。而DCIM(DataCenterInfrastructureManagement,数据中心基础设施管理)正是在大型数据中心管理需求增加下的一个产物,通过采用统一的平台,同时管理那些关键基础设施如UPS、空调以及IT设备,如服务器、网关、路由、交换机等,并通过数据的分析和整合,最大程度提升数据中心的运营效率,提高数据中心的高可靠性。诸如RagingWire、Datotel和Logicalis这样的专业企业都在利用DCIM技术实现客户高效的数据中心运行,很多IT巨头如IBM通过联合艾默生、美国康普通过收购iTRACS等跨界方式开发集成DCIM解决方案。根据产业分析机构Gartner估计,DCIM当前的市场规模价值为4.5亿美元,到2016年有望增长至17亿美元,而2014年已经被很多业内人士誉为是DCIM年。
DCIM背后的想法很简单,但功能很强大:通过自我感知网络组件,一个中央数据仓库和智能处理系统,可以实现对数据中心的核心基础设施实现自动实时管理。二十年前,DCIM的强大功能对于那几平米的简陋机房来说无疑是大材小用,然而当前,DCIM对于需要一个人管理管理2万台服务器的数据中心来说似乎是正当时,这也不难理解为何FACEBOOK为何会高调宣布要采用DCIM系统。不可否认,已经有越来越多地CIO正在认识到DCIM作为提高生产力的主要驱动力。Raritan为ChoiceHotels部署的DCIM系统已经证明,利用DCIM管理数据中心基础设施,可以以减少网络停机时间,优化电源和空间使用情况,并加快服务部署,同时还能提高安全性。
DCIM的日常IT任务
配置和业务部署:随着数据中心设备的增加,高密度已经是数据中心最关心的问题。当添置新设备时,管理人员需要寻找一个合适的空间,配备相应的电源,并且还需要考虑其他变数。因此,数据中心规划变得越来越重要,如果有一套智能系统能根据自定义的变量进行筛选合适的位置并配备相应的服务,将会事半功倍。
环境和电源管理:不断升级的功耗成本和新的环境立法对数据中心的管理环境和功耗要求更为苛刻。高级DCIM解决方案可以有效实现对数据中心核心基础设施的有效监控和预警,如相应环境的变化,从而自动功能调节,如冷却故障,实现可靠环境的运行保障。
故障管理:最为先进DCIM系统可以获得各个设备之间的链接状况,从而摆脱一直作为第三方软件很难获得其它硬件信息的难题。获得连接信息的意义在于自动获取和存储的信息比手工记录更加安全、容易更新,更在于有效的减少了人员造成的失误和信息遗失。
IT资产管理:DCIM系统可用于收集UPS输出数据(用于高级视图),也可能用于提供机柜或IT设备级别更加详细的监控信息。测量IT设备能耗的最常用方法是安装智能PDU(iPDU)。一些厂商的DCIM软件可以从其他厂家设备接收数据,如UPS等专用设备。有些厂商同时提供硬件传感器与软件。某些厂商提供DCIM主机服务--传感器信息通过internet将信息发送至主机系统上,用户则通过浏览器接口进行查看。DCIM软件同样可以安装在本地服务器上。需要注意的是,在某些情况下,这些平台仅仅是个报告工具,无法对任何基础设施或IT系统设备进行控制。
安全性:很多CIO都公开表示过,数据中心运维面临的最大挑战是安全性,可见数据中心的安全至关重要。先进的DCIM能避免未经识别的设备连接到数据中心的网络。例如,一旦有人在软件计划外更改数据中心的连接,或者有任何未经识别的设备连接到数据中心,系统就会立即发出警告,警告内容本身就会包括问题出在在何时何地。
未来,DCIM还需要支持数据中心里更为多样化的拓扑结构,具有适应融合拓扑部署的能力要求,需要提供一个灵活的解决方案来管理各种动态网络,从而最大限度地减少所需的数据中心的总设备数量。
可以肯定,DCIM的未来是明确的:数据中心和网络运营商需要先进的和具有成本效益的DCIM系统,以有效地管理网络基础架构的所有组件。全方位的DCIM作为一个将IT、网络基础设施、人力资源和运营流程综合在一起的全方位解决方案,不仅能简化数据中心的管理,提高数据中心的工作效率,同时还能有效的降低资本支出和运营成本,从而帮助和保证企业快速实现其运营目标。
编辑:Harris