咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
数据中心DCIM系统的前世、今生与未来
  • 数据中心基础设施管理DCIM概念起源于国外,不同的机构对DCIM也有不同的定义,但同一的思想是DCIM工具可以架起一座沟通关键基础设施和IT设备之前的桥梁,从而帮助运营者管理数据中心。本文从数据中心设计规范入手,针对数据中心DCIM系统的产生背景、技术流派以及发展方向等进行深入分析和解读。

        数据中心基础设施管理是IT和运营的结合,用于管理和优化组织内数据中心基础设施的性能。DCIM软件工具可帮助数据中心运营商监控、测量和管理数据中心相关设备和基础设施组件的利用率和能源消耗。DCIM有助于改善数据中心建筑与其系统之间的关系。可帮助管理员识别并改善数据中心建筑与其IT系统之间的关系。DCIM软件使数据中心运营商能够高效运营并改进基础设施规划和设计。数据中心运营商通过可视化服务器机房的实时温湿度状态、设备状态、用电量和空调工作负载,创建灵活高效的运营。
      
      一、数据中心行业国家规范的发展历程
      
      数据中心行业的国家规范历经三代,分别是93版、08版和17版,详见图1所示。
      
      1)93版规范实施期间,机房内布局没有冷热通道之说,多列机柜类似士兵列队方式。IT设备(服务器)主要为塔式设备,受限于IT设备的气流组织形式,机柜下部进风、机柜顶部出风,机柜配置有置顶排风扇,机柜的前后门采用密闭形式。机电运行信息主要靠人工手持模拟检测设备在机房内部巡检,并记录在纸质表格内;记录表一旦丢失,无法回复之前的运行记录。
      
      2)08版规范实施期间,机架式IT设备(服务器)被广泛采用,其为前部进风、后部出风,从而要求机柜的前后门须未具有一定开孔率的网孔门,机房内布局随之划分了冷热通道。加上机房主要机电设备运维的需求,逐渐诞生了数据中心DCIM系统的前身--动力和环境监控系统。根据机房规模的发展,动力和环境监控系统的控制主机从“工控机→串口服务器→嵌入式服务器”发展更迭,详见图2所示。
      
      3)17版规范对DCIM的定义:数据中心基础设施管理系统通过持续收集数据中心的资产、资源信息,以及各种设备的运行状态,分析、整合和提炼有用数据,帮助数据中心运行维护人员管理数据中心,并优化数据中心的性能。
      
      二、数据中心DCIM(基础设施管理)的起源
      
      数据中心基础设施管理DCIM(全称DataCenter Infrastructure Management)概念起源于国外,不同的机构对DCIM也有不同的定义,但同一的思想是DCIM工具可以架起一座沟通关键基础设施和IT设备之前的桥梁,从而帮助运营者管理数据中心。
      
      1)Gartner对DCIM的定义
      
      Datacenter infrastructure management(DCIM)toolsmonitor,measure,manage and/or control data center  utilization and energy consumption of all IT-related equipment(such as servers, 
    Storage and network switches)  and facility infrastructure components(suchaspower distribut ionunits[PDUs]  And computer room air conditioners[CRACs]).  

         数据中心基础设施管理(DCIM)工具监控、管理和控制数据中心所有IT相关设备(例如服务器、存储和交换机)和基础设施相关设备(例如PDU和精密空调)的使用情况以及能耗水平。
      
      ☆Gartner(高德纳,又译顾能公司,NYSE:ITandITB)全球最具权威的IT研究与顾问咨询公司,成立于1979年,总部设在美国康涅狄克州斯坦福。其研究范围覆盖全部IT产业,就IT的研究、发展、评估、应用、市场等领域,为客户提供客观、公正的论证报告及市场调研报告,协助客户进行市场分析、技术选择、项目论证、投资决策。为决策者在投资风险和管理、营销策略、发展方向等重大问题上提供重要咨询建议,帮助决策者作出正确抉择。
      
      2)451Group对DCIM的定义
      
      A datacenter infrastructure management system collects and manages information about a datacenter’s assets, resource use and operational status. This information is then distributed, integrated, analyzed and applied in way tha t help managers meet business and service-oriented goals and optimize the datacenter’s performance .  

       数据中心基础设施系统通过持续收集和管理数据中心的资产、资源以及各种设备的运行状态,然后通过分析、整合提炼成有用的数据,从而帮助数据中心管理者管理数据中心并优化性能。
      
      ☆The451Group总部位于纽约,由The451Group所有并运营的451Research是一家领先的技术行业联合研究与数据公司,专注于企业IT创新业务。The451Group拥有并经营着国际正常运行时间协会,为全球数据中心和新兴的数字基础设施行业提供先进理念、认证、教育和专业服务的独立组织。
      
      3)《数据中心技术设施管理技术白皮书(CDCC2015.10版)》对DCIM的定义
      
      DCIM数据中心基础设施管理是通过一整套包含硬件设施、传感器和特定软件组成的管理平台和工具,实现数据中心所有关联系统协调统一管理,包括IT基础设施(服务器、存储、网络、虚拟机)和场地基础设施(配电、制冷、布线、机柜),对数据中心的容量规划、集中监控、智能管理、事故处置、模型预测、成本控制等目标进行管理,是信息技术和设施管理的综合集成。
      
      三、数据中心DCIM(基础设施管理)系统介绍
      
      1)DCIM分层架构
      
      数据中心DCIM系统的分层架构,可分为四个层级,详见图3所示。
      
      2)DCIM实施监控管理对象
      
      数据中心DCIM系统的实施监控管理对象,可分为三大类,详见图4所示。
      
      3)DCIM逻辑框架
      
      数据中心DCIM系统的逻辑框架为,详见图5所示。
      
      (1)基于“数据中心监控系统”的物理基础设施数据采集及分析;
      
      (2)基于“数据中心基础设施管理”的综合功能模块,资源、资产、容量、连接、性能和可视化管理工具;
      
      (3)基于“数据中心运维管理”的运维业务管理的流程和规则。
      
      (4)DCIM物理框架
      
      数据中心DCIM系统的物理框架,可分为5层,详见图6所示。
      
      (1)1层:基础设施现场,基础设施的数据采集、测量、感知。
      
      (2)2层:网络传输控制,信息的连接、传输、处理、暂存、控制等。
      
      (3)3层:管理中心设备,主机服务器、交换机、存储、中控台、显示(桌面、墙面、移动)等。
      
      (4)4层:综合管理软件,管理内容与对象的流程化、表单化、可视化的操作处理,信息库、数据库、规则库、预案库、知识库等。
      
      (5)5层:人力资源文档,管理人员、运维人员、工程师;运维管理制度、标准化流程管理文档等。
      
      5)DCIM系统框架
      
      数据中心DCIM系统的系统框架为,详见图7所示。
      
      一个有效的DCIM平台将提供一个相互依存的系统,资产的实时监控和管理的统一平台,
      
      提供收集实时数据、资产可视化、建立虚拟模型、实行变更控制、进行全程管理、呈现运营报告、动态预测分析等一系列的保障业务和运营效益的措施。功能包括:
      
      (1)全面地、实时地采集监测真实运行状态数据
      
      (2)对IT设备与基础设施的环境监控与报告
      
      (3)识别IT设备和基础设施之间的相互依存关系
      
      (4)数据中心资源与资产的配置与变更管理
      
      (5)可视化的物理和虚拟设备设施管理
      
      (6)基于模型的自动化的事件应对与处置
      
      (7)现时的与历史的数据资料的可管理性
      
      (8)能源的实时测量、能力模型与优化配置
      
      (9)应对动态的IT设备与虚拟设备的变化
      
      (10)适宜的资产、成本、效率的预测分析与决策
      
      (11)统一的操作平台、工具和管理界面
      
      6)DCIM系统目前的流派
      
      根据目前市场行情分析,把数据中心DCIM系统厂家分为三类:传统动环厂家、机电设备厂家、第三方软件公司。
      
      7)DCIM功能
      
      数据中心DCIM系统实现的功能,根据最终业主的需求,功能大致见图8所示。
      
      功能模块具体详解见表1所示。
      
      8)DCIM管理成熟度模型
      
      CMMI的全称为Capability Maturity ModelIntegration,即能力成熟度模型集成。CMMI认证一共有5个级别,CMMI1级,完成级;CMMI2级,管理级;CMMI3级,定义级;CMMI4级,量化管理级;CMMI5级,优化级。
      
      对DCIM管理成熟度模型而言,也分为5个级别:
      
      (1)1级:起始级
      
      基本的设备监控手册:简单的故障报警,没有集成;低效率的运维管理。主要表现在:
      
      •没有标准的变更过程
      
      •没有可预测性
      
      •缺少文档化
      
      •不设访问权限
      
      •停电等状况经常出现
      
      (2)2级:发展级
      
      动环监控软件:基于需求的简单调节控制(如制冷);低效率的运维管理。主要表现在:
      
      •依赖运维人员的个人行为
      
      •变更过程差错率高
      
      •零散的文档化
      
      •配有事故处理措施
      
      •有限的管理监督
      
      (3)3级:稳健级
      
      设备的物理实体信息:可跟踪位置与运行状况,利用动环信息减少风险和浪费。中等效率的运维管理。主要表现在:
      
      •有标准的变更过程
      
      •完整的文档
      
      •分级的访问权限
      
      •能源监视和测量
      
      •可靠的服务
      
      (4)4级:优秀级
      
      多系统及物理与虚拟集成:开始采用预测模型;多视角面向服务的管理,近似实时数据优化。中等效率的运维管理。主要表现在:
      
      •采取服务驱动的方法
      
      •变更过程的可回溯性
      
      •集成的变更配置
      
      •容量管理的智能化
      
      •基础设施的监控策略
      
      (5)5级:卓越级
      
      全生命周期,依据目标、策略和服务需求,采用软件集成管理,自动调整,获得最佳的资源利用率。高效率的运维管理。主要表现在:
      
      •灵活的基础设施管理
      
      •动态的基础设施
      
      •预测模型
      
      •端到端的分析
      
      •消除滞留的容量
      
      四、数据中心DCIM(基础设施管理)发展方向
      
      1)DCIM为IT企业提供哪些重要价值?
      
      (1)提供对数据中心电力、冷却和物理空间使用的持续重新优化:
      
      可以帮助节省资金用于扩大现有数据中心或构建新的数据中心。
      
      (2)整合IT与数据中心设施管理:
      
      有助于拉近IT管理人员和设施管理人员的距离,为他们提供信息和分析,让这两个相互关联的职位重新走到一起。
      
      (3)实现更高的能源效率:
      
      单从能源成本节约来看,就足以让企业考虑采购DCIM工具,更何况这些工具还提供其他好处,而这些好处可能更难以量化,例如改进工作流程。
      
      •建模和/或模拟数据中心
      
      让IT管理人员和设施管理人员可以分析“假设”场景。
      
      •通过显示资源/资产如何关联,加强资源和资产管理
      
      2)选择、部署DCIM解决方案经常存在哪些误区?
      
      (1)一是选择了不恰当的解决方案:
      
      目前市场上DCIM供应商和解决方案,而且数量还在不断增长。这些DCIM方案看起来又相同又不同,往往令用户感到困惑。不管怎样,选择具体DCIM方案时,用户应该考察该DCIM方案是否具备某些基本特性,例如可扩展性、模块化、标准化、预制化、开放式通信架构等等。
      
      (2)二是采用了不充分或不匹配的流程:
      
      最终用户应当从长期着眼来规划、创建和支持DCIM解决方案实施流程和日常运行流程。
      
      (3)三是缺乏必要的重视度、责任归属不明晰:
      
      导致用户选择的工具套件无法正常提供原有的设计功能。
      
      数据中心DCIM系统的流程和解决方案受限于用户数据中心的设施部门、IT部门和管理团队之间的沟通和协作;建议用户的数据中心的设施部门、IT部门和管理团队均应参与评估阶段的工作,必须对企业组织的需求、目标和实施计划达成一致意见,并指定每个流程的负责人。
      
      同时,根据数据中心项目工程总承包(EPC)建设过程,数据中心DCIM系统参与到基础设施全生命周期管理,从战略规划→架构设计→深化设计→建设→验收→验证→运营等七个阶段解析了数据中心DCIM系统团队的参与内容与重要性,详见图9所示。
      
      3)数据中心DCIM技术的发展趋势:
      
      人工智能(AI)是自1956年以来最受关注的概念。2015年,GPU的广泛使用使并行处理更快、更强大、更便宜。而愈加廉价的存储可以大规模地存储大数据(从纯文本到图像、映射等)。产生了对数据分析的需求,被称为数据科学,导致机器学习发展为实现人工智能的方法。
      
      数据中心DCIM系统利用AI技术,建立一个虚拟数据中心,通过AI模型的模拟验证,去优化控制实体数据中心的各类运行参数,达到最优模式。
      
      数据中心DCIM系统采用数字孪生技术,通过深度学习很好的实现了机器学习。把数据中心运维过程中复杂的问题交给AI来解决,即避免了人为因数的错误,又能使数据中心更好、更优、更节能的运行,详见图10、图11所示。

           
      
      AI技术在数据中心全过程中的运用,结合不同客户需求,数据中心DCIM系统必将呈现百花齐放的繁荣场面。
      
      五、结论
      
      数据中心基础设施管理(DCIM)系统为数据中心的决策者、管理者和使用者提供高效、优质的服务;通过平台软件将数据中心及园区各个子系统做到统一管理,综合规划;对各个子系统进行有效的监视、控制和自动化管理,实现集中管理,分散控制;协调各子系统之间的相互联动关系,具备全局事件处理能力,完成相关的系统联动控制;采集、处理、存储各种相关数据,实现资源共享;提供信息检索分析、显示图表,生成报表、打印报表等管理功能,为管理人员提供有力的科学决策支持。实现统一监控、管理、运营分析,实现数据中心运维自动化,提升运维工作效率,节省运维成本,降低能耗,保障数据中心的可用性。
      
      参考文献
      
      [1]《数据中心设计规范》GB50174-2017
      
      [2]《数据中心技术设施管理技术白皮书》CDCC2015.10
      
      [3]《数据中心技术设施管理技术白皮书》CDCC2022.11
      
      作者简介
      
      路宗雷,男,1973年12月,本科,学士学位,中国电子系统工程第四建设有限公司高级主任工程师、数据中心行业建厂专家、高级工程师;中国电子节能技术协会工程总承包分会基础设施技术专家组专家、中国职业技术教育学会智能建造专业委员会委员。
      
      编辑:Harris
      
      

    数据中心基础设施管理DCIM概念起源于国外,不同的机构对DCIM也有不同的定义,但同一的思想是DCIM工具可以架起一座沟通关键基础设施和IT设备之前的桥梁,从而帮助运营者管理数据中心。本文从数据中心设计规范入手,针对数据中心DCIM系统的产生背景、技术流派以及发展方向等进行深入分析和解读。