咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
采用DCIM优化数据中心运营
  • 数据中心是一个复杂的设施,它不仅包括计算机系统和其它与之配套的设备(例如电源和冷却系统),还包含冗余的环境控制设备、监控设备以及各种安全设备。而数据中心资产的集中监控和管理对于保证数据中心正常运行来说至关重要。IT设备的测量和控制是数据中心优化的关键,数据中心基础设施管理(DCIM)软件因此将发挥重要的作用。
  • 数据中心是一个复杂的设施,它不仅包括计算机系统和其它与之配套的设备(例如电源和冷却系统),还包含冗余的环境控制设备、监控设备以及各种安全设备。而数据中心资产的集中监控和管理对于保证数据中心正常运行来说至关重要。IT设备的测量和控制是数据中心优化的关键,数据中心基础设施管理(DCIM)软件因此将发挥重要的作用。
      
      尽管大多数数据中心管理人员认为DCIM工具有助于优化数据中心运营,但在购买DCIM软件时其预算往往不高。如今,经过工作人员的努力,无需增加DCIM软件的支出,就可以更好地管理和优化数据中心。以下探讨如何采用有限的预算来优化数据中心运营。
      
      收集资产智能
      
      实施任何DCIM计划的第一步是通过进行彻底的清查过程来了解数据中心资产。虽然这一步骤是耗时和乏味的,但是收集资产数据的好处将立竿见影,收到成效。其关键是收集正确的数据,并以用户友好的方式记录。最好的做法是创建电子表格,以确保正在收集正确的资产数据,并按照DCIM软件的方式对其进行分类。
      
      首先创建一个电子表格,其中包含五个标签:位置,机柜,独立设备,机架安装设备,以及刀片设备。
      
      •在“位置”标签中,应至少包含七个具有以下标题的列:国家,市,县,城市,建筑物,楼层和房间。虽然组织可能只关注一个数据中心,但其位置信息确保如果在未来添加任何数据中心,每个将唯一标识。
      
      •在“机柜”标签中,创建包括房间名称,机柜名称,资产标签,品牌,型号,生成,网格位置的列标题。房间名称应与“位置”标签中列出的其中一个名称匹配。如果组织的数据中心未在机柜上使用资产标签,或者没有架空地板或网格系统,请在执行库存时将这些字段留空。
      
      •独立设备标签中,还应包括房间名称以及名称(设备名称),序列号,资产标签,资产类型(如服务器,存储或网络),品牌,型号,机位,网格位置。
      
      •机架安装设备标签将用于标识安装在服务器机柜中的所有设备。所要包括的列标题包括:名称,序列号,资产标签,资产类型(如服务器,存储,机箱,网络或电源),品牌,型号,代,网格位置,房间名称,设备垂直安装,如电源板,记录U(单元高度)位置为0。
      
      •机箱安装设备标签将标识机箱内的所有刀片服务器。除了少数例外,列标题将与机架安装设备相同。应包括名为机箱名称的列。此外,代替识别U(机架单元高度),刀片服务器的位置应该由机箱内的槽位置来标识。
      
      如上所述,没有DCIM软件的收集设备数据是令人沮丧的,但这些数据可以用来产生一些非常强大的信息和报告。例如,配备完整和准确的制造,模型和生成数据,组织可以识别应该预定用于技术更新的旧设备。以下是可以利用此数据的一些其他方式:
      
      每个服务器机柜的功耗可以根据设备制造商和型号来估算。大多数IT设备制造商根据列出的“技术规格”估计的平均功耗。如果仅列出最大功率,则可以通过将最大值乘以66%或0.66来估计相当精确的平均功率消耗。一旦所有设备的功率在每个机柜中相加,就会导致功率密度的不平衡。这是识别过度配置的电源电路和/或识别可能的冷却问题(例如热点)的很好的信息。
      
      虽然这些经常被忽视,设备重量是数据中心容量规划的关键部分。类似于功耗,设备重量可以在技术规格中找到。将设备重量与服务器机柜重量相加,就可以确保总重量保持在地板负载阈值内。
      
      如果在收集库存时包括配线架,则可以生成显示开放端口与已使用端口的报告。购买和安装之间的交付时间对于新的接线板和中继电缆来说可能很长。具有该端口信息提供必要的警告,使得可以提前很好地添加附加端口,并且新设备可以毫无延迟地架设和进行电缆连接。
      
      设备数据还可用于生成服务器机柜和机架的前视图,代替DCIM软件可视化。这些视图是一个伟大的方式来查看机柜的利用率。在电子表格中,单元格可以水平拉伸并垂直减小,以表示每个服务器机柜或机架U空间。单元格可以用颜色和文本填充,以表示占据U空间的设备。此外,设备的图像可以被添加到单元格以获得更逼真的表示。
      
      基准的数据中心效率
      
      电源使用是了解数据中心的窗口。了解使用模式以及识别波动可以告诉组织很多操作的效率。通过基准和监控能力,组织可以确定改进的领域,以及预测和防止问题发生。
      
      第一步是基准测试。如果监控连接到提供给数据中心的所有电源,包括照明和冷却所需的电源,则可以创建显示数据中心效率的报告。记录提供给数据中心照明,冷却,IT设备等专用数据中心总负载的电量,然后记录IT设备专用的电源。可以采用几种能效指标来衡量,例如PUE(能源使用效率)或更新的机械负荷(MLC)和电损耗分量(ELC)。在计算管理人员如何采取措施改进数据中心时,与这些方法之一一致是最重要的。
      
      如果电力监测措施没有或零星的,可能有另一种方法来显示成本节约。电力公司的帐单通常以发送到建筑物中每千瓦使用量来计量。理想情况下,数据中心至少有两个专用的电力来源,并与办公空间电源分离。由于诸如户外天气的各种因素,电力使用自然会有些波动,但是数据中心中的功率波动也可能是由于IT负载的变化。随着诸如大额取消或效率改进的变化得到实施,其效果可能在下个月的电费帐单上显示。然后可以通过将功率的下降乘以效用率来估计每年节省的电力成本。
      
      有关电力监测信息如何改进操作的示例,请使用该信息来计划节省成本。假设组织正在考虑用新的服务器换掉旧的服务器,以减少电力成本。在实际承诺大规模服务器更新之前,证明其收益的方法是测量和记录一个较旧的服务器上的功耗。然后,将此旧服务器替换为新服务器。再将旧服务器的功耗与新服务器功耗的比较,然后可以将功率差乘以每kWh使用率以获得每个服务器的精确到每日,每月或每年节省的电量。然后,通过将该数乘以考虑更换的服务器的数量,可以准确地预测项目的节省总成本。
      
      利用现有监控
      
      除了功耗监控之外,数据中心通常具有等待投入使用的监控点的混合。UPS,CRAC单元,PDU,以及电源板通常具有提供传感器数据,报警和实时监测数据的单元控制功能。DCIM软件通常收集此数据,但也可以通过浏览设备显示屏上显示的多个数据页来访问。通常,此数据也可通过网络和互联网通过设备IP地址进行访问。例如,如果该数据可用于PDU,则将知道馈送服务器机柜和独立设备的电路上的精确功率负载。精确的功率负载也将被称为插入到具有计量或开关插座的“智能”电源板的IT设备。
      
      利用一些计算机编程技能,可以编写相对直接的程序来收集该监测点数据,并以友好的格式显示它。此监视数据可以频繁刷新,以提供几个设备的最新的读数。可以生成显示历史趋势的报告和图表以及对设备增加或移除的能力的影响。
      
      这些监控点可用于以多种方式改进操作,例如查找热点。智能配电板通常包括环境监控端口。外部温度传感器可以添加和放置在冷通道。通过将传感器放置在多个机架中,可以提供全面和精确的温度读数,这可以使数据中心管理人员能够通过将服务器从过热的机柜重新定位到未充分利用的机柜来重新平衡热负载。如果他们的读数显示机柜过冷却,这些电源板温度传感器也可以节省大量的成本,例如机柜环境温度实际上过冷,则提高数据中心温度,这可以等同于通过减少冷却房间所需的能量来节省巨大的成本。
      
      结论
      
      购买DCIM软件可能不在数据中心运营的预算范围内。然而,可以实施这些重要的步骤来优化数据中心操作,而不需要资本支出。第一步是通过电子表格获得对资产的清晰理解,通过现有监测和/或设备功率估算来衡量电力,以便以效率为基准。利用这些数据,组织可以采取策略控制和优化操作。
      
      关于作者
      
      Tim Kittila是Parallel技术公司数据中心战略总监。Kittila主要负责数据中心咨询和服务。在Parallel技术公司的早期职业生涯中,Kittila担任数据中心基础设施战略总监,负责数据中心设计/构建解决方案,实施机械和电气数据中心实践,包括工程评估,设计构建,建筑项目管理和环境监测。Kittila在弗吉尼亚理工学院获得机械工程学士学位,并在特拉华大学Lerner商学院获得商业硕士学位。
      
      编译:Harris
      
      

  •