企业需要为数据中心成功的运营制定一个有效且适应性强的计划,需要采取具体的原则来指导IT人员全面考虑其运营目标以及如何实现这些目标。但很多企业的数据中心运营的规划与努力绝大多数是放在结构设计和开发方面,而在初始目标完成后,往往却忘记其最终目标是什么。
如今,人们越来越关注数据中心运行的重要性。为了提高数据中心运营规划水平,人们需要记住以下五个基本原则:
原则一:经验是最好的老师
就像生活中许多重要的事情一样,工作人员需要回想一下自己在职业生涯中犯了哪些运营错误,将如何避免,并让这些经验教训为今后的运营工作奠定基础。在某些情况下,这可能意味着企业的工作人员没有有效地运行设备,或者供应商的服务没有到企业的要求。无论如何,以往支持关键任务环境的经验使人们认识到,数据中心的卓越运营是一个全面和持续的过程,它反映在以下几方面:
高效的设施设计。
有效的移交后和正在进行的培训。
采用合适的工具。
原则二:从运营人员的角度出发进行设计
有效的运营计划始于操作人员的头脑开始,或者更简单地说,"需要的成功是什么?"虽然这个问题似乎可以给出一个简单的答案,但是通常会发现这通常是一些配套查询答案的汇编。
显然,数据中心设施本身需要进行优化,以加强有效的维护和故障排除。换句话说,TierIII级数据中心的并发可维护性必不可少,这是至关重要的。其程序本身应该简单明了,这是出于运营工作人员的角度出发,而不是工程师。日本质量管理专家推出的一个术语PokaYoke(防误防错)更好地描述了制定流程和程序的最终目标。这是一个在工作过程中采用自动作用、报警、提醒等手段防止运营人员疏忽或误操作而出现失误的方法,它意味着可以最大程度地减少人为错误。而对于这样的情况,当超过70%的中断仍然可以追溯到是运营人员失误的时候,那么在整个简化过程中还有很长的路要走。
行动的持续性应该被接受和适应。如果没有其他原因,平均数据中心每3-5年进行一次硬件更新,那么数据中心就是一个动态的环境,"一直这样做"并不能完全达到持续改进的目标。反馈环路证明了消除不必要步骤的有效机制,并确定了执行操作的更有效的方法。
原则三:灵活性和控制
灵活性和控制虽然看起来很宽泛,但这个概念真的很简单。特别是供应商的人员活动安排必须与企业工作节奏保持一致。运营要求必须围绕企业的具体需求来执行。同样的原则也适用于运营人员和安全的人员配备水平。
原则四:培训和认证
培养人才是一个持续改进的目标。不断提高专业知识水平不仅可以激励工作人员,还提高了工作人员的整体技能水平,确保运营的可靠性。
培养一个更加自信、更有能力、更有效的运营维护人员的方法需要一个基于角色的培训计划,其中包括:
正式的课程。
客观的衡量理解。
不断更新和完善的持续流程。
这一方案的客观目标应该是建立在不断提高的认证水平的"主题专家"基础上:
过程上的困难
重要性
性能
原则五:专注于消除错误
在以往,技术人员一手拿着手电筒,另一手拿着技术手册试图诊断和修复设备问题,这样的维护方法不利于快速有效的解决问题,但这代表了许多现有的数据中心标准的运营和维护模式。显然,在这种情况下,带来人为错误的机会是无数的。
有许多方法可以实现这个目标。一种方法是使用将所有的程序转换成数字清单这样的技术解决方案。通过平板电脑和手机进行访问,其中包括有关危险步骤的警报、访问视频、图像和文档以供现场参考,技术人员在执行操作每个步骤之后,并且在进行到下一步之前必须确认完成,这种操作大大减少了人为错误的可能性。
结语
对数据中心的运营进行规划是数据中心流程的一个关键且经常被忽视的因素。有效的业务流程和程序并不是严格遵守过去的运营模式的结果。要为数据中心的成功运营制定一个有效且适应性强的计划,需要采取具体的原则进行指导,需要IT部门全面考虑其运营目标,以及需要实现这些目标进行努力。
编辑:Harris