随着新技术新业务的不断发展,现代数据中心发生了很多变化:资源规模及维护压力快速增长,客户需求越来越多种多样,数据中心迅速走向集中化、规模化,大型数据中心成为主流,越来越多的云业务代替传统租赁托管业务……这些变化都要求数据中心踏上整合、云化之路,同时也给安全管控、资源管理、配套供给、绿色节能等方面提出新的挑战。因此,构造安全可控的云数据中心运维体系,成为运维工作的重中之重,而数据中心的安全防护、运维管理和客户服务则是三个重要抓手。
打造三位一体的安全防护铠甲
2012年6月29日,强雷暴天气下发电机失灵,导致亚马逊停运;2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在物理安全、系统安全及数据安全三个层面加强防护,构造三位一体的坚固铠甲。
物理安全,重点在于出入安全和操作安全,需要在门禁安检、多点监控、区域管理、安全记录、授权管理、进出管理等方面梳理并完善物理安全管理制度及措施。同时可以运用先进的安防手段,比如在安检系统上配置X光机和闸机,在门禁系统上配置防尾随系统等安保系统,这些都是保障物理安全的“利器”。
系统安全,主要是通过实现供电零终端、制冷不间断、网络高可靠等措施来保障系统安全稳定地运行。在系统安全领域,越来越多的新兴技术手段正得到运用,例如利用高压发电机组自动并机发电,保证不间断供电,当市电发生断路,切换柜自动切换至油机发电;又比如模组机房采用封闭冷通道,规避局部热点,使用列间空调,实现精确送风,从而提高制冷效率。
数据安全,除了传统意义上的防火墙部署、入侵检测IDS、网站防护、网页防篡改等,云数据的安全防护,成为云数据中心在安全领域面临的一个重要挑战。在云时代,由于数据被打散,资源池内不同虚拟机间的数据入侵、数据泄露等问题引起了人们越来越多的关注,也相应出现了很多防护措施,比如在IDC云平台上部署虚拟化安全软件,在宿主机内部署三层虚拟网元(入侵检测、防火墙、漏洞扫描等),通过其控制虚拟机间的访问,能够初步实现虚拟机间的安全防护。
构建“4+1”集中运维管理流程
伴随着数据中心规模越来越大,业务需求也越来越多样化,维护压力同步增长,所以集中化成为必然。所谓集中化的运维管理,就是通过完善IDC业务质量监控指标,同时建立IDC业务质量管理流程,在机房管理、动环管理、网络管理、云管理、业务管理等方面实现集中监控、集中维护、集中性能、集中资源以及绿色节能管理等功能,即实现具有“四个集中”和“一个绿色”的“4+1”集中运维管理。
集中资源的重要性不言而喻。伴随着互联网业务的蓬勃发展,IDC业务发展越来越好,需要管理的资源就越来越多,如何有效管理众多资源成为IDC运营的关键。在资源集中管控中可以通过三个最重要的技术手段,即全生命周期资源管理、跨数据中心资源共享以及精细化管理云资源平台来实现IDC资源的集中化运维。
为了实现集中监控与集中维护,可以通过建立IDC集中监控平台,将机房、动力、消防、资源、系统、业务、应用数据等信息纳入集中监控之中,将告警输出至集中故障平台来进行统一派单;监控人员对IDC设备实行724小时运维管理,同时建立跨专业的现场运维团队,实施IDC问题三级响应机制,探索智能维护之路。
对性能的集中监控,就是借助云计算技术,从网络、服务器层面,来实时定位交互过慢、网络质量劣化等多维度复杂的性能问题。比如,当数据库、媒体业务应用虚拟机同受一台主机控制时,当数据库用户反馈查询速度慢时,就可以通过KQI/KPI关联分析,定位原因为媒体业务IOPS高,造成数据库应用响应时间长,并通过迁移数据库应用或限制媒体业务IO次数等措施解决问题。未来的云数据中心还将以云性能为重点,面向APP、云资源池等层面,开展性能管理研究。
绿色节能管理,就是从供电、制冷、云计算、IT设备等多个维度,应用多种资源自动化调度策略,根据云平台负荷动态调整供电、制冷量,确保设备可靠运行,获得最优PUE(数据中心总设备能耗)。在业务主机方面,通过积极应用云计算和绿色IT设备,实现主机维度节能管理;在机房层面,通过热仿真、模拟和勘测打造绿色机房,从而建设绿色数据中心,实现节能减排。
IDC的集中化运维管理,最终想要达到的目标是建立IDC运营管理支撑平台,对IDC各项资源进行集中监控、集中维护、集中性能,实行集中化管理运营,将告警、资源等指标与客户进行关联,实时向客户推送告警,开展IDC主动服务。
提供差异化全生命周期客户服务
IDC服务也需要不断地探索和提升,提供差异化全生命周期客户服务。
提升IDC服务,可以按照服务响应、服务交付、服务管理三个维度,构建IDC标准服务流程。可以采用的服务响应渠道包括电话、E-MAIL、门户网站、微信公众号等。在服务交付上,可按照客户等级和对IDC业务保障的重视程度,将IDC业务服务级别进行划分,从售前、售中、售后三个阶段,为客户提供差异化的、具有等级的服务,从而实现IDC增值服务能力和运营能力的提升。例如互联网公司可以将设备通过物流寄送到数据中心,由数据中心代为上架、布放线缆,在网络调通后再由互联网公司远程调测,这样对于客户而言无疑是更方便的解决方案,自然会赢得互联网公司的青睐。
伴随着新技术的不断发展,特别是大数据云计算时代的到来,IDC面临的传统和新兴的叠加挑战会越来越多,运维技术的发展和能力的提升也是必然的发展趋势。以安全、质量、服务为核心,夯实IDC安全管理,提升IDC业务质量,为客户提供标准化的全生命周期服务,探索构建IDC运维管理体系,将是每一个运维人不断探索和追求的目标。
编辑:Harris