前两天看到网上一条新闻:有美国的公司宣称要推出新的标准取代UPTIME的Tier等级体系,并宣称自家的数据中心可以达到Tier5,以下就聊聊关于可靠性的一些看法。
毋庸讳言,数据中心这些年发展得非常快,新技术层出不穷,各种方案也千奇百怪,早年的一些标准和规范已经不太适合现在的发展现状。而目前行业内广为人知并普遍认可的评判标准和概念,主要有代表节能水平的PUE,以及代表可靠性水平的Tier等级。
与这两个概念相比,其他的一些标准和规范,要么是过于专业,要么是接受程度不高,所以难以作为统一的数据中心衡量标准。
而相比PUE,Tier的商业化运作更加成功,由UPTIME颁发的等级证书也具备更高的商业价值。
什么是Tier认证,它有什么用?
Tier是目前国际广泛认可的一种数据中心可靠等级标准。它主要针对的是数据中心物理基础设施(即风火水电等系统)的可用性/可靠性,分为以下四级:
TierI:满足基本需求;
TierII:主要设备冗余;
TierIII:在线维护;
TierIV:容错;
数据中心的Tier等级由第三方机构UptimeInstitute进行评估与认证,取得相关认证的数据中心在业务推广、出租收费等方面要明显优于普通数据中心。
但要说明的是,目前的Tier认证仅针对单个的数据中心项目。能否获取认证,与采用哪种产品、采用什么品牌的产品无关,每个数据中心都要花费大量时间和金钱,由UPTIME进行评估并授予不同等级的认证。
由此可见,并不是随便哪家机构推出一种新的标准就可以取代Tier的。这套认证系统本身的商业化运作已经非常成熟,其证书本身也具备一定的权威性,并被广泛接受。
所以,决定了一套标准是否得到认可的关键因素,其实并非技术的先进性,而是商业系统的成熟度。
关于可靠性,很多问题一直都存在
这并非说这套评判标准本身就没有问题,实际上对于很多互联网企业的自营数据中心来说,按这套标准来看,其Tier等级并不高。但没有人会认为这些数据中心不可靠,为什么呢?
首先,问题的关键在于:基础设施只是数据中心的一部分,而最终业务运行的可靠程度,并非仅仅取决于基础设施这一层面。
硬件、软件、操作系统、各种应用都会影响到具体业务的运行,各子系统紧密结合、协调工作从而保障了数据中心的业务可靠运行。
从业务连续性的角度来看,单一系统的可靠性并非决定性因素。最明显的例子,就是IT设备的虚拟化、资源池化降低了对IT硬件可靠性的依赖。这也是云计算技术能够流行的关键原因。
所以,从基础设施角度看,也许一些自用型数据中心的Tier等级并不高,但其从软件系统、业务应用,甚至数据中心定位等层面弥补了基础设施的不足(其实主要是为了节省成本),所以整体来看依然具备很高的可靠性。
其次,数据中心是复杂的系统工程,但其内部各子系统和产品的设计缺乏协调,往往是孤立的。
举个简单的例子,服务器的设计者为了保障可靠性,往往会采用相互独立的双路电源供电,以便保证在一路供电故障的时候,另外一路供电也可以提供可靠的电源给服务器工作;但对供电系统的设计者来说,必须保证供电100%的不间断,而不会去考虑后端负载的情况,所以不间断电源和备电系统是必须的。很多时候,单一产品的设计者都只会优先考虑自身产品的可靠性设计,而对整体系统缺乏端到端的理解。
当然,以上两个例子,不管是虚拟化也好,产品过度的可靠性设计也好,对数据中心整体可靠性提升是有益的,只是增加了投入成本。一些情况下,缺乏对整体系统的理解,可能会带来负面的影响。比如某些高功率的通信设备会采用侧面通风的设计,而当它们应用在数据中心里面时,就与数据中心主流的前后通风散热设计产生了矛盾。
但实际上,对于以出租为主的IDC来说,业主很难预测最终用户的需求,所以大家也只能尽量做到基础设施的可靠性。
其实,据笔者了解,UPTIME自身也做了一些改变来应对数据中心的发展。比如最近,他们就新推出了一种新的认证——Tier-Ready.
什么是Tier-Ready认证?
Tier-Ready是UPTIME针对高速发展的预制模块化市场推出的一项数据中心可靠性等级认证。它是一种特定的设计认证,目的在于实现用Tier等级评估模块化数据中心,从而使最终用户可以享受Tier标准的高可靠性保护。当一个机身打印着TIER-Ready标示的模块化数据中心产品部署到具体的使用地点之后,只要再通过建造认证,即可快速达到全球公认的Tier等级规定的可靠性能。
UPTIME为什么推出该认证计划?
近年来,随着数据中心的快速发展,传统数据中心建设周期长、初期投资高等问题日益突出。为解决这些问题,预制化、模块化数据中心应运而生。
据了解,目前各主流厂家均推出了模块化数据中心方案,这意味着数据中心正在从传统的工程项目变成一种标准化、可复制的产品。
据ICTResearch统计,2016年国内模块化数据中心市场规模已达到40亿元,并连续多年保持高速增长。但与此同时,模块化数据中心市场也面临着标准缺失、各厂家产品质量参差不齐等问题,尤其是在可靠性等级方面并无统一的标准。
正是在这一市场背景下,UPTIME针对模块化数据中心推出了Tier-Ready认证计划,旨在建立统一的可靠性标准,帮助用户更好的识别和选择高质量的模块化数据中心产品。
对数据中心业主来说,采用符合Tier-Ready认证的模块化数据产品(微模块),意味着该数据中心的设计已经初步符合了相关的Tier认证。只要花费少量费用对外围系统和部件进行认证,就可以快速获取正式的数据中心Tier认证,节省了大量的时间和成本。
同时,采用符合Tier-Ready认证的产品,也意味着数据中心本身具备更高的可靠性等级,这无疑可以增强用户的信心,帮助数据中心的运营者们获取更多市场。
而对生产厂家来说,一款微模块取得了这个认证,无疑可以提升溢价空间,获取更多利润。
技术的归技术,商业的归商业
正是因为以上的原因,专家认为,在可靠性方面,短期内还很难有标准能取代Tier等级的地位。坦白的讲,与其说是新技术新规范主导了这些年数据中心产业的发展,到不如说是市场和用户选择的结果。
这个产业的未来发展方向,其实更多时候还是要看产业链上下游,各相关利益方多方博弈的结果。
编辑:Harris