一、引言
在数据中心持续发展的进程中,闲置容量问题已越来越突出,特别是企业数据中心,闲置容量的损失甚至超过了40%,这不仅会造成资源和资金的浪费,还会阻碍数据中心运营效率的提升,导致更高的运营成本和不必要的扩建,不利于可持续发展。
二、闲置容量概述
所谓闲置容量,指的是未知可用的数据中心资源,如空间、电力、冷却和数据/电源端口等重要容量参数[1]。
目前,全球数据中心数量超700万个,闲置容量达105GW,每年能耗约594TWh,占全球总能耗的2.4%[2]。全球有超30GW的数据中心容量未被有效利用,这在经济与生态层面都是不可持续的。随着AI技术持续突破,数据中心数量不断增多,能源消耗也日益增大。数据中心闲置容量主要源于两个方面:
1)超额配置
通常情况下,在设计数据中心时,为确保能够安全满足峰值需求,会刻意配置比实际需求更多的资源,造成浪费,如设计配置过多的冷却装置导致IT设备过冷,进而造成资源和资金的浪费;
2)运营过程中空间、电力和制冷容量的不匹配问题
如高功率IT设备的投入造成机柜很快达到电力限额,但机柜还存在可用空间的情形;同时,高功率IT设备的高热特性很可能会导致局部热点的产生,而冷却系统也无法对其进行有效降温;此外,还存在由于封闭措施不合理导致的气流冷却效率低下等问题。目前为止,冷却系统的问题最为棘手,因为冷却气流是看不见的,无法直观显示,难以掌控。
三、数字孪生的作用
数据中心数字孪生是对整个数据中心物理系统建立数字孪生体,包括基础设施、设备和运营特性等,是真实物理设施的虚拟模型[3],能够反映其结构布局、实时运行状态、性能参数等。图1是IT包间数字孪生模型,从模型中可以看到数据机房的机柜布局、装机功率、运行参数等重要信息。
通过数字孪生技术,运营者可以通过建模和仿真量化运营决策的影响,获取资源利用率的相关建议,能够优化容量规划,并大大减少超额配置。同时数字孪生技术也可通过实时监测和预测分析的方法降低运营风险,从而提高数据中心可靠性。
1.通过建模和仿真量化运营决策的影响
数字孪生的主要优势之一是能够对数据中心进行精确建模和仿真[4-5]。运营者可结合实时数据和历史趋势,创建一个能够反映物理设施的虚拟模型。利用这个虚拟模型,可以测试不同的场景,评估资源分配决策的影响,并识别潜在的超额配置区域,还能够针对制冷温度这个特定参数进行决策分析,3D直观展示冷却气流的流动方式、温度等。图2显示的是从二维CAD图纸到三维可视化数字孪生体示意图。
2.优化资源配置
通过模拟不同场景,运营者可以确定资源可用性和需求之间的最佳平衡,确保资源的高效分配,避免过度配置需求。数字孪生Insight功能模块能提供准确的空间、电力、制冷等资源的具体使用信息,如图3-5所示。运营者可据此适当调整基础设施规模,避免闲置容量增长带来的隐患。
3.实时监测和预测分析
数字孪生还提供了对数据中心内资源使用情况的实时监控。通过与现有动环监控、电力电
控、楼宇监控等监控系统进行数据连接,利用集成传感器和数据收集机制,实时持续监测各组件的性能,如空间、功耗、制冷效率以及电力等。然后使用软件内置的预测分析算法对监测数据进行分析,确定潜在的瓶颈或未充分利用的区域,以此帮助运营者减少闲置容量。如图6所示,在软件中可以实时监测、统计整个机房的机柜数量、可用位、空间、功耗、冷量、重量等关键参数,用以评估整个机房的资产信息。
4.降低风险、提高可靠性
数字孪生技术还可以帮助运营者模拟不同的故障场景,分析不同故障场景的持续时长,识别潜在的漏洞,并据此制定针对性预案。如7所示,利用CFD仿真可以预测空调冷却失效后,机房不同时间点的温度值,用以规划风险处理时限。图8显示了冷却失效后的机柜温升曲线,由此可以看出,冷却一旦失效,机柜温升是非常快的,可以根据预测结果制定应急方案。从而确保在进行资源分配时,能够在不进行超额配置的前提下,最大程度降低服务中断风险。此外,数字孪生技术所具备的精准故障预测能力,有助于减少因预估偏差导致的容量闲置,优化资源利用,进而全面提升整体运营效率。
四、结论
总的来说,为了减少过度配置和闲置容量,数字孪生已成为数据中心规划和运营中的重要技术。通过提供精确的资源建模、仿真能力、实时监控和预测分析,数字孪生助力运营者优化资源分配并辅助高效运维决策。随着数据中心行业的不断发展,在规划设计和运营过程中运用数字孪生技术有助于识别潜在的超额配置区域并降低风险,显著减少闲置容量,进而提高数据中心的运营效率、资源利用最大化、节约成本并增强可持续性。
参考文献
[1]吴甘星.数据中心基础设施容量管理探究[J].数据中心建设+,2022(10):1-4.
[2]Cadencecommunity.Reduce Data Center Over-provisioning Staranded Capacity for Sustainability(2023-10-26)[2025-1-19]. https://community.cadence.com/cadence_blogs_8/b/data-center/posts/reduce-data-center-over-provisioning-andstranded-capacity-for-sustainability.
[3]T/DZJN.数据中心数字孪生技术规范:T/DZJN47-2021[S].2021.
[4]郭占杰.数字孪生在数据中心中的理论研究与实践思考[J].自动化与仪表,2024,39(10):162-164.
[5]商晓峰,林小勇.数字孪生技术在数据中心中的应用案例[J].智能建筑电气技术,2024,18(03):64-69.
作者简介
胡玉祥,男,2018年毕业于重庆大学暖通专业,工学硕士,现任北京瑞思博创科技有限公司CFD高级工程师。
编辑:Harris