咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
浅谈数据中心一体化电源模块创新
  • 随着智算中心、超大型/大型数据中心基地化建设模式兴起,电力容量需求节节攀升,业务中断带来损失无法估算。据2023年权威机构Uptime Institute调研表明,供电故障(占比52%)是数据中心机房宕机最大原因。

      随着智算中心、超大型/大型数据中心基地化建设模式兴起,电力容量需求节节攀升,业务中断带来损失无法估算。据2023年权威机构Uptime Institute调研表明,供电故障(占比52%)是数据中心机房宕机最大原因。详见图1所示。
      
      1.传统供配电系统设计复杂,采购周期长,交叉作业调测,运维要求高
      
      数据中心低压供配电系统主要包含变压器、补偿柜、输入/输出配电、UPS或HVDC、服务器机柜配电、空调配电、照明及消防等辅助配电。传统建设模式下,散装设备分别到货&现场组装,多工种交叉交付与调测。比如:
      
      1)设计人员澄清确认各设备技术参数,采购人员催促提拉各厂家设备货期;
      
      2)设备间的连接需要在现场制作电缆和母线槽,消耗人力和工时;
      
      3)弱电智能化综合布线需要将各设备分别接入动环监控系统,现场部署及调测需要大量时间。
      
      投产后,传统供配电系统出现故障时无法实时定位故障点位置及影响范围,人工逐点排查找到故障点,经过专家分析再对症维修,无法及时快速故障恢复,可能造成关键业务的长时间中断。
      
      2.AI时代,数据中心供配电系统向融合高密发展
      
      华为《智能世界2030》报告预测,2030年,人类将迎来YB级(1024比特数)数据时代。随着IT机柜功率密度及用电容量的提升,为保证数据中心的空间利用效率(SUE),新型交流供配电系统将传统分隔的变压器、低压配电、不间断电源(UPS)和智能监控管理按照一体化解决方案设计,以模块化、预制化和智能化为设计方向,走向高密化、融合化。通过提升功率模块密度或缩小设备尺寸、整合设备数量、预制铜排取代电源线缆连接、部署(温度、烟雾等)智能传感器,大大缩短整个供电链路的长度。详见图2所示。
      
      以华为电力模块为例,采用自研高密UPS、隔离开关+熔断器、集中化监控的综合解决方案,通过产品预制化、部件模块化、工厂预调试,实现快速部署,极大节省了现场安装时间和空间。1套2.5MVA的低压配电系统通过超融合设计,将传统方案总长20米(22个柜体)缩减为9.6米(11个柜体)的一体化电源模块。电力模块链路效率高达95.6%(UPS主路模式)/97.8%(UPS智能在线模式),整体占地面积下降40%,现场交付工期从传统2个月缩减为2周。
      
      3.一体化电源模块加持集中化监控,让数据中心供配电系统稳定运行
      
      供配电系统走向融合高密的同时,采用集中式监控系统对各设备进行链路级实时监控管理,对故障点快速定位&维护,主动式运维管理使故障防患于未然。
      
      集中化监控系统实现对各单体设备智能管理,预测性维护功能保障电气设备运行安全及可靠性,组网方案如图3所示,支持对接外部动环系统或直接上云。智能监控系统的ECC控制器本地部署,最低5分钟/次周期采集变压器、UPS及配电柜等设备的运行状态&数据,PAD平板直观显示各设备的电流、电压、频率、电能、谐波、负载率、开关状态、运行模式、各节点温度等。ECC对接外部网管平台,运维人员在网络运营中心(NOC)间远程查看3D视图、设备运行参数、电气链路图及故障异常影响分析、UPS电容/风扇寿命检测、各节点温度预测、开关在线整定及健康度预测等智能特性。
      
      1)电气链路图及影响分析(见图4所示)
      
      链路可视化呈现设备运行状态,并基于活动告警、故障告警进行综合分析。设备故障时,电气单线图显示运行状态结果及原因分析、故障发生点到受影响的下游支路,以及用电负载的完整展示。当某下游支路在不接负载时,显示该支路不在影响范围内。
      
      2)UPS电容/风扇寿命检测(见图5所示)
      
      利用独有算法及超强计算能力,UPS的母线电容、功率模块/旁路模块的风扇支持寿命预测。当电容及风扇剩余寿命低于设置值时,会产生告警提示,提前告知及时保养或替换。
      
      3)温度预测(见图6所示)
      
      电气连接触点随着设备运行时间增加,在施工质量、潮湿和灰尘腐蚀、震动应力共同影响下,可能产生接触面腐蚀或松动,导致触点温度异常。部署150+温度传感器,定时采集触点电流、环境温度、关键及相邻节点温度信息,结合ECC控制器内置AI算法,通过建立温升模型推理当前负载下的合理温度。
      
      4)开关在线整定和健康度预测(见图7、图8所示)
      
      断路器配置通信模块,接入ECC控制器,可以采集断路器、UPS等设备的运行参数,利用上下游关系、短路电流算法、低压开关整定值匹配算法对断路器参数状态进行判断,实现远程自动或近端整定参数功能,避免盲目手工整定出现越级跳闸的风险。
      
      开关健康程度受环境因素影响,主要有5种因素:振动、硫化物、盐雾、温湿度、灰尘。通过智能监控断路器开关,定时在线预测评估功能并输出健康报告,采用4层颜色诊断实时状态,提醒运维人员及时制定开关检修&保养计划方案。
      
      一体化电源模块将工程产品化、产品模块化和集中智能化,高效可靠的实现快速部署和预测性维护运维,保障业务快速上线,为数字经济的关键业务提供连续可靠智能的供配电保障。
      
      作者简介
      
      余丹,男,1986年出生,大学本科,中级工程师,从事数据中心基础设施工程建设及弱电智能化管理工作。
      
      编辑:Harris
      
      

    随着智算中心、超大型/大型数据中心基地化建设模式兴起,电力容量需求节节攀升,业务中断带来损失无法估算。据2023年权威机构Uptime Institute调研表明,供电故障(占比52%)是数据中心机房宕机最大原因。