随着电子计算机的大量应用,在上世纪60年代出现数据中心的雏形。近30年来,随着互联网和移动通信的高速发展,数据中心内设备越来越多,用电量急剧增加,这些对数据中心的能耗控制提出了更高的要求。作为数据中心主要的耗电设备,服务器和空调系统的能耗利用效率,一直是重点关注的题。提高散热效率,是有效降低能耗的一个重要手段。目前通用的散热方式有风冷散热和液冷散热。
最常见是液冷散热系统为水冷散热系统。水冷散热系统通过服务器冷板将热量带走,高温水在室外冷却塔进行热交换,降温后的低温水经CDU分配给单个机柜,整体制冷效果稳定,效率较风能高。而且水冷系统取消机柜散热风扇,降低了机柜噪音,对环境影响小。尽管水冷系统需要专门的水冷机柜,结构比较复杂,成本也比较高,维护难度更高,但是能满足大型数据中心冷却和节能要求,相比传统的风冷数据中心,水冷数据中心的能耗可以降低40%,未来会越来越普遍。
1 液冷机柜介绍
液冷数据中心机房内的主要组成部分有水冷机柜、CDU、液冷管路系统等。
(1)液冷机柜
液冷机柜由进回水接头、进回水分水管、冷板接头、供回水支管、冷板等部件组成。通过该系统实现液体在冷却回路中的循环,液体在机柜级汇聚,机柜级有一进一回两个进回水接头,通过该接头与CDU连接,通过换热带走冷却设备中热量。
液冷机柜的原理请参考图1。
其中,分水管和分水器的要求:
①分水器需要满足方便维护、更换的需求;
②分水器需要考虑满足液体回路中液冷的流速需求;
③分水器需要考虑各供水支管流量均匀分配的需求,避免局部支管液流不畅,导致局部冷却设备温度过高,影响设备运行。
液冷接头的要求:
①液冷接头需要满足分离后切断液冷的需求,液冷的泄漏不得影响维护过程;
②液冷接头需要考虑客户生命周期内插拔维护的需求;
③液冷接头需要考虑发生故障时方便更换的需求;
④液冷接头需要增加漏液保护措施,避免电气短路导致设备损坏、起火等严重安全问题;
⑤各种液冷接头需要在结构上考虑漏液不会漏到冷却设备上,如结构位置交错布置。
(2)液冷管路系统配置
液冷系统的管路需要考虑管路可靠性要求,连接方式需考虑管路故障状态,一般分为直连式和环路式两种方式。
①直连式(图2)
②环路式(图3)
(3)液冷系统管路要求
①管路系统的连接方式取决于连接处的材料,实际连接中管路,管件的材料均需要考虑与冷却工质的材料兼容性;
②针对冷冻水部分应该采用保温措施,避免产生冷凝;
③管路的水流方向需要有合适的醒目的标记,防止紧急状态人为失误关错阀门,导致意外发生;
④管路需要考虑设计必要的切断阀,以便在机架负荷或功能改变时切断供水系统;
⑤管路宜考虑过滤器的设置,用来规避杂质对系统的污染,导致液体阻力增大,甚至堵塞冷板,影响换热效果。
2 液冷机柜供水故障的影响
液冷服务器具有节能降耗、噪声低的特点,但是如果液冷管线局部出现故障,需要维修,就需要将液冷机柜内服务器关机,将分水管从供水管路中断开。这将降低甚至中断现有服务,影响客户体验,即使将受影响的服务器的服务临时迁移到其它服务器,也会影响到相关服务器的运行,增加了数据中心的维护工作量。
3 新的解决方案
下面探讨一种移动液冷散热装置。将受影响的液冷机柜水冷支管从CDU断开,临时接入移动液冷散热装置。移动液冷散热装置提供应急散热功能,为液冷机柜提供低温循环冷媒,保证液冷机柜内设备的持续正常运行。详细方案说明如下:
(1)整套系统组成
①高温进水管:从液冷机柜等设备高温出水管(阀/口)引入需要冷却的高温循环水;
②散热器:高温水进入散热器;
③风扇:为散热器提供强制流动空气,进行散热;
④水箱:用于储存水,对管线进行补水,避免空气进入管线;
⑤水泵:强制水循环;
⑥低温出水管:从水箱引入经降温的水到液冷机柜等设备的低温进水管(阀/口)等;
⑦控制盘:电控系统,控制装置的启停、水温、流速、风扇启停、转速等监控。系统的示意图如图4所示。
(2)系统工作方式
①当CDU或者分水管线供水出现异常,比如压力下降、上升,或者即将停机等,可将受影响的水冷机柜从分水管路断开,迅速接入移动水冷散热装置;
②将水冷机柜高温水出水口接入本装置的高温进水口,迅速将水冷机柜的低温水进水口接入本装置的低温出水口;
③启动本装置,本装置提供强制水循环;
④风扇和散热器对高温水进行强制散热降温;
⑤本装置根据自身进水口的温度调节水流和风速,使高温进水口的温度控制在设定范围内,保障服务器持续正常运行。
控制系统的框图如图5所示。
(3)系统可选组件
系统还可以增加下述组件,以便灵活实现更多功能:
①变径水管接头:用于同不同液冷机柜进出水管的连接;
②高温水管阀门:控制高温进水口的水流;
③冷水管阀门:控制低温出水口的水流;
④自动控制系统:根据进出水口的水温、室温和风扇出风口的温,对装置的水流量和风速进行调节,以控制能耗、噪音,达到最佳的系统效率;同时提供本装置的异常报警功能;
⑤机柜:所有部件安装到一个机柜或者机架上;
⑥供移动的拖轮:装置底部带有拖轮,便于在机房内移动;
⑦水管收纳盘:用户收纳进出水管;
⑧分水器:便于支持多个液冷机柜,按需分配循环冷媒。
4 本装置的优缺点
(1)本装置的优点
本装置能够解决CDU管线局部供水故障,能够使受影响液冷机柜中的设备继续运营。自动化程度高,能够根据系统设置,监测高温液体和低温液体的温度和流量,自动调节水量和风速,控制冷却设备处于正常的温度范围内。系统操作简单,占地面积小,对现有数据中心维护人员稍加培训,即可胜任。
根据数据中心的安全要求,配置不同容量的应急水冷工作站,以应对单个水冷机柜和多个水冷机柜的临时水冷需求。
由于是移动式的水冷工作站,在数据中心内可以按照实际需求少量配置,作为应急设备使用,成本在可接受的范围之内。同时,多数据中心内的移动应急水冷工作站平时可以分散配置在各个数据中心内,在紧急情况下也可集中使用,应对严重的突发事件。
(2)本装置的缺点
由于是移动水冷工作站,水冷的容量相对整个数据中心非常小,仅能应对局部水冷管线故障,能力有限。
水冷工作站工作时仍然在数据中心室内散热,由于是二次散热,会增加空调系统的负担。可以将移动水冷工作站移动到室外,但会延供水、回水管线和电源线,增加移动制冷工作站的复杂度。
5 结束语
数据中心的设计和部署将变得更加一体化,对数据中心的整体安全性要求会越来越高,服务器的水冷子系统也会越来越复杂。如何应对可能出现的风险,会是一个长期的话题,一方面寄希望于系统具备更高的可靠性,同时也需要各种备灾方案。
移动水冷工作站,对于水冷机房,不失为一个积极的应急方案,保障数据中心的安全运行,避免由于部分服务的无法运行,影响整个数据中心的运行。
作者简介
王爱梅,现为联想集团数据中心业务集团服务器研发部高级项目经理。有19年服务器相关开发经验,带领开发团队开发具有国际先进水平的系列服务器产品,为我国的计算行业发展做出突出贡献。
编辑:Harris