一、冷板式液冷技术的应用背景分析
1.智算与液冷方面的政策支持
2024年7月由国家发展改革委等四部门发布《数据中心绿色低碳发展专项行动计划》中提出,推广应用节能技术装备,因地制宜推动液冷、蒸发冷却、热管、氟泵等高效制冷散热技术。到2025年底,新建及改扩建大型和超大型数据中心PUE降至1.25以内,国家枢纽节点数据中心项目PUE不得高于1.2。而液冷技术相较传统风冷散热,可实现节能20%-30%以上,有助于实现相关目标。
根据国际数据公司(IDC)与浪潮信息联合发布《2025中国人工智能计算力发展评估报告》中显示,2024年我国智能算力规模达725.3EFLOPS(基于FP16计算),同比增长74.1%;市场规模达到190亿美元,同比增长86.9%。随着算力规模不断扩大,对于散热需求也提出了巨大的挑战。传统数据中心所采用的CPU通用服务器整机功耗较低约500W左右,而算力中心采用的GPU算力服务器具有高功耗特性。GPU图形处理器具有强大的并行计算能力,能够同时处理大量的数据和复杂的计算任务。如在深度学习的训练过程中,大量的矩阵运算需要GPU进行高速处理,国产单颗GPU芯片功耗可达到350-500W,而一台算力服务器通常配置8颗GPU+2颗CPU,整机功耗约在5-6KW,单机柜内通常配置2~4台算力节点,因此单机柜功率在10KW~20KW。因此,算力中心的功耗将比数据中心提高数十倍,导致传统的风冷散热系统难以应对GPU算力的高散热需求,而液冷技术的引入则展现出卓越的适配性与优势,为破解这一难题提供了创新解决方案。
2.冷板式液冷技术的成熟度分析
液冷技术路线主要分为冷板式液冷、浸没式液冷、喷淋式液冷,这三种液冷技术均可实现PUE低于1.2,符合国家相关政策要求。
目前冷板式液冷在三种主流液冷中技术成熟度最高、应用范围最广。根据中商产业研究院数据显示,当前我国冷板式液冷市场占比高达65%,而浸没式液冷和喷淋式液冷市场占比分别为34%和1%,因此本文主要论述冷板式液冷在算力中心的应用。
冷板式液冷方案主要有散热效率高、兼容性好、可靠性高等技术优势,并具有较好的兼容性,可在现有的服务器主板架构下进行改装,在技术及规模化生产上具有较高的可行性。在冷板式液冷系统运行下液冷可覆盖80%~90%的热量,其余部件热量由风冷系统进行辅助散热。由于冷板式液冷技术中冷却液与关键部件不直接接触原则,冷却液不直接接触IT发热元件,并在冷却液管路系统中可采用压差防护设计,其液冷系统中的二次侧管路循环均为负压的状态,系统内整体压强低于外部的大气压,避免了因冷却液泄漏而导致的算力服务器故障的风险。
综上,该技术具有较高的可靠性,在算力中心高能耗的背景下,液冷技术将成为推动绿色算力中心高质量发展的重要路径。
二、冷板式液冷技术助力算力产业绿色化发展
1.冷板式液冷技术设计方案
冷板式液冷依托于特制的冷板作为核心换热部件,冷板通常采用高导热系数金属材料(如铜、铝等)制成,内部设计有精细复杂的流道结构,用以容纳冷却液循环流动。
液冷系统在运行过程中,冷板紧密贴合服务器内的发热元件CPU、GPU等高功耗部件,发热芯片产生的热量以热传导方式高效传递至冷板,冷却液在流道中持续流动,吸收冷板上热量后温度升高,带着热量流出冷板进入外部热交换器;在热交换器里,冷却液与外界冷却介质(常为空气或冷却水)换热降温,再被泵回冷板循环工作,以此实现对发热元件稳定散热。
与传统的风冷技术相比,冷板式液冷具有更高的散热效率,此外,冷板式液冷还可以减少算力中心的噪音和灰尘污染,改善算力中心的机房环境条件。
冷板式液冷系统作为一种高效的散热解决方案,在算力中心得到了广泛应用,其系统包含一次侧循环与二次侧循环系统,系统间协同运作以保障高效散热,保障多样工况需求。
一次侧系统:主要由室外散热单元、一次侧水泵、定压补水装置和管路等部件构成,一次侧冷源可采用机械制冷系统和自然冷却系统,可灵活配置冷源模式,按需供给冷量。
二次侧系统:主要由CDU冷量分配单元、机房分水管路和液冷机柜(含冷板、快接头和Manifold)等部件构成,在二次侧循环过程中,热量转移主要依托冷却液温度的动态变化来达成,借助冷却液升温吸收热量、降温释放热量的特性,构建起稳定高效的热传递,确保发热元件所产生热量能够被及时带出,从而有效的降低算力中心的PUE值,详见图1所示。
2.液冷系统关键部件选型
冷板式液冷系统的关键的部件为CDU冷量分配单元,其在节能降耗方面发挥着至关重要的作用。通过精确控制调节液体的温度与流速,从而最大化冷却效率。CDU可分为集中式与分布式两种形态,根据业务上架情况和算力的负载情况,在实际工程中择优采用不同的CDU形式,表1是两种方案配置对比。
3.算力负载与液冷动态适配策略
基于不同业务的算力负载,如大模型训练、推理、业务实时交易等类型波动特性,设计液冷系统智能调控策略,包含流量控制、温度设定点自适应等,确保制冷精准匹配算力需求,避免过度制冷浪费能源。在算力服务器的关键组件CPU、GPU芯片、冷板、管路关键位点布置温度传感器,精度达0.1℃甚至更高,实时感知温度,将流量传感器电磁、涡轮等布置于管道测冷却液流速流量,压力传感器辅助监测系统阻力,传感器收集到的数据会通过数据总线或网络通信协议,如Modbus、CAN等传输到中央监控系统,集中监控系统对这些数据进行实时处理,包括数据滤波、校准和特征提取等操作,利用数据可视化技术将处理后的信息展示出来,使运维人员能够直观地了解系统的实时运行状态。
随着人工智能技术的发展,液冷智能温控系统可融入机器学习算法,以历史负载、实时运行等数据来训练制冷系统专用模型,用以预测负载、智能预调等智能手段。算法输出的控制指令会发送到液冷系统的执行机构,主要包括冷却液循环泵和流量调节阀,循环泵根据指令调整转速,从而改变冷却液的循环速度,当算力负载增加导致温度上升时,循环泵转速加快,使冷却液能够更快地带走热量,流量调节阀则通过改变阀芯的开度来控制冷却液在不同支路的分配。根据算力服务器中GPU芯片发热程度不同时,通过调节阀门开度,可将更多的冷却液分配到发热更严重的GPU芯片所在的支路,实现精准散热。
未来,基于人工智能和机器学习的智能调控系统将成为液冷技术的核心发展方向,通过实时监测算力负载、温度、流量等参数,液冷智能温控系统能够动态调整冷却液的流速和温度,实现更加精准的散热。
三、液冷与绿色算力中心的展望
1.液冷高效材料应用创新
随着全球对绿色算力需求的不断增长,液冷技术作为高效散热解决方案,逐步成为算力中心绿色化转型的核心解决方案,而冷板式液冷技术凭借其高效、节能、环保的优势,已在高性能计算、人工智能等领域展现出巨大潜力。未来,随着新材料的创新,液冷系统将进一步降低PUE值及建设成本,提升能源利用效率。
冷板作为冷板式液冷系统的核心部件,其材料性能直接影响散热效果,传统冷板多采用铜、铝等金属材料,虽具有一定导热优势,但在追求更高散热效率和轻量化的当下,逐渐显露出局限性。新型高性能复合材料应运而生,如碳化硅复合材料,结合了碳化硅的高导热性与铝的良好加工性能、低密度特点,其热导率490W/(m•K)比纯铜提升20%以上,比纯铝提升2倍以上。同时,碳化硅能够在高温环境下保持稳定的性能,不会因高温而失效,这使得碳化硅可以应用于各种高温的电子设备,由于其优异的热导性能,未来可被广泛应用于冷板冷却领域,降低维护成本,为绿色算力的稳定运行提供有力支撑。
2.产业链协同与标准化建设
绿色算力的发展离不开液冷产业链上下游企业的紧密协同。在当前技术快速迭代、市场需求多变的背景下,各环节企业唯有协同创新,才能共同推动液冷技术在绿色算力领域的广泛应用。
AI芯片厂商作为产业链上游的关键一环,在推动液冷技术与绿色算力融合方面发挥着重要作用。国内外主流的芯片厂家已与多家液冷厂商进行合作,联合推出GPU液冷解决方案。在研发过程中,芯片厂商凭借对芯片架构、发热特性的深入理解,为液冷厂商提供精准的热管理需求参数;液冷厂商则依据这些参数,利用自身在散热技术、冷却液研发、系统设计等方面的专业优势,设计出高效适配芯片散热需求的液冷系统。通过这种深度合作,不仅显著提升了芯片在高负载运行下的稳定性和性能表现,还大幅降低了能耗,有力地推动了绿色算力的发展。
标准化建设是推动液冷技术在绿色算力领域大规模应用的关键因素。尽管液冷技术在算力领域已有一定规模应用,但各液冷厂商在技术研发和产品设计上自成体系,尚未形成统一的行业标准。如冷板接口形式(O形圈密封与快插接头)、工质分配单元(CDU)控制逻辑等方面存在显著差异,导致系统互换性与运维经济性受限,在一定程度上限制了液冷技术的进一步推广和应用。因此,加强液冷技术的标准化建设迫在眉睫。通过联合产业链中各环节厂商,如液冷服务器制造商、冷却液供应商、散热部件制造商、系统集成商等共同努力,建立一套完善、科学、合理的液冷技术标准体系,为绿色算力和液冷技术的发展营造良好的市场环境,推动产业的健康、可持续发展。
四、结论
冷板式液冷技术作为算力中心散热领域的重要技术手段,凭借高效、节能、环保的特点已成为绿色算力中心的主流选择。本文提出了算力负载与液冷动态适配机制,通过智能调控策略实现制冷与算力需求的精准匹配,有效避免过度制冷造成的能源浪费,实现制冷精准匹配算力需求,推动算力中心的绿色化转型,为绿色算力的发展提供有力支撑,未来将引领算力产业迈向可持续发展的新高度,助力构建低碳、高效、智能的算力中心。
参考文献
[1]吕天文,张蓝心.中国智算中心现状及液冷技术应用展望[J].通信世界,2024,13(8):39-42.
[2]庄泽岩,孙聪,张琦,黄子轩,于洪元.冷板式液冷技术与应用现状分析[J].通信管理与技术,2021,(3):27-30.
[3]邱贵乾.面向服务器CPU芯片散热的泡沫铜液冷系统设计及性能研究[D].华南理工大学,2023.
[4]陈强,白书欣,叶益聪.热管理用高导热碳化硅陶瓷基复合材料研究进展[J].无机材料学报,2023,38(6):634-646.
[5]李建,阮迪.多样化算力对服务器的散热挑战分析[J].信息通信技术与政策,2024,50(2):46-54.
作者介绍
郑伟,硕士研究生,高级工程师,一级注册建造师(建筑+机电),一级注册消防工程师。太极计算机股份有限公司数字基础业务集团技术委员会主任、数据中心技术总监、金融事业部副总经理、算力创新中心主任,中国通信工业协会数据中心委员会专家委员,北京市建筑业联合会专家,北京信息化协会专家委员,深耕数据中心与算力行业规划与建设十余载,深谙行业政策演进与技术趋势,目前主要负责智算中心业务。
编辑:Harris