冷却约占数据中心平均能耗的三分之一,因此行业正竞相寻找更高效的方式为IT硬件散热。液体冷却——尤其是两相直触芯片(2PD2C)冷却技术已成为应对能源压力的最佳解决方案。
1752年,本杰明·富兰克林通过著名的风筝实验发现雷电能量时,他无法预见电力将在未来世界扮演怎样的角色。如今,数据中心行业已成为电力消耗最大的领域之一。随着电力需求激增,设施建设者和运营商面临巨大压力。电力采购的延迟和新建数据中心的漫长周期使问题更加复杂。
冷却约占数据中心平均能耗的三分之一,因此行业正竞相寻找更高效的方式为IT硬件散热。液体冷却——尤其是两相直触芯片(2PD2C)冷却技术已成为应对能源压力的最佳解决方案。

一、问题:数据中心难以跟上芯片发展的步伐?
过去六年中,机架功率密度已从6kW翻倍至12kW,甚至更高;数据中心运营商已不堪重负。若您认为这已足够棘手,那么人工智能(AI)的普及将进一步加剧这一压力。
AI历来耗电量巨大,但其最新迭代版本需求更为严苛。驱动生成式AI的大型语言模型(如ChatGPT和Claude)对计算资源的渴求永无止境。这些模型通过消耗海量数据进行计算密集型训练以提升精度,导致数据消耗量持续攀升。而在客户使用已训练模型的推理阶段,功耗需求也在迅速增长。
这一现象大幅加速了对计算能力的需求。据国际能源署(IEA)预测,2023至2026年间,AI服务器需求将增长十倍。然而,AI带来的压力不仅源于涌入数据中心的AI专用图形处理器(GPU)数量,更源于其迭代速度。GPU的处理能力和功耗正以惊人的速度发展。当前AI芯片领域的领导者英伟达(NVIDIA),已将GPU的发布周期缩短至每年一款。
分析机构预计,数据中心能耗将因此大幅攀升。高盛估计,2023年全球数据中心能耗为400TWh,其中仅12TWh用于AI;到2030年,总能耗预计达1018TWh,其中209TWh将用于AI硬件。
对于平均需3-5年建设周期的数据中心而言,快速增长电力需求令人头疼。据TDCowen分析师称,超大规模数据中心的电力供应获取周期长达七年。

电力资源日益紧张。随着政府要求公用事业转向可持续能源,从数据中心到电动汽车的电力需求激增,引发担忧。例如,TDCowen预测美国最大数据中心市场北弗吉尼亚州将在2027年冬季耗尽可靠性电力。
对运营商而言,应对这一问题如同击中飞行的子弹——他们必须在设计设施时超前规划,以适应加速增长的能源需求。为此,液体冷却技术将成为关键选择。
二、液体冷却:未来的答案
液体冷却效率远高于空气,因此英伟达于2022年推出A100GPU时开始大力支持液体冷却方案。2024年,其CEO黄仁勋表示下一代Blackwell架构GPU将主要采用液冷。
但需注意:并非所有液冷技术都相同。主要分为两类:
1)浸没式冷却:将设备浸入流体(通常为储液槽)。
2)直触芯片(D2C)冷却:对服务器改造需求更低,且冷却液用量更少(直接输送至芯片)。
D2C冷却进一步分为两类:
1)单相冷却(1PD2C):使用恒定液态冷却剂(如水或丙二醇混合液)为芯片散热。
2)两相冷却(2PD2C):采用低沸点冷却剂,通过相变(液态→气态)提升效率。泵将加压液体输送至芯片冷却板,吸热后汽化,经冷凝器重新液化,热量通过机架底部设施水或后门散热系统排出。

关于2PD2C系统中常用的全氟烷基物质(PFAS)类冷却剂,因其难以降解的特性(俗称“永久化学品”)存在环保争议。但并非所有PFAS化学物质相同。例如,Accelsius NeuCool系统采用的第四代PFAS冷却剂R1233zd可转化为天然化合物三氟乙酸(TFA)。
三、为何选择2PD2C?
两相冷却的精准性带来多重优势:
1)更高效率
沸腾液体通过相变吸收更多热量。由于沸腾液体在完全汽化前保持恒温,持续流入微通道冷却板的新冷却剂可不断带走芯片热量。
2PD2C的高效性使其能为高瓦数芯片散热而不触及热通量极限(冷却剂无法吸热导致芯片过热)。随着GPU功耗攀升,这一优势至关重要。例如,英伟达H100GPU测试显示,两相冷却可将芯片温度控制在57℃以下,而单相水冷温度达66-71℃。
2)成本效益
2PD2C的高可靠性是其经济优势的核心。更稳定的系统减少意外停机,提升算力输出;同时减少计划停机时间。其使用的绝缘流体避免了水基1PD2C系统中由腐蚀和细菌滋生导致的冷却剂频繁更换与检测需求。
另一财务优势是2PD2C可维持系统峰值性能。低效冷却方案需通过“降频”防止过热,导致算力损失。在金融等领域,处理器降频可能造成数百万美元的生产力损失。
3)面向未来
2PD2C还提供战略优势,尤其是在数据中心长期能效方面。其强大的冷却能力为硅芯片的持续升级预留空间,帮助建设者与运营商实现前瞻性规划。
四、未来趋势
随着行业正视压力,液冷技术将快速普及。分析机构Dell'Oro预测,到2028年液冷将占据数据中心冷却市场的三分之一。
尽管单相冷却(1PD2C)效率较低且部署复杂,Dell'Oro认为其将成为初期主流选择。但Accelsius指出,面对急速增长的散热需求,1PD2C仅是过渡方案。明智的企业将跳过这一阶段,直接采用更高效率、更具弹性的2PD2C系统。者,我们应当积极关注这一领域的发展动态,不断学习和掌握新的技术和知识,为数据中心的变革贡献自己的力量。让我们共同期待,在AI的引领下,数据中心能够创造出更加美好的未来,为我们的生活带来更多的惊喜和可能!
编辑:Harris
冷却约占数据中心平均能耗的三分之一,因此行业正竞相寻找更高效的方式为IT硬件散热。液体冷却——尤其是两相直触芯片(2PD2C)冷却技术已成为应对能源压力的最佳解决方案。