为了提高计算能力并保持数据中心的运行温度正常,很多组织已经从空气冷却过渡到液体冷却。
数据中心继续将更多的计算能力整合到更小的空间中,以整合工作负载并容纳和处理密集型应用程序,例如人工智能和高级分析。因此,数据中心的机架消耗更多的能量并产生更多的热量,从而对数据中心的冷却系统带来更大的压力,以确保安全有效的运行。
在以往,数据中心可能依靠空气冷却技术来维持正常的工作温度。而保持更高的功率密度是空气冷却面临的一个重大挑战,促使许多组织开始考虑采用液体冷却技术。
在讨论采用液体冷却和空气冷却技术时有许多因素要考虑。以下描述了这两种主要的数据中心冷却方法,并比较了它们的优缺点和成本。
什么是空气冷却?
数据中心从一开始就一直在使用空气冷却技术,并继续广泛使用。尽管这些年来冷却技术不断发展,冷却系统的效率越来越高,但基本概念一直保持不变。冷空气在硬件周围循环,通过用较冷的空气交换热空气来消散热量。
空气冷却系统之间的主要区别在于它们如何控制气流。这些系统通常分为三种类型:基于房间、基于行、基于机架。
基于房间的系统有几种类型。空气可能会在整个房间内循环,或者可能会加高设备附近的地板,冷空气在地板下通过进行冷却。而基于房间的冷却系统已经整合了冷热通道,以更好地控制气流和设备。在更先进的冷却系统中,可以采用围堵技术更精确地引导气流。
采用基于行的方法,每行包含专用冷却单元,这些冷却单元针对特定设备的气流。这种方法提高了冷却效率,并减少了引导气流所需的风扇能耗。
基于机架的系统通过将冷却单元专用于特定的机架,更进一步进行冷却,与其他方法相比,其精度和效率更高。但是该系统需要更多的冷却设备,并且产生更多的复杂性。
多年来,空气冷却已被证明是保护数据中心设备的宝贵工具。其背后的技术已广为人知并得到广泛部署。数据中心人员通常熟悉风冷及其保持运行所需的条件,而维护这些系统是一个简单的过程,其背后有大量的行业经验提供支持。
空气冷却的缺点
不幸的是,空气冷却技术也面临一些挑战。最重要的是它无法满足现代工作负载需求。空气冷却根本赶不上功率密度的增加和繁重的工作负荷的发展。在某种程度上,用于空气冷却的资本支出不再合理。空气冷却已经占了数据中心运营成本的很大一部分,不断上升的能源成本只会加剧这一问题。
对于依靠蒸发冷却或冷却塔的空气冷却系统来说,用水的限制和成本也可能带来挑战。此外,更高的功率密度会导致部署更多的冷却风扇和水泵,使数据中心更加嘈杂,因此工作人员必须佩戴保护性听力设备。
潜在的问题是,尽管空气被广泛使用,但仍然不是有效的传热介质,因此需要更好的冷却解决方案来满足当今数据中心的需求。
什么是液体冷却?
数据中心已开始采用液体冷却,而不仅仅是应用在大型机和超级计算机应用场合。水和其他液体的传热效率比空气高得多,并且可以帮助解决空气冷却系统带来的一些挑战,尤其是功率密度的提高。
越来越受关注的一种液体冷却技术是直接基板冷却。在这种配置中,冷却板直接位于组件(例如CPU、GPU或存储设备)旁边。通过连接到基板上细小管道带来冷水并带走温水。然后将温水冷却并重新循环冷却设备。
类似的概念可以应用于机架或服务器级别。水或其他类型的冷却剂通过闭环系统循环进行热交换。尽管其确切的冷却过程根据解决方案的不同而有所不同,但它们通常使用封闭循环的冷却剂,用于散发热量的交换器和在冷却剂循环时降低冷却剂温度的机构。例如,交换器可以安装在机架的背面,而风扇安装在另一侧,以促进空气循环并散发热量。另一个系统可能会将冷却剂输送到地板下面的管道以提供冷却。
浸入式冷却技术正在取得新进展。在这种方法中,所有的服务器组件都浸没在不导电的冷却液中,然后将组件和冷却液装入密封的容器中以防止泄漏。以这种方式,来自部件的热量被传递到冷却液,该冷却液被循环和冷却以实现持续散热。
因为液体冷却的导热性比空气好,所以它可以更有效地处理数据中心不断增长的功率密度,从而有助于满足计算密集型应用程序的需求。此外,液体冷却大幅降低了能耗,并且比许多空气冷却系统使用的水更少,这可以降低运营成本。液体冷却还占用更少的空间,并产生更少的噪音。
液体冷却的缺点
尽管有这些优点,但是液体冷却也有其缺点。除了更高的资本支出之外,它还要求IT人员和数据中心管理员学习新技能并采用新的管理框架,这可能是一项艰巨的任务。
这也可能意味着数据中心要引进新的运营人员或技术顾问,从而进一步削弱运营成本的优势。此外,液体冷却市场仍在日趋成熟,其技术范围很广,从而导致专有产品和供应商锁定的风险。
选择空气冷却还是液体冷却时要考虑的因素
建立新的数据中心或更新现有数据中心的组织可能正在评估现在是实施液体冷却还是坚持采用空气冷却技术的好时机。如果是这样,他们需要考虑以下几个重要因素:
(1)成本
成本无疑将是决定性因素之一,但是达到真正的总拥有成本(TCO)可能是一个复杂的过程。尽管液体冷却的资本支出较高,但其较高的效率可以转化为较低的运营支出,尤其是随着功率密度的增长。另外,液体冷却使用较少的电力和水,这在缺水地区尤为重要。另一方面,供应商锁定的风险可能会影响长期的总体拥有成本。
评估系统时也应考虑服务器本身。液体冷却可以支持更高的计算密度,同时减少占用数据中心的空间,从而提高空间利用率并降低成本。对更高功率密度的支持可以使由于空气冷却限制而无法执行处理密集型工作负载的组织受益。支持这些工作负载可以转化为更多的成本节省。
(2)易于安装和维护
另一个重要的考虑因素是部署和维护冷却系统需要采取的措施。使用空气冷却技术,操作设备和更换组件通常很简单。这并不是说空气冷却不会面临自身的挑战,例如正在进行的水处理或机械维护,但却能够获得更多的支持。
液体冷却代表着一种新的思维方式工作方式。IT和数据中心团队将面临艰难的学习曲线,在某些情况下,可能需要依靠供应商进行日常维护。例如,如果IT部门需要更换使用浸入式冷却的服务器中的内存,那么该怎么办?在分析成本时,组织必须评估部署和维护冷却系统的所有影响。
(3)效率
有些组织并不支持需要高功率密度的高级工作负载类型,因此可能无法过渡到液体冷却技术。也就是说,随着数据中心运营商更好地利用数据中心占地面积以及IT整合工作负载以提高效率,功率密度只会在未来几年内增长。在某个时候,液体冷却技术可能会成为唯一可行的选择,但这并不意味着组织必须急于采用。
在决定采用液体冷却还是空气冷却技术时,其他考虑因素也可能起到重要作用。例如,组织可能正朝着更绿色环保的数据中心实践迈进,并且可能希望采用诸如液体冷却之类的技术,该技术使用更少的资源并且更加安静。位置也可能是一个因素。在北极附近运营的数据中心可以使用大量冷空气,而在工厂附近或其他恶劣环境中运营的数据中心则可能难以维护空气冷却系统。在拥挤的城市环境中,数据中心可能需要增加功率密度,以最大限度地利用占地面积。而地方法规、税收优惠或类似问题也能发挥重要作用。
技术成熟度在冷却选择中的作用
液体冷却技术面临的最大挑战之一是,除了应用在大型机和超级计算机以外,这是一个新兴的行业。因此,很难衡量哪些冷却技术将成为领导者,如何使这些冷却技术实现标准化或者是在四五年后会发生什么。
采用空气冷却技术,组织可以知道他们要进入的领域,但是其长期应用可能会受到限制。而不需要仓促做出决定的组织可能对采用液态冷却技术采取观望和等待的时间。那些已经感受到其危机的组织可能会考虑采取分阶段的液体冷却方法。
编辑:Harris