您的位置:首页 > 技术方案 > 正文

热门芯片冷却技术:浸入式与直接芯片式深度剖析

时间:2025-05-07 13:42:02 浏览:21

2025 年,芯片技术飞速发展,处理器功率每 6 个月就会快速增长,每个机架的功率也随之水涨船高。这使得数据中心的温度不断攀升,传统的空气冷却技术已然达到极限。预计在未来两年内,液冷数据中心的数量将从不到 1% 的市场份额急剧增长到所有安装量的 30% 左右。超大规模数据中心运营商们不再纠结是否采用液冷技术,而是关注该选用哪种技术,以及如何快速投入使用。本文将全面深入地探讨当下可用的各类芯片液冷技术,助您依据特定应用做出最优决策。

液体冷却主要分为浸入式和直接芯片式两大类,每种冷却方式又都有单相和双相两种方案。直接芯片式冷却常被称作 “冷板冷却”,它通过将冷板直接放置在 CPU 或 GPU 的顶部来实现散热;而浸入式冷却则是用大型重型水箱替代标准机架,并在水箱内注入液体,服务器和设备直接浸没其中。

浸入式冷却概述:充满液体的容器

浸没式液体冷却有单相和双相之分。单相浸没式冷却利用储罐中的油性液体吸收热量,加热后的液体上升到储罐顶部,随后被泵送至热交换单元,冷却后再送回容纳硬件的储罐。

1.webp.png

单相浸没式的优缺点:

优点:能够彻底消除服务器产生的 100% 热量。

缺点:由于油液上升到油箱顶部并被泵送冷却的速度较慢,它只能冷却最大功耗为 500 瓦的处理器和芯片。大型笨重的油箱需要大量的数据中心基础设施投资,维护成本高昂,且经常需要停机。此外,油液在高温下可能易燃,由于油箱体积较大,维护工作十分繁琐。而且所有设备直接浸入液体中,存在设备损坏的风险。

两相浸入式冷却采用低沸点的介电流体取代油。热量使流体沸腾产生蒸汽,蒸汽上升到水箱顶部,通过管道网络中的流动冷却水使其冷凝后滴回水箱。

2.webp.png

双相浸泡的优缺点:

优点:这种方法可以有效去除 100% 的热量,并且使用电介质液体能确保 IT 设备的安全。

缺点:大型笨重的储罐需要大量的数据中心基础设施投资,维护成本高,且经常需要停机。储罐内的组件不仅要与介电液体兼容以防止损坏,而且沸腾过程会使主板、焊接和其他设备上的物质蒸发,这可能损害设备的使用寿命。随着物质的脱落,需要不断过滤,这就需要大型过滤器。此外,储罐需要定期维护,打开储罐时,介电液体的蒸汽会释放到大气中。

直接芯片液冷概述:位于 GPU/CPU 顶部的冷板

直接芯片冷却由位于 CPU 或 GPU 顶部的冷板构成。与浸入式冷却将设备浸入大型水箱中的液体不同,直接芯片冷却使用的液体被封装在紧凑的冷板内。

直接芯片液体冷却包括单相或双相工艺。单相直接芯片冷却使用水或水 - 乙二醇混合物作为冷却板中的冷却剂,水保持液态,其散热能力取决于水流量。

单相直接芯片冷却的优缺点:

优点:冷板无需使用浸入式冷却所需的大型、昂贵的水箱。

缺点:如果冷却板中的水没有持续过滤和维护,使用水会带来腐蚀风险,一次泄漏就可能对服务器造成灾难性的后果。由于冷却依赖于持续的水流,芯片温度越高,所需的水流量就越大。这种设计需要高压和高流量、更大的管道、管子和连接器,以及耗电的泵来持续输送水。

双相直接芯片冷却不使用冷板中的水,而是采用导热流体,这对于 IT 设备而言是 100%安全的。GPU 和 CPU 产生的热量使导热流体在低温下沸腾,吸收热量并使芯片保持恒温。这个过程类似于沸水使锅底保持在 100⁰C,只是温度较低。当冷板内的液体沸腾时,冷板中的液体永远不会超过沸点。这种效果使该技术具有高度可扩展性,可用于冷却未来温度更高的芯片。

两相直接芯片冷却的优缺点:

优点:这种方法几乎不需要对数据中心基础设施进行任何改动,导热流体也无需过滤、平衡或更换。液体处于封闭系统中,不会释放到大气中。冷板和服务器中不使用水,消除了漏水的风险,而且由于液体的温度永远不会超过沸点,即使芯片未来温度升高,它也能无缝运行。

缺点:液冷仅用于 CPU/GPU 散热,其他组件(例如内存和 I/O)仍然需要风冷。

液体冷却市场正变得像芯片一样火爆

根据最近的研究报告,液体冷却市场预计将从 2024 年的 56.5 亿美元增长到 2034 年的 484.2 亿美元。这种巨大增长的原因显而易见:随着人工智能工厂和数据中心内部的热量上升到前所未有的水平,根本没有其他方法来支持人工智能的建设。

幸运的是,正如本文所强调的,有许多不同类型的液冷技术可用于散热,每种技术都有其优缺点。随着芯片功率的不断提升,确保所选的冷却解决方案能够适应下一代芯片至关重要。数据中心、AI 工厂和超大规模计算中心需要综合考虑性能、成本、功耗、易用性、可扩展性和可持续性等因素,决定哪种解决方案更适合他们当前的需求,并满足他们近期的发展需求。