液冷CDU(冷量分配單元)在數(shù)據(jù)中心散熱中起著至關(guān)重要的作用。數(shù)據(jù)中心隨著數(shù)字化技術(shù)的發(fā)展和算力需求的增加,面臨著巨大的能耗和散熱挑戰(zhàn)。液冷技術(shù)作為一種高效、節(jié)能、環(huán)保的制冷方式,逐漸成為數(shù)據(jù)中心散熱的重要解決方案。而液冷CDU則是液冷系統(tǒng)中的核心部件之一,負(fù)責(zé)將冷卻液分配到各個(gè)需要散熱的設(shè)備中,確保整個(gè)系統(tǒng)的穩(wěn)定運(yùn)行。所以選擇合適的液體對(duì)于液冷CDU乃至整個(gè)數(shù)據(jù)中心的系統(tǒng)穩(wěn)定和高效運(yùn)行具有重大意義。
選擇 CDU 首先要徹底了解數(shù)據(jù)中心的設(shè)施設(shè)計(jì)和限制。需考慮以下事項(xiàng):
設(shè)施考慮因素
設(shè)施用水可用性:設(shè)施用水的可用性將決定在兩大類行式 CDU 之間做出選擇:液體到液體或液體到空氣。如果設(shè)施用水有限,則液體到空氣 CDU 更易于部署。如果設(shè)施用水已經(jīng)接入將要安裝 CDU 的區(qū)域(或可以引入),則液體到液體 CDU 更受青睞,因?yàn)樗鼈兊娜萘扛蟆?/span>
物理部署:CDU 的尺寸和重量必須符合建筑物的限制條件,例如電梯容量、地板負(fù)載限制和可用空間。適當(dāng)?shù)脑u(píng)估可確保安裝和運(yùn)行順利進(jìn)行,避免昂貴的修改或停機(jī)。CDU 旨在安裝在服務(wù)器機(jī)架之間、數(shù)據(jù)中心熱/冷通道內(nèi)或設(shè)施或機(jī)械室內(nèi)的數(shù)據(jù)中心大廳外。
二次流體網(wǎng)絡(luò) (SFN) 擴(kuò)建:有效規(guī)劃行式 CDU 與機(jī)架之間的連接對(duì)于高效運(yùn)行至關(guān)重要,因?yàn)樗鼤?huì)影響整個(gè)系統(tǒng)的壓降、可維護(hù)性和系統(tǒng)的可擴(kuò)展性。
CDU 表現(xiàn)
需要考慮的兩個(gè)主要性能點(diǎn)是二次流量和總體熱負(fù)荷能力。
二次流速:CDU 的流速由泵性能決定,直接影響芯片的散熱效率。隨著熱設(shè)計(jì)功率(TDP) 的上升,對(duì)更高流速的需求也隨之增加。CDU 冷卻 AI 系統(tǒng)必須滿足的典型目標(biāo)是每 1 kW 散熱 1.5 LPM。隨著流速的提高,系統(tǒng)壓降呈上升趨勢(shì),因此確保足夠的泵性能至關(guān)重要。
熱負(fù)荷能力:熱交換器或線圈的性能決定了 CDU 將直接液體冷卻 (DLC) 系統(tǒng)的熱量散發(fā)回設(shè)施的能力。熱交換器或線圈級(jí)別的容量和效率不足會(huì)導(dǎo)致進(jìn)入 IT 的流體溫度升高,并降低可處理的熱負(fù)荷。需要考慮的一個(gè)重要熱負(fù)荷指標(biāo)是接近溫度,即冷卻服務(wù)器組件的技術(shù)流體與冷卻 CDU 的設(shè)施提供的供應(yīng)流體之間的溫差。在給定熱負(fù)荷下,接近溫度越低,CDU 的冷卻效率就越好。
機(jī)柜布局與管路設(shè)計(jì)
- 在機(jī)柜布局方面,合理安排CDU的位置至關(guān)重要。對(duì)于分布式(嵌入式)CDU布局,要確保一次側(cè)和二次側(cè)循環(huán)的連接順暢,避免出現(xiàn)管路交叉或折彎,減少阻力和壓力損失。對(duì)于集中式CDU布局,要優(yōu)化進(jìn)回水的管路走向,減少?gòu)澱酆妥枇ΓWC各支路流量均勻。
- 在管路設(shè)計(jì)上,應(yīng)采用大管徑和低阻力的管路,減少壓力損失。優(yōu)化管路的走向,避免交叉和過(guò)長(zhǎng)的連接,同時(shí)注意防護(hù)和固定,防止震動(dòng)和外力損壞。還應(yīng)考慮管路的材質(zhì)和連接方式,確保連接的可靠性和密封性。
冗余、監(jiān)控和可維護(hù)性機(jī)柜
當(dāng) DLC 系統(tǒng)出現(xiàn)故障時(shí),可能會(huì)在幾分鐘內(nèi)失去所有支持的系統(tǒng),因此考慮 CDU 解決方案的以下特點(diǎn)非常重要:
冗余:確保您的 CDU 在設(shè)備的關(guān)鍵組件(例如泵、過(guò)濾器、電源、傳感器)以及多個(gè)協(xié)同工作的 CDU 之間具有內(nèi)部冗余,從而防止停機(jī)。集成的超級(jí)電容器和 ATS 還可確保不間斷運(yùn)行。
監(jiān)控和接口:先進(jìn)的監(jiān)控系統(tǒng)可實(shí)時(shí)提醒操作員注意潛在問(wèn)題。Redfish、MODBUS、SNMP、SFTP、SSH 和 SMTP 等接口可提供全面的監(jiān)督和控制。
可維護(hù)性:簡(jiǎn)單的設(shè)計(jì)和對(duì)關(guān)鍵組件的輕松訪問(wèn)確保了快速維護(hù)和最小的中斷,從而保持了系統(tǒng)的高正常運(yùn)行時(shí)間和效率。能夠在數(shù)據(jù)中心通道內(nèi)(從前面或后面)維護(hù) CDU,而無(wú)需拆除側(cè)面板或完全拆除 CDU,從而提高了可維護(hù)性。
- 開(kāi)式冷卻塔:通過(guò)將循環(huán)水噴淋到填料上,利用空氣與水的熱質(zhì)交換冷卻循環(huán)水,但循環(huán)水與空氣直接接觸,易受污染。
- 閉式冷卻塔:將換熱器置于塔內(nèi),內(nèi)外循環(huán)分離,水質(zhì)好、換熱器不易結(jié)垢,但初投資和運(yùn)行成本高,占地面積大。
- 干冷器:通過(guò)管內(nèi)液體與管外自然風(fēng)的熱交換冷卻管內(nèi)液體,初投資低,無(wú)壓縮機(jī)耗電量低,但運(yùn)行環(huán)境相對(duì)惡劣,夏季散熱差時(shí)可能需要額外的冷卻措施。
全球知名液冷公司CoolIT Systems 推出三款新型冷卻液分配單元 (CDU):AHx240、AHx180 和 CHx500。這些新型號(hào)專為滿足各種冷卻需求而量身定制,并為各種數(shù)據(jù)中心應(yīng)用提供可擴(kuò)展、高容量的解決方案。

CoolIT 冷卻液分配裝置(從左到右):AHx180、AHx240 和 CHx500
這三款 CDU 均專為滿足 AI、高性能計(jì)算和企業(yè)計(jì)算應(yīng)用的嚴(yán)苛冷卻要求而設(shè)計(jì)。它們提供卓越的性能、密度、效率和可靠性,尤其是與包含CoolIT 的 OMNI 冷板(采用 Split-Flow 技術(shù)和 CoolIT 歧管)的服務(wù)器集成時(shí)。該公司設(shè)計(jì)這些裝置是為了提供尖端 AI 系統(tǒng)所需的最高流量,同時(shí)準(zhǔn)備制定新的行業(yè)標(biāo)準(zhǔn)。
AHx240 和 AHx180 為液對(duì)氣 CDU 樹(shù)立了新標(biāo)準(zhǔn)。AHx240 是業(yè)界容量最高的 CDU,在 2 個(gè)機(jī)架空間內(nèi)提供超過(guò) 240 kW 的功率,而 AHx180 可提供 180 kW 的功率,其設(shè)計(jì)經(jīng)過(guò)優(yōu)化,可在標(biāo)準(zhǔn)數(shù)據(jù)中心氣流范圍內(nèi)運(yùn)行。這些獨(dú)立系統(tǒng)無(wú)需外部設(shè)施供水,使數(shù)據(jù)中心運(yùn)營(yíng)商能夠部署最高密度的 AI 工作負(fù)載,而無(wú)需花費(fèi)高昂的成本投資新基礎(chǔ)設(shè)施。AHx240 液對(duì)氣 CDU 最多可冷卻四個(gè) NVIDIA GB200 機(jī)架,而 AHx180 最多可冷卻兩個(gè)。
CoolIT 的 CHx500 液對(duì)液 CDU 為高密度計(jì)算工作負(fù)載提供可擴(kuò)展的冷卻。四個(gè) CHx500 單元可以堆疊在一起,在單個(gè)機(jī)架中提供 2MW 的熱管理。CHx500 平臺(tái)是目前性能最高、密度最高的液對(duì)液 CDU。支持 ASHRAE W45 冷卻有助于高效地重復(fù)使用熱量,并為可持續(xù)的高性能數(shù)據(jù)中心冷卻解決方案樹(shù)立了新標(biāo)準(zhǔn)。CHx500 x 4(全堆疊,一個(gè)機(jī)架)液對(duì)液 CDU 將冷卻多達(dá) 58 個(gè)機(jī)架,每個(gè)機(jī)架有 21 x 2U DLC 服務(wù)器(每個(gè)機(jī)架 14.7 kW)或 1,218 個(gè) DLC 服務(wù)器。

| AHx180 液對(duì)空 CDU | AHx240 液對(duì)空 CDU | CHx500 液對(duì)液 CDU |
| 15°C 時(shí)制冷能力為 180 kW。 | 15°C 時(shí)制冷能力為 240 kW。 | 5.5°C 時(shí)制冷量為 500 kW。 |
| 2 個(gè)高性能泵。 | 2 個(gè)高性能泵。 | 3 個(gè)泵實(shí)現(xiàn) N+1 冗余。 |
| 4 個(gè)高效風(fēng)扇。 | 8 個(gè)高效風(fēng)扇。 | 兩個(gè) A+B 冗余、熱插拔電源。 |
| 全不銹鋼管道。 | 全不銹鋼管道。 | ASHRAE W45 溫水冷卻能力。 |
| 纖薄的 2 機(jī)架占地面積(1200 毫米寬 x 1066 毫米深 / 47.2 英寸寬 x 41.9 英寸深)。 | 2 個(gè)機(jī)架占地面積(1200 毫米寬 x 1200 毫米深 / 47.2 英寸寬 x 47.2 英寸深)。 | 11U 高度,允許在單個(gè) 48U 機(jī)架中容納 4 個(gè) CDU 單元 + 3U 冷卻液儲(chǔ)存器。 |
| 集成傳感器:流量、壓力、溫度、濕度、冷卻液液位和泄漏檢測(cè)。 | 內(nèi)置傳感器:流量、壓力、溫度、濕度、冷卻液液位和泄漏檢測(cè) | 內(nèi)置傳感器:流量、壓力、溫度、濕度、冷卻液液位和泄漏檢測(cè)。 |
| 集成 50 μ 可維修過(guò)濾器,具有 25 μ 至 150 μ 的選項(xiàng)。 | 集成 50 μ 可維修過(guò)濾器,具有 25 μ 至 150 μ 的選項(xiàng)。 | 可選 50 μ 外部濾波器 |
| 最多可對(duì) 20 個(gè)單元進(jìn)行群組控制。 | 最多可對(duì) 20 個(gè)單元進(jìn)行群組控制。 | 1 個(gè)機(jī)架內(nèi)最多可對(duì) 4 個(gè)單元進(jìn)行群組控制。 |
| 集成控制和監(jiān)控系統(tǒng)(Redfish、SNMP、TCP/IP、Modbus、BACnet 等)。 | 集成控制和監(jiān)控系統(tǒng)(Redfish、SNMP、TCP/IP、Modbus、BACnet 等)。 | 集成控制和監(jiān)控系統(tǒng)(SSH、SNMP、TCP/IP、Modbus 等)。 |
| 基于 PLC 的控制系統(tǒng),帶有 10 英寸前面板觸摸屏。 | 基于 PLC 的控制系統(tǒng),帶有 10 英寸前面板觸摸屏。 | 內(nèi)置7英寸前面板觸摸屏。 |
| 多語(yǔ)言支持。 | 多語(yǔ)言支持。 | 多語(yǔ)言支持 |
| 集成填充泵和水箱。 | 集成填充泵和水箱。 | 集成填充泵和水箱。 |
| 冗余泵(2N)和風(fēng)扇(N+1)。 | 冗余泵(2N)和風(fēng)扇(N+1)。 | 冗余泵(N+1)和電源 |
| 可選 ATS。 | 可選 ATS。 | |
| 現(xiàn)場(chǎng)可更換的風(fēng)扇、泵、管道和傳感器。 | 現(xiàn)場(chǎng)可更換的風(fēng)扇、泵、管道和傳感器。 | 全不銹鋼管道 |
| 方便接近的排水管和儲(chǔ)水箱。 | 方便接近的排水管和儲(chǔ)水箱。 | 方便接近的排水和儲(chǔ)水箱 |
前期知名媒體評(píng)測(cè)了CoolIT Systems的CDU,并使用 CoolIT 的冷板、歧管和 L2A CDU 改裝了 Dell PowerEdge R760。研究結(jié)果揭示了顯著的好處,包括大幅減少風(fēng)扇使用和電力消耗。DLC 配置還降低了 CPU 溫度并略微提升了性能。此設(shè)置凸顯了液體冷卻對(duì)于現(xiàn)代高功率 AI 和計(jì)算工作負(fù)載日益增長(zhǎng)的必要性,可在數(shù)據(jù)中心環(huán)境中提高效率和性能。
