Immagine AI

NVIDIA ha presentato per la piattaforma Vera Rubin una nuova architettura di raffreddamento pensata per i data center AI ad altissima densità, basata su ingresso del liquido fino a 45 °C. La scelta appare controintuitiva rispetto ai tradizionali impianti con acqua refrigerata, ma risponde alla necessità di ridurre il peso energetico dei chiller e di usare più direttamente l’aria esterna per smaltire il calore prodotto da GPU, CPU, switch NVLink e componenti di rete.

La soluzione è parte della terza generazione dell’architettura rack NVIDIA MGX, progettata per ospitare i sistemi Vera Rubin NVL72 e gli altri rack della piattaforma Vera Rubin POD. NVIDIA indica una configurazione completamente liquid-cooled: i tray di calcolo, gli switch tray, i busbar di alimentazione e le altre parti ad alta dissipazione sono progettati per funzionare senza ventilatori interni. Il rack elimina quindi la classica combinazione tra aria fredda distribuita nel data center e ventole ad alta velocità presenti nei server.

Il liquido circola in un circuito chiuso attraverso cold plate, collettori interni ai tray, manifold rack-level e unità di distribuzione del refrigerante. NVIDIA indica che il fluido può essere acqua deionizzata oppure una miscela a base di glicole propilenico, come PG25, cioè circa 75% acqua e 25% glicole propilenico. La miscela viene scelta soprattutto quando servono maggiori margini contro corrosione, gelo o variazioni ambientali, mentre il circuito chiuso riduce necessità di rabbocco e manutenzione del liquido nel tempo.

L’elemento centrale è l’uso di acqua “calda” a 45 °C, pari a 113 °F, in ingresso ai rack. NVIDIA dichiara che l’architettura è progettata per funzionare stabilmente con questa temperatura, evitando di portare l’acqua a valori molto più bassi prima della distribuzione ai sistemi. Nel layout indicato dall’azienda, l’infrastruttura può fornire acqua intorno ai 41 °C alle coolant distribution unit, che poi alimentano i rack fino a 45 °C.

Il vantaggio deriva dalla possibilità di utilizzare dry cooler e free cooling. In un data center tradizionale, il chiller deve comprimere refrigerante e sottrarre calore all’acqua per mantenerla a temperature relativamente basse, con un consumo elettrico rilevante. Con un ingresso a 45 °C, il sistema può invece utilizzare più spesso l’aria esterna e radiatori a circuito chiuso per dissipare il calore senza far lavorare continuamente i compressori. In condizioni climatiche favorevoli, restano attivi soprattutto pompe e ventilatori dei dry cooler, con un impatto inferiore rispetto a un impianto basato su chiller.

NVIDIA collega questa configurazione anche alla riduzione del consumo idrico. I sistemi tradizionali che utilizzano cooling tower disperdono acqua attraverso evaporazione. Il modello a circuito chiuso con dry cooler evita invece questa perdita continua e può avvicinare il consumo operativo di acqua per il raffreddamento a zero, almeno dove il clima consente di usare il free cooling per gran parte dell’anno. Il risparmio non riguarda tuttavia l’intera impronta idrica dell’infrastruttura AI, perché la produzione dell’elettricità necessaria ad alimentare il data center può richiedere comunque acqua e altre risorse.

La temperatura più alta permette inoltre di destinare una quota maggiore della potenza disponibile al calcolo. NVIDIA sostiene che il raffreddamento a 45 °C possa liberare capacità elettrica altrimenti assorbita dai sistemi frigoriferi, consentendo di installare fino al 30% di GPU in più a parità di budget energetico in determinate configurazioni. L’azienda indica anche la possibilità di aggiungere fino al 10% di rack Vera Rubin NVL72 nella stessa disponibilità di potenza, grazie alla minore energia richiesta per il raffreddamento.

La piattaforma Vera Rubin NVL72 integra 72 GPU Rubin e 36 CPU Vera in un rack collegato tramite NVLink. La densità di calcolo e il numero di componenti rendono il raffreddamento una parte strutturale del progetto, non un sistema esterno aggiunto dopo l’installazione. NVIDIA parla di circa 1,3 milioni di componenti e quasi 1.300 chip in un singolo rack, con un’architettura meccanica pensata per ridurre cablaggi, tubazioni e interventi di manutenzione sui tray.

Il passaggio a rack fanless e a ingresso del liquido a 45 °C modifica quindi la progettazione dell’intero data center. Il sistema non richiede soltanto GPU predisposte per il liquid cooling, ma CDU, tubazioni, scambiatori, dry cooler, controlli di portata, rilevamento perdite e una gestione termica progettata insieme alla distribuzione elettrica. NVIDIA inserisce questi elementi nella piattaforma Vera Rubin DSX, riferimento infrastrutturale che unifica calcolo, rete, storage, alimentazione, raffreddamento e controlli di impianto per costruire AI factory su scala di più rack e più megawatt.

Di Fantasy