L’industria dei data center si trova oggi a un punto di svolta cruciale, segnato da una profonda divergenza architettonica. Mentre alcuni operatori lungimiranti stanno adottando sistemi di raffreddamento di nuova generazione, la maggior parte delle nuove costruzioni continua a basarsi su infrastrutture che rischiano di diventare obsolete nel giro di pochi anni. Questa frattura non è dettata dalla preferenza per un fornitore piuttosto che per un altro, ma è imposta in modo inesorabile dalla fisica e dalle roadmap dei processori che, visibili fino al 2027, spingono i limiti termici a livelli mai visti. La capacità di sostenere la prossima ondata di carichi di lavoro legati all’intelligenza artificiale (AI) dipende interamente dalla scelta del sistema di raffreddamento, trasformando ciò che un tempo era una semplice utility in un fondamentale vantaggio o svantaggio competitivo.
Il raffreddamento dei data center ha attraversato tre distinte ere architettoniche, ciascuna definita da una nuova soglia di densità che la precedente non era più in grado di gestire in modo economico.
La prima generazione, che ha dominato all’incirca dal 2000 al 2023, era interamente basata sul raffreddamento ad aria. Questo sistema ha raggiunto il suo picco di efficacia gestendo densità di potenza comprese tra i 10 e i 15 kilowatt (kW) per rack. Tuttavia, l’arrivo dei carichi di lavoro AI, che hanno iniziato a superare i 20 kW per rack, ha fatto crollare l’economia dell’aria intorno al 2020. I limiti fisici di quanto calore l’aria potesse asportare in modo efficiente hanno reso questa tecnologia largamente obsoleta per le nuove implementazioni ad alta densità già entro il 2023.
La seconda generazione ha rappresentato il primo passo verso il raffreddamento a liquido (dal 2020 al 2027), introducendo il sistema a fase singola. Questo approccio utilizza acqua o miscele a base di glicole (PG25) che operano ad alti tassi di flusso per rimuovere il calore attraverso un semplice cambiamento di temperatura. Sebbene sia una soluzione tecnicamente praticabile per densità che vanno dai 20 ai 120 kW per rack, essa mostra già enormi difficoltà superando i 150 kW.
È qui che si manifesta il “problema fisico” della seconda generazione. I sistemi a base d’acqua richiedono un flusso imponente, pari a circa 1,5 litri al minuto per ogni kilowatt di calore da dissipare. Un rack da 120 kW necessita di circa 180 litri al minuto, un volume che, proiettato su 250 kW, balza a ben 375 litri al minuto, costringendo il liquido a passare attraverso orifizi minuscoli all’interno delle piastre di raffreddamento. Questi elevati tassi di flusso innescano una serie di problemi a cascata: il contatto costante dell’acqua o del glicole favorisce l’ossidazione delle micro-alette metalliche, mentre l’alta velocità del fluido accentua l’erosione di queste strutture. Le richieste di manutenzione hanno sorpreso molti operatori, passando da cambi di filtro trimestrali o semestrali a interventi mensili, oltre al monitoraggio chimico costante. Ancora più preoccupante è il tasso di guasto, con dati interni che suggeriscono che circa il 4% delle GPU raffreddate ad acqua subisca perdite nel corso di un ciclo di vita triennale. Quando un singolo rack può contenere apparecchiature per un valore di 3-5 milioni di dollari, una tale percentuale di guasto ne mina l’economia complessiva in maniera irreparabile. A questo si aggiunge l’inefficienza termodinamica: i sistemi a fase singola richiedono temperature dell’acqua di raffreddamento più basse rispetto ai loro successori, aumentando il fabbisogno di chiller e, di conseguenza, il consumo energetico e i costi operativi (OPEX).
La terza generazione (dal 2024 al 2035 e oltre) rappresenta il vero e proprio cambio di paradigma. Essa combina il raffreddamento bifase con strategie avanzate di reiezione del calore. A differenza della generazione precedente, che si basa sul cambio di temperatura, la Gen 3 sfrutta refrigeranti che assorbono il calore attraverso un cambiamento di fase (liquido che diventa gas e poi ricondensa).
Questo meccanismo riduce i tassi di flusso necessari di un fattore compreso tra quattro e nove, diminuendo drasticamente lo stress sull’infrastruttura, minimizzando l’erosione delle piastre fredde ed eliminando gran parte dell’onere di manutenzione che affligge la Gen 2. Dal punto di vista economico, uno studio comparativo indipendente condotto da Jacobs Engineering ha evidenziato che, nonostante il costo iniziale di investimento (CAPEX) sia sostanzialmente equivalente tra le due generazioni, la Gen 3 offre un vantaggio operativo schiacciante. Grazie alla termodinamica bifase, questi sistemi riescono a mantenere le temperature dei chip ideali utilizzando acqua di raffreddamento della struttura a una temperatura sensibilmente più alta (in media, circa 8°C in più). Ogni grado guadagnato si traduce in circa il 4% in meno di energia annua consumata per il raffreddamento, portando a una riduzione del 35% dei costi operativi (OPEX) documentata dallo studio. Inoltre, la minore energia spesa per il raffreddamento si traduce in un margine termico che gli operatori più astuti possono convertire in un aumento di circa il 5% della capacità di calcolo (più GPU) all’interno dello stesso vincolo di potenza elettrica.
La spinta verso la terza generazione non è un capriccio dei fornitori di raffreddamento, ma un imperativo dettato dalla progettazione dei processori. Le architetture future, come le GPU Rubin di Nvidia e le MI450 di AMD, sono previste superare i 2.000 watt per processore. L’incremento esponenziale della potenza in spazi fisici sempre più ristretti spinge alle stelle il flusso di calore (la concentrazione di calore misurata in watt per centimetro quadrato). Man mano che il flusso termico aumenta, le soluzioni di Generazione 2 raggiungeranno i loro limiti fisici ed economici definitivi: i tassi di flusso diventeranno distruttivi e i costi insostenibili.
La Generazione 3 è stata concepita appositamente per questa realtà. I data center progettati oggi con architetture a fase singola (Gen 2) saranno incapaci di supportare in modo efficiente i processori di classe 2027. Questo crea un grave “dilemma brownfield”: si stanno investendo miliardi in infrastrutture che saranno vincolate e costrette a un costoso retrofit entro i prossimi tre anni. Per gli operatori, la decisione non è più se il cambiamento avverrà, ma se sceglieranno di guidarlo, adottando da subito le architetture Gen 3 che garantiscono la scalabilità oltre i 150 kW, o se saranno costretti ad affrontare la transizione quando i limiti della Generazione 2 renderanno i loro asset irrimediabilmente vincolati e obsoleti.