Nvidia ha rivelato che il suo nuovo server, Rubin Ultra, previsto per il lancio nella seconda metà del 2027, sarà equipaggiato con un numero di GPU otto volte superiore a quello dei modelli attuali. Ogni rack del server conterrà 576 GPU, e avrà un fabbisogno di potenza di fino a 600 kilowatt (kW).

Il 19 marzo, Nvidia ha presentato la sua roadmap per lo sviluppo dei chip fino al 2027 durante l’evento ‘GTC 2025’. Tra le novità, ci sarà il server Blackwell Ultra, previsto per la seconda metà del 2026. Questo server utilizzerà il chip B300 con architettura Blackwell, e sarà dotato di 72 GPU per rack.

Dal 2027, Nvidia introdurrà le nuove GPU basate sull’architettura Rubin. Queste GPU saranno installate nei rack in gruppi da 72, ma saranno collegate in due die, portando il totale a 144 GPU per rack. Il nuovo server, chiamato Rubin Ultra o NVL576, avrà una capacità di 576 GPU per rack, quadruplicando il numero di GPU rispetto ai modelli precedenti.

Il server Rubin Ultra Rack sarà composto da quattro contenitori, ciascuno con 18 blade, dove ogni blade supporterà fino a 8 GPU Rubin Ultra. Questo porta a un totale di 176 GPU per pod e 576 GPU per rack. Il sistema richiederà un’infrastruttura rack chiamata Kyber.

In termini di consumo energetico, il nuovo server richiederà una potenza molto maggiore rispetto ai modelli attuali. Ad esempio, il server GB200 NVL72 disponibile oggi consuma 120 kW per rack, mentre il Rubin Ultra potrebbe arrivare a 600 kW.

L’obiettivo di Nvidia è migliorare significativamente le prestazioni attraverso una maggiore densità di elaborazione e potenza. Il rack Rubin NVL144 offrirà prestazioni fino a 3,6 exaFLOPS, mentre il Rubin Ultra NVL576 raggiungerà 15 exaFLOPS. Per confronto, il server GB200 NVL72 attualmente in commercio ha una potenza di 1 exaFLOPS.

Secondo il CEO Jensen Huang, nei prossimi anni i data center potrebbero necessitare di oltre un megawatt (MW) di potenza per rack di server, con un MW equivalente a 1000 kW.

Di Fantasy