Durante la conferenza annuale GTC, il CEO di NVIDIA, Jensen Huang, ha presentato l’architettura GPU Blackwell di prossima generazione dell’azienda, annunciando significativi miglioramenti delle prestazioni per guidare l’evoluzione dell’intelligenza artificiale.
Il cuore pulsante di questa nuova architettura è la GPU di punta B200, caratterizzata da due chiplet all’avanguardia collegati tramite un collegamento da 10 TB/s e contenente 208 miliardi di transistor. Secondo Huang, questa GPU è la più avanzata al mondo in produzione.
Blackwell introduce diverse tecnologie innovative, tra cui un Transformer Engine di seconda generazione per gestire modelli AI più grandi con una precisione di 4 bit, e un’interconnessione NVLink di quinta generazione che permette a un massimo di 576 GPU di lavorare insieme su modelli di trilioni di parametri. Inoltre, un motore di affidabilità AI massimizza il tempo di attività del supercomputer durante i cicli di addestramento.
Rispetto al suo predecessore Hopper, il B200 offre prestazioni AI notevolmente migliorate, con un aumento fino a 2,5 volte per GPU per FP8 e il doppio del throughput per FP16 con il nuovo supporto per il formato FP6. Anche le prestazioni per i modelli linguistici di grandi dimensioni sono migliorate fino a 30 volte. Grandi aziende tecnologiche come Amazon, Google, Microsoft e Tesla hanno già espresso il loro impegno ad adottare Blackwell.
Huang ha illustrato il notevole miglioramento delle prestazioni e dell’efficienza energetica di Blackwell, citando un confronto con l’architettura Hopper. Ad esempio, l’addestramento di un modello GPT-4 con 1,8 trilioni di parametri richiederebbe solo 2.000 GPU Blackwell anziché 8.000 GPU Hopper, con un consumo energetico significativamente inferiore.
NVIDIA mira a ridurre i costi di calcolo e il consumo energetico, rendendo più accessibili i calcoli necessari per l’addestramento dei modelli di prossima generazione.
Per mostrare le dimensioni e la potenza di Blackwell, NVIDIA ha presentato il DGX SuperPOD, un supercomputer AI con un massimo di 576 GPU Blackwell e 11,5 exaflop di capacità di elaborazione AI. Ogni sistema DGX GB200 contiene 36 GPU Blackwell collegate alle CPU Grace basate su Arm.
Anche se inizialmente orientata all’intelligenza artificiale e ai data center, si prevede che l’innovazione di Blackwell porterà vantaggi anche alle GPU destinate al gioco.
Con Blackwell, NVIDIA si conferma leader nel mercato dell’accelerazione AI, aprendo la strada alla prossima svolta nell’intelligenza artificiale.