Microsoft ha ufficialmente lanciato la più recente macchina virtuale denominata “ND H100 v5,” basata sulla potente GPU H100. Questo arriva dopo il precedente modello di macchina virtuale basato sulla GPU NVIDIA A100, noto come “ND A100 v4,” destinato all’intelligenza artificiale (AI).
Questa nuova macchina virtuale offre un’infrastruttura informatica su larga scala, ideale per l’addestramento e l’esecuzione di modelli di linguaggio di grandi dimensioni (LLM). La VM ND H100 v5 rappresenta un passo avanti notevole in termini di capacità di elaborazione ed è al momento disponibile nelle regioni degli Stati Uniti orientali e centro-meridionali.
Le prestazioni di base della VM ND H100 v5 sono basate su processori Intel Xeon di quarta generazione della serie Sapphire Rapids, ed è dotata di 8 GPU Nvidia H100 e 16 canali di memoria DIM DDR5 che operano a 4800 MHz.
Un aspetto distintivo di questa macchina virtuale è la sua flessibilità nell’espansione delle risorse di calcolo per lo sviluppo di IA su vasta scala. In particolare, la capacità di GPU può essere estesa da 8 unità base a centinaia di migliaia sfruttando la tecnologia Quantum 2 InfiniBand di Nvidia.
Con una larghezza di banda di 400 gigabit al secondo tra le GPU e 3,2 terabit al secondo tra le macchine virtuali, il sistema Quantum 2 InfiniBand di NVIDIA garantisce prestazioni di prim’ordine su tutte le GPU. Inoltre, con l’integrazione di PCIe Gen5, offre una velocità di trasferimento dati di 64 gigabyte al secondo per GPU e supporta la memoria DDR5, migliorando la gestione di grandi volumi di dati di addestramento AI.
Microsoft afferma che la VM ND H100 v5 può effettuare operazioni di moltiplicazione delle matrici fino a 6 volte più velocemente e raggiunge velocità di inferenza fino a 2 volte superiori rispetto a LLM, come dimostrato dall’inferenza del modello BLOOM 175B. Inoltre, sottolinea come sia possibile costruire ambienti di supercalcolo exascale in cloud e sviluppare modelli AI o LLM generativi.
Parallelamente all’introduzione di questa nuova macchina virtuale, Microsoft ha ampliato il servizio Azure OpenAI, che ora include i modelli GPT-4 e GPT-35-Turbo di OpenAI. Inizialmente disponibile solo in alcune regioni come Stati Uniti orientali, Francia centrale, Stati Uniti centro-meridionali ed Europa occidentale, il servizio Azure OpenAI è stato esteso a nuove aree, tra cui Canada orientale, Stati Uniti orientali 2, Giappone orientale e Regno Unito meridionale.
Microsoft ha dichiarato che il servizio Azure OpenAI è già adottato da oltre 11.000 aziende e continua a guadagnare circa 100 nuovi utenti al giorno. Needy Chapelle, general manager di Microsoft Azure, ha commentato: “Con questa espansione, stiamo rendendo il nostro modello di intelligenza artificiale generativa più avanzato, il GPT-4, disponibile in nuove aree geografiche”.