Immagine AI

La capacità di elaborare enormi volumi di dati in tempi ridotti è fondamentale per alimentare modelli complessi e applicazioni avanzate. Per rispondere a questa esigenza, Oracle e AMD hanno annunciato una collaborazione strategica volta a potenziare le capacità di calcolo per carichi di lavoro IA su larga scala. Questa alleanza mira a offrire ai clienti soluzioni altamente performanti e scalabili, sfruttando l’infrastruttura cloud di Oracle e le avanzate GPU AMD Instinct MI355X.

Al centro di questa collaborazione c’è l’introduzione delle GPU AMD Instinct MI355X nella piattaforma Oracle Cloud Infrastructure (OCI). Queste GPU sono progettate per offrire prestazioni eccezionali in applicazioni di IA generativa e agentica, grazie a caratteristiche tecniche all’avanguardia:

  • Memoria HBM3: Ogni GPU è dotata di 288 GB di memoria HBM3, con una larghezza di banda fino a 8 terabyte al secondo, consentendo l’elaborazione di modelli di linguaggio di grandi dimensioni (LLM) e applicazioni IA complesse.
  • Supporto per FP4: L’introduzione del formato di calcolo a 4 bit (FP4) permette un’elaborazione ultra-efficiente, riducendo i costi e migliorando la velocità di inferenza per modelli generativi.
  • Architettura RDMA a bassa latenza: La rete ad alta velocità e bassa latenza consente una comunicazione rapida tra le GPU, essenziale per l’addestramento e l’inferenza di modelli distribuiti su larga scala.

Oracle si prepara a implementare un cluster IA zettascale su OCI, supportando fino a 131.072 GPU MI355X. Questa infrastruttura è progettata per affrontare le sfide poste dalle applicazioni IA moderne, offrendo:

  • Elevata densità di calcolo: Ogni rack ospita 64 GPU, con un consumo energetico di 1.400 watt per GPU, gestito tramite un sistema di raffreddamento a liquido che consente un’efficienza energetica ottimale.
  • Elaborazione ad alte prestazioni: L’architettura supporta l’esecuzione di modelli complessi interamente in memoria, riducendo i tempi di risposta e migliorando l’efficienza complessiva.
  • Flessibilità e sicurezza: OCI offre un’architettura cloud flessibile, sicura e conforme, ideale per applicazioni IA aziendali e governative che richiedono elevati standard di protezione dei dati.

Per garantire la massima interoperabilità e flessibilità, Oracle e AMD hanno adottato il software stack open-source AMD ROCm. Questo stack include strumenti, compilatori e librerie che supportano framework IA popolari come TensorFlow, PyTorch e JAX, permettendo agli sviluppatori di migrare facilmente i loro carichi di lavoro su OCI senza vincoli di fornitore.

Questa collaborazione rappresenta un passo significativo nell’evoluzione dell’infrastruttura IA, offrendo alle imprese la possibilità di accedere a risorse di calcolo avanzate senza la necessità di investimenti in hardware proprietario. La combinazione delle capacità di calcolo di AMD con l’infrastruttura cloud di Oracle consente alle aziende di sviluppare, addestrare e implementare applicazioni IA su larga scala in modo più efficiente e conveniente.

Inoltre, l’adozione di standard aperti favorisce l’innovazione e la collaborazione nell’ecosistema IA, riducendo la dipendenza da soluzioni proprietarie e promuovendo la crescita di un ambiente tecnologico più inclusivo e competitivo.

Di Fantasy