Nvidia ha rivelato oggi l’espansione dell’accessibilità della sua intelligenza artificiale basata su cloud, DGX Cloud. Questo servizio fornirà agli utenti l’opportunità di accedere a migliaia di GPU virtuali Nvidia su Oracle Cloud Infrastructure (OCI), sia negli Stati Uniti che nel Regno Unito.
Presentato inizialmente durante la conferenza GTC di Nvidia a marzo, DGX Cloud è progettato per offrire alle imprese l’infrastruttura e il software necessari per addestrare modelli avanzati nell’IA generativa e in altri ambiti che sfruttano l’IA.
Secondo Tony Paikeday, direttore senior delle piattaforme DGX di Nvidia, l’infrastruttura su cui si basa DGX Cloud è stata appositamente costruita per soddisfare le elevate richieste dell’IA generativa, consentendo l’addestramento di grandi e complessi modelli linguistici.
L’architettura di elaborazione di DGX Cloud si basa su grandi cluster di istanze DGX Cloud dedicate, interconnesse tramite un tessuto di rete Nvidia ad altissima larghezza di banda e a bassa latenza. L’obiettivo è semplificare la gestione di infrastrutture complesse e fornire un’esperienza di “AI senza server” agli sviluppatori, permettendo loro di concentrarsi sugli esperimenti, la prototipazione e l’implementazione di modelli in modo più rapido e senza preoccuparsi delle questioni infrastrutturali.
In precedenza, le organizzazioni che desideravano sviluppare modelli di intelligenza artificiale generativa avevano solo l’opzione di utilizzare un’infrastruttura di data center on-premise. Con l’introduzione di DGX Cloud, qualsiasi organizzazione può ora accedere in remoto al proprio supercomputer AI per addestrare grandi e complessi modelli AI generativi direttamente dal proprio browser, senza la necessità di gestire un costoso data center di supercalcolo.
Secondo Nvidia, l’offerta di DGX Cloud permette agli sviluppatori di IA generativa di distribuire carichi di lavoro pesanti su più nodi di elaborazione in parallelo, ottenendo velocità di formazione fino a due o tre volte superiori rispetto al cloud computing tradizionale.
Con DGX Cloud, le aziende possono stabilire il proprio “centro di eccellenza AI”, supportando grandi team di sviluppatori che lavorano contemporaneamente su numerosi progetti di intelligenza artificiale. Grazie a un pool di capacità di supercalcolo che si adatta automaticamente alle esigenze dei carichi di lavoro dell’IA, i progetti possono beneficiare di un’efficace accelerazione dei processi.
Secondo McKinsey, l’IA generativa potrebbe apportare un contributo di oltre 4 trilioni di dollari all’anno all’economia globale, trasformando le conoscenze aziendali proprietarie in nuove applicazioni AI di generazione successiva.
Il rapido sviluppo dell’IA generativa ha spinto le aziende leader di diversi settori a considerare l’IA come un imperativo aziendale, aumentando la richiesta di infrastrutture informatiche avanzate. In risposta a questa crescente domanda, Nvidia ha ottimizzato l’architettura di DGX Cloud per soddisfare le esigenze computazionali in costante crescita.
Con l’utilizzo di Nvidia Base Command Platform e Nvidia AI Enterprise, DGX Cloud mira a risolvere le sfide che gli sviluppatori spesso affrontano nella preparazione dei dati, nella creazione di prototipi iniziali e nell’efficiente utilizzo delle risorse GPU. Questo consentirà loro di ottenere modelli pronti per la produzione in modo più rapido ed efficiente, grazie alla scienza dei dati accelerata, ai framework AI ottimizzati e a una suite di modelli AI pre-addestrati.
Amgen, un’azienda di biotecnologie, ha già iniziato a utilizzare DGX Cloud per accelerare la scoperta di farmaci. Sfruttando il software Nvidia BioNeMo e Nvidia AI Enterprise insieme alle librerie di accelerazione della scienza dei dati Nvidia RAPIDS, Amgen ha riferito di essere in grado di analizzare rapidamente trilioni di sequenze di anticorpi tramite DGX Cloud, accelerando lo sviluppo di proteine sintetiche.
Nvidia offrirà istanze DGX Cloud su base mensile, ciascuna dotata di otto potenti GPU Nvidia Tensor Core da 80 GB, fornendo 640 GB di memoria GPU per nodo.
Il sistema di DGX Cloud utilizza un fabric ad alte prestazioni e bassa latenza, che consente il ridimensionamento dei carichi di lavoro tra cluster interconnessi, trasformando diverse istanze in un’enorme GPU unificata. Inoltre, l’offerta comprende Nvidia AI Enterprise, un livello software con oltre 100 framework AI end-to-end e modelli pre-addestrati, per facilitare le pipeline di data science accelerate e accelerare lo sviluppo e l’implementazione dell’IA di produzione.
Tony Paikeday di Nvidia ha dichiarato che DGX Cloud offre non solo grandi risorse computazionali, ma consente anche ai data scientist di essere più produttivi e di utilizzare in modo efficiente le proprie risorse. Con la possibilità di avviare diversi lavori contemporaneamente e di eseguire più programmi di intelligenza artificiale generativa in parallelo, il supporto degli esperti di intelligenza artificiale di Nvidia aiuta a ottimizzare il codice e i carichi di lavoro dei clienti.