Nvidia sta attivamente ampliando i confini dell’informatica alla conferenza GTC a San Jose. Il CEO Jensen Huang ha annunciato il GB200 Grace Blackwell Superchip, promettendo prestazioni migliorative fino a 30 volte per i carichi di lavoro di inferenza del modello. Ha condiviso anche sviluppi importanti in settori come l’automotive, la robotica, l’omniverse e la sanità.
Parte integrante del GTC sono le partnership industriali. Nvidia ha illustrato come sta collaborando con giganti del settore per portare la sua infrastruttura, software e servizi AI nelle loro piattaforme. Di seguito sono riportate le principali partnership annunciate:
- AWS offrirà la piattaforma Blackwell di Nvidia su istanze EC2, consentendo ai clienti di eseguire inferenza su LLM multimiliardari a un costo inferiore.
- Google integrerà la piattaforma Grace Blackwell di Nvidia nella sua infrastruttura cloud e supporterà JAX e Nvidia NeMo.
- Microsoft aggiungerà i microservizi NIM e Grace Blackwell ad Azure, oltre a collaborare per la ricerca clinica nel settore sanitario.
- Oracle implementerà la piattaforma Grace Blackwell tra le istanze OCI Supercluster e OCI Compute e integrerà i microservizi Nvidia NIM e CUDA-X.
- SAP integrerà l’intelligenza artificiale generativa nelle sue soluzioni cloud utilizzando le tecnologie di Nvidia.
- IBM Consulting combinerà la propria tecnologia con il software AI Enterprise di Nvidia per accelerare i flussi di lavoro AI dei clienti.
- Snowflake integrerà NeMo Retriever per migliorare le prestazioni delle applicazioni chatbot.
- Altri fornitori di piattaforme dati come Box, Dataloop, Cloudera e altri utilizzeranno i microservizi Nvidia per ottimizzare le pipeline di AI generativa.
La conferenza Nvidia GTC 2024 si tiene dal 18 al 21 marzo a San Jose e online.