NVIDIA, leader nel settore delle unità di elaborazione grafica (GPU), sta attualmente affrontando sfide significative con la sua ultima generazione di GPU, denominate Blackwell. Queste problematiche riguardano principalmente il surriscaldamento dei server ad alta densità che ospitano queste GPU, sollevando preoccupazioni tra i principali clienti dell’azienda, tra cui Microsoft, Meta e xAI.
Secondo un rapporto del 15 novembre 2024, citato da The Information, le GPU Blackwell, quando installate in server con 72 unità, tendono a surriscaldarsi. Questi server consumano fino a 120 kilowatt (kW) per rack, un valore elevato che può portare a una riduzione delle prestazioni delle GPU e potenzialmente danneggiare i componenti interni. Per affrontare questa situazione, NVIDIA ha collaborato con i fornitori per modificare il design dei rack dei server, implementando miglioramenti nel sistema di raffreddamento. Tuttavia, queste modifiche hanno comportato ritardi nella produzione e nella consegna dei server ai clienti.
Nonostante queste difficoltà, NVIDIA ha dichiarato di non aver ancora informato ufficialmente i clienti di eventuali ritardi e prevede di rispettare le scadenze originali, con le prime consegne dei server Blackwell previste entro la fine del primo semestre del 2025. Tuttavia, alcuni clienti stanno valutando l’opzione di continuare a utilizzare le GPU della generazione precedente, note come Hopper (H100 e H200), che, sebbene offrano prestazioni inferiori rispetto alle Blackwell (G100 e G200), hanno dimostrato maggiore stabilità e affidabilità.
È importante notare che le GPU Blackwell avevano già subito ritardi nella produzione a causa di problemi di progettazione, con la produzione di massa avviata solo alla fine di ottobre 2024 e le prime spedizioni previste per gennaio 2025. Questi ulteriori problemi di surriscaldamento potrebbero influenzare ulteriormente la tempistica di distribuzione e l’adozione da parte dei clienti.