La grave crisi delle GPU è ormai alle porte, proprio come aveva avvertito Elon Musk, il capo di Tesla, nell’industria tecnologica. Fin dall’aprile di quest’anno, Musk ha sollevato preoccupazioni riguardo all’enorme domanda di GPU e la conseguente carenza. Ora, a partire da agosto 2023, il settore tecnologico sta affrontando una grave carenza delle molto richieste NVIDIA H100. Questa scarsità sta avendo un impatto significativo sulle aziende di intelligenza artificiale che dipendono pesantemente da queste GPU per l’addestramento dei modelli e le attività di inferenza.
Diverse personalità del settore, tra cui Andrej Karpathy di OpenAI, hanno espresso le loro preoccupazioni riguardo alla situazione delle GPU. Anche aziende di spicco come AWS Lambda e CoreWeave, oltre ai principali fornitori di servizi cloud come Azure, Google Cloud, AWS e Oracle, stanno cercando disperatamente di ottenere le NVIDIA H100.
Si stima che solo OpenAI abbia bisogno di circa 50.000 GPU H100, Inflexion AI circa 22.000 unità e Meta potrebbe addirittura aver bisogno di oltre 100.000 unità. Questi numeri portano la domanda totale di GPU H100 a circa 432.000 unità, con un valore di circa 15 miliardi di dollari, tutto a beneficio di NVIDIA.
La situazione è così critica che alcune aziende potrebbero essere costrette a esplorare opzioni alternative per soddisfare le loro esigenze di potenza computazionale nel campo dell’intelligenza artificiale.
L’acquisizione delle GPU è diventata una delle principali preoccupazioni per le aziende di intelligenza artificiale, con ritardi nelle implementazioni dei prodotti e nella formazione dei modelli. Questa crescente richiesta di potenza computazionale è stata un fattore chiave che ha portato alla carenza di componenti essenziali utilizzati nella produzione di GPU.
Mentre NVIDIA ha sostenuto molte startup nel settore dell’intelligenza artificiale, la sua posizione di monopolio ha creato una dipendenza da parte delle altre aziende, mettendola di fronte alla sfida di soddisfare la crescente domanda di GPU. La complessità del processo di produzione delle GPU e la necessità di vari componenti critici come la memoria, la velocità di interconnessione, le cache e le latenze della cache, hanno contribuito alla scarsità complessiva di queste componenti.
La speranza è che l’aumento dell’offerta e i progressi nella tecnologia delle GPU possano alleviare la crisi. Ad esempio, NVIDIA ha parlato del rilascio di A800, ma è ancora incerto se possa soddisfare appieno la domanda. Fino ad allora, le aziende di intelligenza artificiale dovranno cercare alternative e collaborazioni per continuare il loro cruciale lavoro nel campo dell’intelligenza artificiale.
Tuttavia, esiste la preoccupazione che la scarsità stessa possa portare a un ciclo auto-rafforzante, aggravando la situazione. Il futuro rimane incerto, ma si spera che soluzioni innovative e ulteriori sviluppi tecnologici possano risolvere questa crisi delle GPU.