Immagine AI

Micron sta assumendo un ruolo sempre più centrale nella filiera dell’intelligenza artificiale perché la crescita dei data center non dipende più soltanto dalla disponibilità di GPU e acceleratori. I grandi sistemi di training e inferenza richiedono quantità molto elevate di memoria ad alta velocità, necessaria per trasferire grandi volumi di dati tra processore, acceleratore e modelli AI senza creare colli di bottiglia.

La tecnologia più importante in questo scenario è la High Bandwidth Memory, o HBM. A differenza della memoria DRAM tradizionale, la HBM utilizza più stack di chip sovrapposti e collegati attraverso interconnessioni verticali, riducendo le distanze fisiche tra memoria e processore. Questo permette di aumentare drasticamente la banda disponibile e, allo stesso tempo, di migliorare l’efficienza energetica rispetto a soluzioni basate esclusivamente su moduli DDR convenzionali.

Micron sta spingendo in particolare sulle nuove generazioni HBM3E e HBM4, progettate per sostenere carichi AI sempre più pesanti. La HBM4 rappresenta un passaggio rilevante perché porta la memoria a gestire velocità di trasferimento superiori, maggiore densità per stack e consumi più controllati. Per i server che eseguono modelli linguistici di grandi dimensioni, sistemi multimodali o inferenza su larga scala, la memoria non è più un componente secondario: determina direttamente quante richieste possono essere elaborate, quanto velocemente il sistema può recuperare dati e quanto efficacemente può utilizzare le GPU installate.

La domanda di HBM ha modificato anche l’economia della produzione di memoria. Un chip HBM richiede più wafer, più passaggi di packaging avanzato e controlli produttivi più complessi rispetto alla DRAM destinata a PC, smartphone o server tradizionali. La capacità disponibile non può quindi essere aumentata rapidamente. Per questo motivo, le forniture di memoria ad alta banda vengono spesso programmate con accordi pluriennali tra produttori di chip, fornitori di cloud e aziende che costruiscono infrastrutture AI.

Micron ha comunicato che la propria produzione HBM per il 2026 risulta già impegnata, segnale di una domanda che supera ancora la capacità immediatamente disponibile. La situazione riguarda non solo i sistemi dedicati all’addestramento dei modelli, ma anche la crescita dell’inferenza AI, cioè l’uso quotidiano dei modelli da parte di utenti, aziende, assistenti software, motori di ricerca e applicazioni verticali. L’inferenza richiede molta memoria perché i modelli devono restare disponibili, gestire contesti lunghi e rispondere a molte richieste simultanee.

La crescita della domanda AI sta avendo effetti anche sulle memorie convenzionali. I produttori destinano una quota crescente della capacità produttiva a HBM, DDR5 per data center e soluzioni LPDRAM ad alta densità, riducendo la disponibilità relativa per altri segmenti. Questo contribuisce a mantenere sotto pressione l’offerta di DRAM e NAND, con prezzi più sostenuti e margini più elevati per i principali produttori.

I risultati finanziari recenti di Micron riflettono questa trasformazione. Nel terzo trimestre fiscale 2026 l’azienda ha registrato ricavi record per 41,46 miliardi di dollari, contro 23,86 miliardi nel trimestre precedente e 9,30 miliardi nello stesso periodo dell’anno precedente. L’utile netto GAAP è stato pari a 28,24 miliardi di dollari, sostenuto dall’aumento della domanda, dal miglioramento dei prezzi della memoria e dal peso crescente dei prodotti destinati ai data center AI.

Il punto più importante non è però soltanto la crescita dei ricavi. Micron mostra come la memoria stia diventando una componente strategica dell’infrastruttura AI, al pari dei processori grafici e dei sistemi di networking. Senza una quantità sufficiente di memoria ad alta banda, anche gli acceleratori più potenti rischiano di restare inutilizzati per parte del tempo, in attesa dei dati necessari per completare le elaborazioni.

Per le aziende che costruiscono servizi AI, piattaforme cloud o sistemi di calcolo ad alte prestazioni, il tema della memoria diventa quindi una variabile di pianificazione industriale. La scelta della GPU non basta più: occorre valutare disponibilità di HBM, architettura della memoria, consumo energetico, capacità di raffreddamento, tempi di consegna e contratti di fornitura. In questa fase, Micron beneficia proprio del fatto che la memoria non viene più percepita come una commodity intercambiabile, ma come un elemento essenziale per rendere realmente scalabili i data center dedicati all’intelligenza artificiale.

Di Fantasy