I costi dei server AI NVIDIA Rubin spingono la memoria al centro della competizione infrastrutturale

La prossima generazione di server AI NVIDIA basata sull’architettura Rubin potrebbe segnare un salto senza precedenti nei costi delle infrastrutture dedicate all’intelligenza artificiale. Secondo le stime di Morgan Stanley, il sistema rack “VR200 NVL72” raggiungerebbe un prezzo di circa 7,8 milioni di dollari per unità, quasi il doppio rispetto agli attuali sistemi GB300 NVL72. L’aumento non sarebbe legato soltanto alle GPU, ma soprattutto all’esplosione dei costi della memoria ad alta velocità e dello storage integrato.

Il VR200 NVL72 rappresenta uno dei sistemi AI più complessi mai progettati da NVIDIA. La piattaforma combina GPU Rubin di nuova generazione con CPU Vera, integrate in un’architettura rack completa che include networking, switch interni, alimentazione, raffreddamento avanzato e PCB ad altissima densità. Il sistema mantiene il telaio “Oberon”, ma introduce un livello di integrazione molto più spinto rispetto alla generazione precedente, con un impatto diretto sulla distinta base hardware complessiva.

Secondo le indiscrezioni circolate nella supply chain, NVIDIA fornirebbe le GPU Rubin ai grandi cloud provider a circa 55.000 dollari per unità, mentre le CPU Vera avrebbero un prezzo intorno ai 5.000 dollari. Tuttavia, il vero elemento critico del nuovo sistema sarebbe la memoria. Morgan Stanley stima infatti che il solo sottosistema memoria del VR200 NVL72 possa arrivare a costare circa 2 milioni di dollari per rack, con un incremento superiore al 400% rispetto alla piattaforma GB300 NVL72.

La componente LPDDR5X assume un ruolo centrale in questa crescita. Il nuovo sistema dovrebbe integrare circa 54 TB di memoria LPDDR5X, oltre tre volte la capacità presente nei sistemi GB200 NVL72. Semianalysis ha stimato che NVIDIA abbia acquistato LPDDR5X a circa 8 dollari per gigabyte nel primo trimestre dell’anno, ma il prezzo potrebbe aumentare ulteriormente a causa della domanda generata dall’AI e dei costi produttivi associati ai moduli SOCAMM2.

Anche mantenendo gli attuali livelli di prezzo, il valore della sola memoria LPDDR5X installata in un singolo rack VR200 NVL72 supererebbe i 400.000 dollari. Se il costo per gigabyte dovesse salire verso i 10 dollari, il valore complessivo della memoria potrebbe oltrepassare i 540.000 dollari, prima ancora dell’applicazione dei margini commerciali NVIDIA.

A incidere ulteriormente sul costo totale contribuisce l’introduzione massiccia di memoria 3D NAND. A differenza delle piattaforme precedenti, il VR200 NVL72 integrerebbe storage NAND ad alte prestazioni per un valore superiore a 1 milione di dollari per rack. Questo cambiamento riflette l’evoluzione dei carichi di lavoro AI, dove inferenza avanzata, agenti autonomi e modelli multimodali richiedono capacità di storage locale molto più elevate e latenze sempre più ridotte.

La crescita delle dimensioni dei modelli AI sta infatti modificando radicalmente la struttura economica dei data center. Se negli ultimi anni il focus era quasi esclusivamente sulla potenza computazionale delle GPU, oggi memoria e storage stanno diventando colli di bottiglia strategici. La diffusione dell’inferenza AI su larga scala e dei sistemi agentici aumenta enormemente il volume di dati temporanei, cache contestuali e checkpoint da gestire in tempo reale, rendendo indispensabili memorie ad altissima banda e storage NAND ultra-performante.

Questo scenario rafforza anche il potere contrattuale dei grandi produttori di memoria. Le aziende che controllano le supply chain di LPDDR5X, HBM4 e NAND enterprise potrebbero diventare tra i principali beneficiari dell’espansione globale dei data center AI. In particolare, il settore si aspetta un incremento della pressione sui prezzi delle memorie avanzate, poiché la domanda infrastrutturale legata all’AI continua a crescere più rapidamente della capacità produttiva disponibile.

I costi dei server AI NVIDIA Rubin spingono la memoria al centro della competizione infrastrutturale

DiFantasy

Di Fantasy

Articoli correlati

Anthropic sospende Claude Fable 5 e Mythos 5 a livello mondiale dopo un ordine del Governo degli Stati Uniti

Meta introduce limiti ai token AI per controllare i costi interni dei modelli generativi

Google presenta Gemini-SQL2 per trasformare il linguaggio naturale in query SQL eseguibili

Ultimi Post

Anthropic sospende Claude Fable 5 e Mythos 5 a livello mondiale dopo un ordine del Governo degli Stati Uniti

Meta introduce limiti ai token AI per controllare i costi interni dei modelli generativi

Google presenta Gemini-SQL2 per trasformare il linguaggio naturale in query SQL eseguibili

Xiaomi rilascia MiMo Code, agente open source per coding AI con memoria a lungo termine