Immagine AI

Reflection AI ha siglato un accordo di fornitura di capacità computazionale con SpaceX per utilizzare l’infrastruttura del data center Colossus 2 nell’area di Memphis, Tennessee. L’intesa garantisce alla startup accesso immediato ai sistemi basati sui più recenti acceleratori NVIDIA GB300, destinati sia all’addestramento sia all’inferenza di modelli AI di grandi dimensioni.

Il contratto prevede pagamenti da 150 milioni di dollari al mese a partire dal 1° luglio 2026 e fino al 2029. Se mantenuto per tutta la durata, il valore potenziale dell’accordo raggiunge circa 6,3 miliardi di dollari. Dopo i primi tre mesi, entrambe le parti potranno interrompere il rapporto con un preavviso di 90 giorni, una clausola che rende l’impegno economicamente molto rilevante ma non completamente rigido sul piano operativo.

L’elemento tecnico centrale è l’accesso ai chip NVIDIA GB300. Questa generazione di infrastruttura unisce GPU Blackwell, CPU Grace e memoria ad alta larghezza di banda in sistemi pensati per carichi AI ad alta densità. Per un laboratorio che addestra modelli linguistici, multimodali o agentici, la disponibilità di cluster di questo tipo incide direttamente su dimensione dei dataset utilizzabili, numero di esperimenti paralleli, velocità di training, gestione delle finestre di contesto e capacità di servire modelli già addestrati a un numero elevato di utenti.

Reflection AI è una startup fondata nel 2024 da ex ricercatori di Google DeepMind e sostiene una strategia basata su modelli open-weight. In questo contesto, l’accordo non riguarda soltanto la disponibilità di capacità cloud generica: mette a disposizione risorse hardware sufficienti per addestrare e pubblicare modelli con pesi scaricabili, modificabili e distribuibili da sviluppatori, imprese o istituzioni che non vogliono dipendere esclusivamente da API proprietarie.

La scelta di Colossus 2 permette a Reflection di utilizzare un’infrastruttura già configurata per carichi AI di frontiera. Il complesso Colossus era stato costruito inizialmente per i modelli Grok di xAI, poi confluita in SpaceX, e viene ora progressivamente utilizzato anche come piattaforma di capacità computazionale per clienti esterni. Il data center non offre soltanto GPU: per rendere utile un cluster AI servono rete ad alta velocità, storage distribuito, CPU di supporto, memoria, sistemi di raffreddamento e software di orchestrazione in grado di alimentare migliaia di acceleratori senza creare colli di bottiglia durante training e inferenza.

L’accordo di Reflection si inserisce in un’espansione più ampia dell’attività AI infrastrutturale di SpaceX. Nei mesi precedenti la società aveva già stretto intese di capacità computazionale con Anthropic e Google. Reflection rappresenta però un caso distinto, perché il cliente punta a sviluppare modelli open-weight e utilizza il contratto per aumentare la capacità di competere con laboratori che dispongono di infrastrutture proprietarie molto più grandi.

Per Reflection, il compute acquistato può essere impiegato nella fase di pre-training, nel fine-tuning, nella generazione di dati sintetici, nella valutazione dei modelli e nell’inferenza dei prodotti distribuiti. La disponibilità diretta di GB300 può anche ridurre la dipendenza da capacità cloud frammentata, dove un laboratorio deve distribuire job, dataset e checkpoint tra regioni o fornitori diversi. Un cluster dedicato semplifica la gestione di esperimenti lunghi, il recupero dopo errori e l’uso coordinato di grandi batch di addestramento.

La rilevanza dell’intesa sta quindi nel passaggio di SpaceX da utilizzatore interno di supercalcolo AI a fornitore di infrastruttura per laboratori esterni. Per Reflection AI, il contratto crea una base computazionale pluriennale per sviluppare modelli open-weight su scala più vicina a quella dei principali operatori closed-source, pur mantenendo la possibilità di modificare l’accordo attraverso la clausola di uscita dopo il periodo iniziale.

Di Fantasy