NVIDIA sta sperimentando un modello di fornitura dell’infrastruttura AI che supera la semplice vendita o il noleggio di GPU. Il sistema prevede che startup, cloud provider e operatori di servizi di inferenza possano ricevere crediti di calcolo sotto forma di token, utilizzabili per accedere a capacità GPU ad alte prestazioni senza sostenere immediatamente il costo di grandi cluster hardware. In cambio, quando i servizi AI generano ricavi commerciali, una parte delle entrate viene condivisa con NVIDIA.
Il meccanismo punta a ridurre uno dei principali ostacoli per le aziende che sviluppano modelli, piattaforme di inferenza o applicazioni generative: la necessità di finanziare in anticipo server, data center e contratti pluriennali per la disponibilità di GPU. Nei progetti AI più intensivi, il costo dell’infrastruttura non dipende solo dall’addestramento dei modelli, ma soprattutto dalla capacità necessaria per eseguire inferenza continua, gestire richieste simultanee e mantenere bassa la latenza nell’erogazione dei servizi.
Con questo schema, il calcolo diventa una risorsa che può essere anticipata rispetto ai ricavi. Una startup può utilizzare token di computazione per costruire e distribuire il proprio prodotto, mentre il costo dell’infrastruttura viene collegato alla crescita effettiva del servizio. NVIDIA descrive questa struttura come un modello di guadagno legato all’utilizzo, in cui la società non riceve valore soltanto dalla vendita iniziale delle GPU, ma anche dalla capacità cloud effettivamente utilizzata dai clienti finali.
Il programma include anche un supporto finanziario per gli operatori di AI cloud. I provider possono costruire infrastrutture basate su GPU NVIDIA e monetizzarle attraverso servizi di elaborazione, hosting di modelli e inferenza. NVIDIA partecipa ai ricavi prodotti dalla capacità fornita e, nei casi previsti dagli accordi, può contribuire a ridurre il rischio derivante da GPU non utilizzate, prendendo in affitto una parte della capacità rimasta inattiva. Questo elemento rende più semplice ottenere finanziamenti per nuovi data center, perché aumenta la prevedibilità dei flussi economici associati all’infrastruttura.
Il modello è stato presentato insieme ai primi partner del programma, tra cui Sharon AI in Australia e Permus Tech a Singapore. Sharon AI sta sviluppando un’infrastruttura che può arrivare a 40.000 GPU Grace Blackwell GB300, mentre Permus Tech prevede la realizzazione a Batam, in Indonesia, di una AI factory fino a 360 MW, progettata per ospitare fino a 170.000 GPU. La scala di questi progetti mostra come la strategia non sia pensata soltanto per piccoli team di sviluppo, ma per sostenere nuovi operatori cloud e grandi piattaforme di inferenza.
La novità più rilevante è il passaggio da un modello centrato sull’hardware a una relazione economica più diretta con i servizi costruiti sopra le GPU. NVIDIA collega così parte dei propri ricavi alla produzione e alla vendita di token AI, cioè all’uso effettivo dell’infrastruttura per generare risposte, elaborare dati, eseguire modelli e supportare applicazioni in produzione. In un mercato sempre più orientato all’inferenza, il valore non risiede più solo nella disponibilità dei chip, ma nella capacità di trasformare il calcolo in servizi AI utilizzati in modo costante.
