Immagine AI

Descartes ha annunciato Oasis 3, una nuova generazione di world model progettata per creare ambienti simulati in tempo reale destinati allo sviluppo di veicoli autonomi, robot e sistemi di automazione avanzata. La piattaforma introduce un elemento particolarmente significativo per il settore: la disponibilità commerciale tramite API, che consente agli sviluppatori di integrare direttamente la generazione di scenari dinamici all’interno dei propri workflow di addestramento, validazione e simulazione.

L’obiettivo dell’azienda è trasformare i world model in una componente infrastrutturale accessibile in modo simile a quanto avvenuto negli ultimi anni con i modelli linguistici. Se le API dei Large Language Model hanno permesso agli sviluppatori di incorporare capacità di ragionamento e generazione testuale all’interno delle applicazioni, Oasis 3 punta a fare lo stesso con la simulazione fisica e ambientale, consentendo la creazione programmabile di mondi virtuali realistici.

La piattaforma deriva da Lucy, il motore di generazione video in tempo reale sviluppato da Descartes negli ultimi due anni. Lucy è già utilizzato da oltre centomila sviluppatori per applicazioni legate all’e-commerce, al live commerce e alla generazione di contenuti interattivi. Con Oasis 3, l’azienda estende questa tecnologia al settore della Physical AI, spostando il focus dalla semplice generazione video alla creazione di ambienti navigabili e reattivi destinati all’interazione con agenti autonomi.

Oasis 3 utilizza modelli generativi capaci di costruire scenari completi partendo esclusivamente da istruzioni testuali. Una descrizione come “una strada attorno alla Torre Eiffel durante una nevicata notturna” viene trasformata in un ambiente tridimensionale realistico che può essere esplorato da un veicolo autonomo o da un robot. Tuttavia, la vera innovazione non risiede nella qualità visiva della scena, ma nella sua capacità di evolvere dinamicamente in risposta alle azioni dell’agente che vi opera.

A differenza dei simulatori tradizionali, nei quali gli ambienti vengono costruiti in modo statico e successivamente riprodotti, Oasis 3 genera continuamente nuovi fotogrammi durante l’esecuzione della simulazione. Il sistema opera in modalità closed-loop, mantenendo un ciclo continuo tra percezione e azione. Ogni movimento effettuato dal veicolo modifica l’ambiente che viene generato nel fotogramma successivo, creando una simulazione che si evolve costantemente nel tempo.

Questo approccio risulta particolarmente interessante per affrontare uno dei problemi più complessi nello sviluppo della guida autonoma: i cosiddetti scenari a coda lunga. Si tratta di situazioni estremamente rare che possono verificarsi poche volte nella vita operativa di un veicolo ma che devono essere gestite correttamente per garantire la sicurezza del sistema. Eventi come attraversamenti improvvisi, condizioni meteorologiche estreme, comportamenti anomali degli altri veicoli o situazioni di traffico impreviste sono difficili da raccogliere nel mondo reale ma possono essere generati in quantità praticamente illimitata all’interno di un world model.

La disponibilità tramite API rappresenta un elemento distintivo rispetto alla maggior parte dei progetti concorrenti nel settore. Gli sviluppatori possono creare ambienti simulati attraverso semplici chiamate programmatiche e integrarli direttamente nelle pipeline di addestramento e validazione esistenti. Questo consente di automatizzare la generazione di scenari di test e di adattare dinamicamente le simulazioni alle esigenze specifiche dei diversi sistemi autonomi.

Per supportare questo approccio, Descartes sta sviluppando un ecosistema software che ricorda per molti aspetti i moderni SDK utilizzati per costruire applicazioni AI. L’azienda punta a fornire strumenti che permettano agli sviluppatori di programmare, configurare e controllare i mondi simulati con lo stesso livello di flessibilità con cui oggi utilizzano API per modelli linguistici o servizi cloud.

Un aspetto particolarmente importante riguarda l’efficienza computazionale. Oasis 3 è costruito sopra il Descartes Optimization Stack (DOS), uno stack software proprietario progettato per ottimizzare l’esecuzione dei modelli AI su infrastrutture NVIDIA e ambienti cloud. Secondo l’azienda, questo sistema consente di raggiungere livelli di efficienza fino a cento volte superiori rispetto ad altre implementazioni concorrenti, permettendo la generazione di ambienti in tempo reale a costi sostenibili.

L’infrastruttura utilizza AI Cloud di CoreWeave e sistemi NVIDIA HGX B200 per raggiungere prestazioni pari a 22 fotogrammi al secondo con risoluzione 512×768 e latenze inferiori ai 200 millisecondi. Questi valori risultano particolarmente rilevanti perché determinano la capacità del sistema di reagire rapidamente alle azioni dei veicoli o dei robot durante la simulazione.

Nonostante i progressi ottenuti, Descartes riconosce che la tecnologia presenta ancora alcune limitazioni. Le simulazioni molto lunghe tendono a perdere progressivamente coerenza spaziale, con scenari che possono modificarsi nel tempo in modo non realistico. Anche la modellazione delle collisioni fisiche non è ancora perfetta e può produrre comportamenti incompatibili con le leggi della fisica reale. L’azienda sta lavorando sull’espansione della memoria e della lunghezza del contesto del modello per affrontare questi problemi.

L’annuncio arriva in un momento di forte competizione nel settore dei world model. Aziende e laboratori di ricerca stanno investendo massicciamente in sistemi capaci di simulare ambienti fisici realistici per robot e veicoli autonomi. Tra i concorrenti figurano progetti come Genie 3 di Google e le tecnologie sviluppate da World Labs, la startup fondata da Fei-Fei Li. Tuttavia, la disponibilità immediata tramite API distingue Oasis 3 da molte soluzioni ancora limitate a contesti sperimentali o di ricerca.

Con una recente raccolta di capitale da 300 milioni di dollari che ha portato la valutazione dell’azienda a 4 miliardi di dollari e con il supporto di investitori come NVIDIA, Toyota, Adobe ed eBay, Descartes sta cercando di posizionarsi come uno dei principali fornitori di infrastrutture per la Physical AI. L’ambizione è replicare nel mondo dei modelli ambientali ciò che le API dei modelli linguistici hanno rappresentato per l’intelligenza artificiale generativa: una piattaforma programmabile sulla quale sviluppatori e aziende possano costruire una nuova generazione di applicazioni autonome.

Di Fantasy