L’Intelligenza Artificiale continua la sua marcia inesorabile verso la comprensione e la riproduzione della realtà, e oggi si assiste a un salto qualitativo che sposta il focus dal linguaggio puro alla costruzione dello spazio. Un anno dopo il suo annuncio, World Labs, l’azienda fondata dalla rinomata professoressa di Stanford Feifei Li, spesso acclamata come la “madrina dell’intelligenza artificiale”, ha ufficialmente lanciato il suo primo “Modello del Mondo” commerciale. Questo prodotto pionieristico, battezzato Marble, non è soltanto un avanzamento tecnico, ma una vera e propria commercializzazione di una frontiera della ricerca che finora era rimasta confinata ai laboratori di giganti come Google, Meta e Descartes.
Il lancio di Marble, avvenuto dopo una fase beta ristretta, segna un trionfo per World Labs, che esce così dalla fase di stealth forte di un investimento di 230 milioni di dollari ottenuto lo scorso anno. Il modello è una piattaforma straordinaria che consente agli utenti di creare e scaricare ambienti 3D completamente modificabili a partire da una vasta gamma di input: semplici prompt di testo, fotografie, riprese video, progetti 3D esistenti e immagini panoramiche.
Ciò che rende Marble un’innovazione così significativa è il suo fondamento nell'”intelligenza spaziale”, una tecnologia che si concentra sull’osservazione, la comprensione e la costruzione del mondo reale. Il Modello del Mondo genera una rappresentazione digitale interna, che permette all’IA di comprendere e prevedere l’ambiente, rendendolo uno strumento indispensabile per la simulazione e la pianificazione di azioni future. I modelli mondiali finora esistenti presentavano il problema critico dell’incoerenza, poiché generavano l’ambiente in tempo reale durante l’esplorazione, risultando in distorsioni e incongruenze. Marble supera questa limitazione con la sua capacità distintiva di creare “ambienti 3D persistenti e scaricabili”. Una volta ultimato, l’ambiente tridimensionale può essere esportato in formati standard e avanzati, inclusi mesh, video e splat gaussiani, garantendo stabilità e fedeltà.
L’unicità di Marble è amplificata dalle sue funzionalità di editing. È il primo software di modellazione al mondo a offrire strumenti di editing basati sull’IA combinati con un editor 3D ibrido. Gli utenti possono iniziare posizionando strutture spaziali basilari, come muri, scatole e piani in una forma a blocchi, per poi definirne lo stile visivo e i dettagli tramite prompt di testo. Come ha spiegato Justin Johnson, co-fondatore di World Labs, il processo è analogo a “creare una struttura con HTML e definirne lo stile con CSS”. Johnson ha sottolineato che la vera innovazione non risiede solo nel risultato prodotto dall’IA, ma nel fatto che essa consenta agli utenti di mantenere il controllo creativo sul processo, rendendo il sistema immediatamente utilizzabile in ambienti di produzione reali come lo sviluppo di videogiochi, gli effetti visivi cinematografici (VFX) e la realtà virtuale (VR).
Le applicazioni sono estremamente vaste. Gli sviluppatori di videogiochi possono importare sfondi o spazi interattivi creati in Marble direttamente in motori come Unity o Unreal Engine, accelerando notevolmente il processo di creazione delle risorse. Nei VFX, il modello risolve problemi come l’instabilità del controllo della telecamera nella generazione di immagini AI. Per la realtà virtuale, può fornire ambienti che possono essere eseguiti in modo fluido su visori all’avanguardia come Vision Pro o Quest 3. Un altro campo di potenziale rivoluzione è la robotica: la capacità di generare ambienti simulati realistici e su larga scala risolve la cronica mancanza di dati di addestramento reali per i robot, fornendo un terreno virtuale essenziale per le simulazioni.
Il CEO Feifei Li ha incorniciato questa impresa con una visione più ampia: “Se i modelli linguistici insegnano alle macchine a leggere e scrivere, i modelli del mondo consentiranno alle macchine di vedere, comprendere e costruire lo spazio”. Marble è definito come il “primo passo verso l’intelligenza spaziale”, una base tecnologica che, secondo Li, è fondamentale per creare macchine veramente intelligenti e che servirà, in ultima analisi, come fondamento per progredire nella comprensione umana del mondo fisico, compresi campi critici come la scienza e la medicina.
