Il recente round di finanziamento da un miliardo di dollari ottenuto da World Labs, la startup fondata dalla pioniera dell’intelligenza artificiale Fei-Fei Li, segna il passaggio definitivo dall’era dell’IA basata sulla pura semantica testuale a quella dell’intelligenza spaziale. Mentre i Large Language Models (LLM) hanno dimostrato capacità straordinarie nel manipolare i simboli del linguaggio, essi rimangono intrinsecamente privi di una comprensione fisica e tridimensionale della realtà. Il progetto di World Labs mira a colmare questo divario attraverso lo sviluppo dei cosiddetti “Large World Models” (LWM), sistemi progettati non solo per generare immagini o video, ma per costruire, simulare e interagire con mondi digitali persistenti, coerenti e regolati dalle leggi della geometria e della fisica.
Al centro di questa rivoluzione tecnologica si trova “Marble”, il primo prodotto commerciale di World Labs, che funge da motore di generazione spaziale multimodale. A differenza dei modelli di diffusione video tradizionali, che operano su una sequenza di pixel bidimensionali cercando di indovinare il frame successivo, Marble opera sollevando i segnali di input (testo, immagini, video o panorami a 360 gradi) in una rappresentazione tridimensionale completa. Tecnicamente, il sistema non si limita a generare mappe di profondità o nuvole di punti; esso costruisce mondi dotati di persistenza spaziale. Questo significa che se un utente si sposta all’interno di un ambiente generato e poi ritorna al punto di partenza, gli oggetti e le strutture rimangono esattamente dove erano stati posizionati, risolvendo il problema della “deriva temporale” che affligge le attuali IA generative video.
L’architettura di questi modelli si basa sull’integrazione di tecniche avanzate di visione artificiale e computer grafica, come i Gaussian Splatting e le mesh di collisione. L’output di World Labs è progettato per essere interattivo e modificabile: attraverso strumenti come “Chisel”, gli utenti possono intervenire direttamente sulla geometria del mondo, definendo layout strutturali (pareti, mobili, volumi) che il modello provvede poi a “renderizzare” seguendo istruzioni semantiche. Questa capacità di editing deterministico è fondamentale per settori come l’architettura e il design industriale, dove la precisione millimetrica e la coerenza dei materiali sono requisiti imprescindibili. La partnership strategica con Autodesk, che ha contribuito al round con 200 milioni di dollari, sottolinea proprio questa convergenza tra l’intelligenza artificiale creativa e i flussi di lavoro professionali basati su CAD e BIM.
Oltre all’aspetto creativo, il Blueprint di World Labs punta alla robotica e alla scoperta scientifica. Un modello che comprende intrinsecamente lo spazio e la fisica può fungere da simulatore perfetto per l’addestramento di agenti robotici in ambienti virtuali (Sim-to-Real). Invece di addestrare un robot nel mondo fisico, con costi e rischi elevati, gli sviluppatori possono utilizzare i mondi generati da Marble per simulare interazioni complesse, testando la risposta di sensori e attuatori in scenari infiniti e fisicamente accurati. Questa “Physical AI” rappresenta il prossimo passo logico: dotare le macchine non solo di una voce o di una vista, ma di un’intuizione spaziale che permetta loro di navigare e operare nel mondo fisico con la stessa naturalezza degli esseri umani.
