Google DeepMind ha svelato “Genie 2”, un avanzato modello di intelligenza artificiale capace di generare mondi tridimensionali interattivi a partire da semplici immagini e descrizioni testuali. Questo sviluppo rappresenta un significativo passo avanti rispetto al suo predecessore, Genie, che si limitava alla creazione di giochi bidimensionali basati su immagini.
Genie 2 consente agli utenti di inserire un’immagine accompagnata da una descrizione testuale, come “un robot carino che cammina in una foresta”, per ottenere in tempo reale una scena 3D interattiva in cui il robot si muove attraverso un ambiente forestale. Gli utenti possono esplorare questo mondo virtuale utilizzando tastiera e mouse, interagendo con gli oggetti presenti e navigando liberamente nello spazio tridimensionale.
Una delle caratteristiche distintive di Genie 2 è la sua capacità di mantenere la coerenza spaziale e temporale all’interno dei mondi generati. Il modello è in grado di ricordare le posizioni degli oggetti anche quando escono dal campo visivo e di renderizzarli accuratamente quando riappaiono, offrendo un’esperienza immersiva e realistica.
Le applicazioni di Genie 2 sono molteplici e spaziano dalla progettazione di videogiochi alla creazione di ambienti per il metaverso, fino alla simulazione per l’addestramento di agenti autonomi. Ad esempio, gli sviluppatori di videogiochi possono utilizzare Genie 2 per generare rapidamente ambientazioni dettagliate, mentre le piattaforme di metaverso possono sfruttare il modello per costruire mondi virtuali realistici e interattivi.
Questo annuncio segue di poco la presentazione di un modello simile da parte di World Labs, la startup fondata da Fei-Fei Li, spesso definita la “madre dell’AI”. Anche World Labs ha sviluppato una tecnologia in grado di trasformare immagini bidimensionali in scene 3D, evidenziando una tendenza crescente nel campo dell’intelligenza artificiale verso la generazione automatica di contenuti tridimensionali.
La capacità di Genie 2 di creare mondi 3D interattivi a partire da input semplici rappresenta un potenziale punto di svolta in vari settori, offrendo strumenti potenti per la creazione di contenuti immersivi e aprendo nuove possibilità per l’interazione uomo-macchina. Con l’introduzione di Genie 2, Google DeepMind continua a spingere i confini dell’intelligenza artificiale, avvicinandoci a un futuro in cui la generazione automatica di mondi virtuali diventa una realtà accessibile a tutti.