Infinite Nature-Zero, un’intelligenza artificiale che genera viste 3D che disegna virtualmente il mondo in una foto come se un drone stesse scattando foto aeree, è stato presentato il mese scorso e ha ottenuto un’ottima risposta. Google ha rivelato dettagli come il principio della creazione dell’immagine e la tecnologia di introduzione di Infinity Nature-Zero attraverso il suo blog.
Infinite Nature-Zero crea un video di volo paesaggistico infinito che segue con una sola foto. Il video simula il movimento del volo e ingrandisce, rimpicciolisce o cambia continuamente, dando al drone la sensazione di sorvolare un paesaggio naturale. Gli spettatori possono anche modificare in modo interattivo la direzione del volo in tempo reale.
Secondo Google, questo modello si basa su un modello chiamato “Infinite Nature” annunciato nel 2021. Entrambi i modelli creano video dalla prospettiva della telecamera che si muove attraverso una scena basata su una singola immagine.
InfiniteNature si è formato su mappe di punti che descrivono il terreno 3D e i dati video, comprese le informazioni sulla posizione della telecamera, mentre InfiniteNature-Zero ha appreso su una raccolta di semplici immagini individuali. Di conseguenza, InfiniteNature-Zero può produrre video di qualità superiore e più realistici, ha spiegato Google.
Inoltre, InfiniteNature-Zero utilizza immagini di input e mappe di profondità corrispondenti per l’apprendimento. Utilizza la mappa di profondità per eseguire il rendering dell’immagine nel nuovo punto di vista desiderato. Durante l’addestramento, un’immagine di input reale viene impostata come immagine finale e un’immagine virtuale prima di questa immagine finale viene renderizzata e confrontata con l’immagine di input (immagine finale) per apprendere la generazione di fotogrammi video. Per garantire la generazione continua di frame di alta qualità, è stato introdotto e addestrato un sistema GAN (adversarial generative neural network) in modo che corrisponda all’immagine di input.
Imposta l’immagine di input come immagine finale, esegui il rendering di un’immagine virtuale prima dell’immagine finale e confrontala con l’immagine di input (immagine finale) per apprendere la generazione di fotogrammi video. (Foto = Google).
Imposta l’immagine di input come immagine finale, esegui il rendering di un’immagine virtuale prima dell’immagine finale e confrontala con l’immagine di input (immagine finale) per apprendere la creazione di fotogrammi video. (Foto = Google).
Imparando a generare fotogrammi basati su fotogrammi di input e immagini di mappe di profondità, i fotogrammi possono essere creati indefinitamente mentre la telecamera virtuale si muove.