Immagina di poter creare un film intero con una semplice descrizione testuale: “Un drago che sorvola una città futuristica al tramonto, con una musica epica in sottofondo”. In pochi secondi, un video realistico prende vita, completo di suoni ambientali, dialoghi e movimenti fluidi. Questo è ciò che Google ha reso possibile con Veo 3, il suo nuovo modello di generazione video basato sull’intelligenza artificiale, presentato al Google I/O 2025.
Veo 3 rappresenta un’evoluzione significativa rispetto al suo predecessore, Veo 2. Mentre quest’ultimo si concentrava sulla generazione di video realistici a partire da descrizioni testuali, Veo 3 aggiunge una dimensione fondamentale: l’audio. Ora, oltre a generare immagini di alta qualità, Veo 3 è in grado di creare suoni ambientali, dialoghi e effetti sonori sincronizzati con le immagini, offrendo un’esperienza audiovisiva completa.
Questa capacità di integrazione audio-visiva distingue Veo 3 da altri strumenti di generazione video basati sull’IA, come Sora di OpenAI e MovieGen di Meta, che attualmente non supportano la generazione audio nativa.
La potenza di Veo 3 risiede nella sua capacità di comprendere e riprodurre la fisica del mondo reale. Dai movimenti dell’acqua al suono dei passi sulla neve, ogni dettaglio è curato con precisione. Un esempio emblematico è un video in cui Pythagoras spiega il suo teorema in un ambiente dell’antica Grecia, con un livello di dettaglio che sfida le aspettative.
Inoltre, Veo 3 gestisce con naturalezza il lip-sync, sincronizzando perfettamente i movimenti delle labbra con i dialoghi generati, un aspetto spesso problematico in altri modelli di IA.
Per sfruttare appieno le potenzialità di Veo 3, Google ha introdotto Flow, un ambiente di creazione video avanzato. Flow consente agli utenti di generare clip cinematografiche, integrare asset tra le riprese e utilizzare un linguaggio naturale per descrivere scene e movimenti della telecamera. Include anche strumenti per la gestione degli asset e un’area di apprendimento chiamata Flow TV, dove gli utenti possono esplorare clip generate con Veo e apprendere nuove tecniche creative.
Attualmente, Veo 3 è disponibile negli Stati Uniti per gli abbonati al piano AI Ultra di Google, al costo di $249,99 al mese, tramite l’app Gemini e Flow. È inoltre accessibile agli utenti aziendali tramite la piattaforma Vertex AI. Non è ancora chiaro quando sarà disponibile in altri paesi, ma l’entusiasmo crescente suggerisce che l’espansione internazionale potrebbe essere imminente.
L’introduzione di Veo 3 potrebbe segnare l’inizio di una nuova era nel cinema digitale. Esperti del settore prevedono che, in un futuro prossimo, sarà possibile realizzare film di qualità paragonabile a “Toy Story” in pochi giorni e con budget significativamente ridotti. Questa democratizzazione della produzione cinematografica potrebbe rivoluzionare l’industria, permettendo a creatori indipendenti e piccole case di produzione di realizzare opere complesse senza la necessità di grandi risorse.