Google Cloud ha annunciato l’integrazione di Veo, il suo avanzato modello di intelligenza artificiale per la generazione di video, all’interno della piattaforma Vertex AI. Questa mossa posiziona Google come il primo fornitore di servizi cloud a offrire ai propri clienti un modello di generazione video basato su IA, ampliando significativamente le possibilità creative per le aziende.

Veo, sviluppato da Google DeepMind, è stato presentato per la prima volta durante la conferenza Google I/O. Il modello è in grado di trasformare prompt testuali o immagini in video ad alta definizione, superando i 60 secondi di durata, con una coerenza fotogramma per fotogramma che garantisce movimenti fluidi dei soggetti all’interno delle scene. Questa caratteristica lo distingue da altri modelli simili, offrendo una qualità cinematografica senza precedenti.

Parallelamente, Google ha reso disponibile Imagen 3, il suo modello di generazione di immagini basato su testo, anch’esso sviluppato da DeepMind. Imagen 3 produce immagini fotorealistiche in vari stili, migliorando dettagli, illuminazione e riducendo artefatti rispetto alle versioni precedenti. Gli utenti selezionati avranno accesso a funzionalità avanzate come l’upscaling delle immagini, l’inpainting, l’outpainting e la sostituzione dello sfondo, tutte guidate da prompt testuali. Inoltre, è possibile fornire immagini di riferimento affinché Imagen 3 crei contenuti in linea con specifiche estetiche di brand, loghi o caratteristiche di prodotto.

L’integrazione di Veo e Imagen 3 su Vertex AI offre alle aziende strumenti potenti per innovare nei settori del marketing, delle vendite e oltre. Ad esempio, Imagen 3 semplifica la creazione di asset di alta qualità come immagini di prodotto e contenuti per i social media, mentre Veo estende queste capacità permettendo ai team di produrre video coinvolgenti senza la necessità di competenze tecniche avanzate.

Per garantire un utilizzo responsabile, sia Veo che Imagen 3 incorporano misure di sicurezza per prevenire la generazione di contenuti dannosi o inappropriati. Inoltre, ogni immagine e fotogramma generato include una filigrana invisibile tramite la tecnologia SynthID di DeepMind, contribuendo a ridurre il rischio di disinformazione e attribuzioni errate.

Di Fantasy