Google sta per rilasciare un aggiornamento del suo modello da testo a immagine chiamato Imagen 3, promettendo un livello di dettaglio sorprendente, una migliore comprensione del linguaggio naturale e una resa del testo superiore. Attualmente disponibile in anteprima privata per creatori selezionati tramite ImageFX, Imagen 3 sarà presto accessibile anche tramite Vertex AI, con gli sviluppatori che possono iscriversi a una lista d’attesa.
Durante la conferenza degli sviluppatori I/O di Google, Douglas Eck di Google DeepMind ha presentato Imagen 3 come il modello di generazione di immagini più potente mai realizzato. Eck ha sottolineato che Imagen 3 produce immagini più fotorealistiche, con dettagli più ricchi e meno artefatti visivi o distorsioni. Il modello comprende anche meglio i suggerimenti scritti e si ricorda di incorporare piccoli dettagli, rendendo le immagini più accurate, soprattutto in istruzioni più lunghe.
Questo annuncio arriva sei mesi dopo che Google ha reso Imagen 2 generalmente disponibile su Vertex AI e ha introdotto le funzionalità text-to-live per il modello a partire da aprile. Google è impegnata a mantenere un vantaggio competitivo nel campo dell’intelligenza artificiale, soprattutto considerando la presenza di concorrenti come OpenAI con il suo modello DALL-E e altre aziende con strumenti simili.
Tuttavia, Google ha anche affrontato critiche nel campo della generazione di immagini, con alcune controversie riguardanti la creazione di immagini dai suoi modelli. Nonostante le sfide, Google cerca di migliorare continuamente le sue tecnologie, come dimostra il lancio di Imagen 3 insieme ad altri annunci importanti durante Google I/O, come il nuovo modello di generazione video chiamato Veo.