Google lancerà Imagen 3, il suo nuovo modello base text-to-image, sulla piattaforma Vertex AI, offrendo una generazione di immagini avanzata con miglioramenti significativi rispetto al modello precedente. Imagen 3 è stato presentato per la prima volta al Google I/O di maggio e ora sarà disponibile in anteprima per alcuni clienti selezionati su Vertex AI.
Douglas Eck, direttore della ricerca senior di Google DeepMind, ha descritto Imagen 3 come il modello più capace fino ad oggi per la generazione di immagini. Rispetto al suo predecessore, questo nuovo modello è caratterizzato da maggiore fotorealismo, dettagli più ricchi e una riduzione degli artefatti visivi. È stato progettato per comprendere e incorporare dettagli più complessi nei prompt più lunghi, migliorando notevolmente anche il rendering del testo all’interno delle immagini.
Con il lancio su Vertex AI, Imagen 3 supporterà diverse lingue, includerà funzionalità di sicurezza come la filigrana digitale SynthID di Google DeepMind e offrirà opzioni per diverse proporzioni di immagine.
Shutterstock, uno dei clienti che utilizza questo modello per il suo generatore di immagini AI, ha elogiato Imagen 3 per i miglioramenti significativi che promette, consentendo agli utenti di realizzare idee creative con maggiore velocità e senza compromettere la qualità. Shutterstock ha anche apprezzato le caratteristiche di sicurezza integrate che proteggono il contenuto creato.
Rispondendo alle domande riguardo all’intelligenza artificiale Gemini di Google, Thomas Kurian, CEO di Google Cloud, ha chiarito che Gemini è un modello multimodale progettato per elaborare input di diverse modalità come immagini, video e audio, offrendo un’ampia gamma di funzionalità. Al contrario, Imagen 3 è focalizzato esclusivamente sulla generazione di testo in immagini ad alta fedeltà e non sostituisce le capacità di immagine di Gemini.
Google ha evitato di fornire una data precisa per il ripristino delle funzionalità di generazione di immagini di Gemini, nonostante le domande da parte dei giornalisti durante una conferenza stampa.