Immagine AI

Il 30 aprile 2025, Google ha annunciato un significativo aggiornamento per la sua app Gemini, introducendo la possibilità di generare e modificare immagini direttamente all’interno dell’applicazione. Questa nuova funzionalità consente agli utenti di caricare foto personali o utilizzare immagini generate dall’intelligenza artificiale, per poi modificarle tramite comandi testuali in linguaggio naturale.​

La nuova capacità di modifica delle immagini in Gemini è alimentata dal modello AI Gemini 2.0 Flash. Gli utenti possono, ad esempio, caricare una foto e chiedere all’app di cambiare lo sfondo, aggiungere oggetti o alterare aspetti specifici dell’immagine, come il colore dei capelli. Questa interazione avviene in modo conversazionale, permettendo modifiche in più fasi e mantenendo il contesto durante l’intero processo.​

Un esempio pratico potrebbe essere l’upload di una foto di un tavolo, seguito dalla richiesta di aggiungere un vaso di fiori sopra di esso. Oppure, un utente potrebbe caricare una propria immagine e chiedere come apparirebbe con un diverso colore di capelli. Queste modifiche vengono eseguite direttamente nell’app, senza la necessità di utilizzare software esterni di editing.​

Oltre alla modifica delle immagini esistenti, Gemini consente anche la generazione di storie visive. Gli utenti possono richiedere la creazione di una storia, ad esempio su un drago, e l’app genererà sia il testo della storia che le illustrazioni corrispondenti. Questo approccio integrato offre un’esperienza più ricca e coinvolgente, combinando narrazione e immagini in un unico flusso di lavoro.​

Per garantire la trasparenza e prevenire l’uso improprio delle immagini generate, Google ha implementato una filigrana digitale invisibile chiamata SynthID su tutte le immagini create o modificate tramite Gemini. Inoltre, l’azienda sta sperimentando l’aggiunta di una filigrana visibile, che appare come un piccolo logo “AI” nell’angolo inferiore destro dell’immagine. Queste misure sono state adottate per affrontare preoccupazioni relative alla creazione di contenuti ingannevoli o deepfake.​

La funzionalità di modifica delle immagini native è attualmente in fase di distribuzione graduale e sarà disponibile in oltre 45 lingue e nella maggior parte dei paesi nei prossimi giorni. Questo aggiornamento rende Gemini una piattaforma ancora più potente per gli utenti che desiderano combinare testo e immagini in modo creativo e intuitivo.

Di Fantasy