Nell’arena in continua evoluzione dell’intelligenza artificiale, in particolare in ambito enterprise, Google ha appena svelato un aggiornamento tecnologico che promette di trasformare radicalmente il modo in cui le aziende trattano e modificano le immagini: si chiama Gemini 2.5 Flash Image, noto inizialmente con il curioso soprannome “nano banana”. Integrato all’interno dell’app Gemini, questo modello è pensato per affiancare team creativi, reparti marketing e chiunque sia alla ricerca di un editing visivo avanzato, intuitivo e fedele all’immagine originale—sia essa una persona cara o il proprio animale domestico.
Finora, l’editing AI ha spesso faticato a mantenere intatti i tratti distintivi di una fotografia mentre apportava modifiche creative—il rischio è sempre stata una resa “quasi perfetta, ma non proprio”. Con Gemini 2.5 Flash Image, Google affronta esattamente questa criticità. Quando chiedi al modello di modificare lo sfondo di un’immagine o di aggiungere un accessorio, l’elemento principale—come il tuo volto o quello del tuo cane—rimane subito riconoscibile, coerente e autentico. Lo affermano chiaramente David Sharon e Nicole Brichtova, rispettivamente leader per Gemini Apps e Gemini image product presso Google DeepMind: “vogliamo che le foto dei tuoi amici, della tua famiglia o dei tuoi animali mantengano una costante somiglianza”.
La nuova versione dell’app Gemini non si limita a un semplice aggiornamento: aggiunge una serie di funzionalità che trasformano l’esperienza creativa. Puoi:
- Cambiare outfit o scenario, sperimentando con abiti retrò o ambientazioni esotiche, senza perdere la tua identità visiva.
- Unire foto diverse, combinando un tuo ritratto con quello del tuo animale in una scena unica e armoniosa (immagina voi due su un campo da basket).
- Modificare l’immagine in più step (“multi-turn editing”), come dipingere una stanza virtuale, aggiungere un mobile o una pianta—sempre conservando l’integrità del resto.
- Trasferire lo stile da una foto a un’altra, per esempio applicando texture floreali a stivali da pioggia o motivi di un’ala di farfalla a un vestito.
Inoltre, ogni immagine creata o ritoccata nell’app include sia un watermark visibile che uno invisibile (SynthID), per garantire trasparenza e tracciabilità della sua origine AI.
Tutto questo conta per le aziende per:
- Coerenza visiva professionale: nei contesti commerciali, piccoli errori nell’aspetto di brand ambassador o mascot possono compromettere la percezione del brand. Con Gemini Flash Image, quella coerenza viene preservata, anche nei prototipi rapidi o nelle campagne visual.
- Velocità e versatilità per team creativi: il marketing ora può sperimentare modifiche visive al volo, senza ricorrere a strumenti complessi come Photoshop, semplificando collaboration e approvazione.
- Controllo interno e branding sicuro: il watermark SynthID invisibile garantisce trasparenza nell’utilizzo di AI, tutelando questioni di proprietà e autenticità.
L’uscita di Gemini 2.5 Flash Image non è un evento isolato, ma parte di una strategia più ampia da parte di Google. Il modello Gemini 2.5—di cui questa versione è una declinazione—porta migliorie significative: capacità di ragionamento potenziate, comprensione multimodale più sviluppata, latenza ridotta e integrazione fluida con strumenti aziendali come Google Workspace e Vertex AI.
Oracle, ad esempio, ha già incluso Gemini 2.5 nei servizi AI della sua infrastruttura cloud, permettendo alle aziende di costruire agenti intelligenti per compiti in vari ambiti: sviluppo software, automazioni di workflow, ricerca, e sì—anche editing multimodale