Il famoso servizio di generazione di immagini basato su intelligenza artificiale, Midjourney, ha recentemente introdotto una funzione molto attesa: la capacità di generare consistentemente lo stesso personaggio attraverso diverse immagini. Questo rappresenta una svolta significativa, visto che, fino a questo momento, uno dei maggiori limiti dei generatori di immagini AI era proprio la loro incapacità di mantenere coerenza nella rappresentazione dei personaggi.

La maggior parte dei servizi di generazione di immagini AI, inclusi quelli che utilizzano modelli di diffusione simili a Stable Diffusion di Stability AI, creano immagini pixel per pixel basandosi su testo fornito dagli utenti. Questo processo, nonostante l’enorme e discussa banca dati di immagini e testi da cui apprende, tende a generare risultati nuovi e inconsistenti ad ogni input, anche se simile o ripetuto.

Questa caratteristica di generazione di contenuto unico è utile per creare nuove immagini ma pone problemi quando si necessita di coerenza, ad esempio nella creazione di storyboard per film, romanzi grafici o fumetti, dove è fondamentale mantenere lo stesso aspetto dei personaggi in scenari diversi.

Midjourney affronta questa sfida introducendo il tag “–cref” (abbreviazione di “character reference”), che permette agli utenti di specificare un riferimento per il personaggio che desiderano mantenere costante tra le immagini. Gli utenti possono utilizzare questo tag sui loro messaggi nel Discord di Midjourney, aggiungendo un URL dopo il tag come riferimento per le caratteristiche facciali, il tipo di corpo e l’abbigliamento del personaggio.

Questa innovazione potrebbe trasformare Midjourney da uno strumento principalmente ludico o generativo di idee a uno strumento professionale più serio, migliorando significativamente la produzione di contenuti visivi coerenti. Il tag “–cref” è particolarmente efficace con immagini generate precedentemente da Midjourney, suggerendo agli utenti di generare o recuperare prima l’URL di un personaggio generato per utilizzarlo come riferimento.

Di Fantasy