Un nuovo paradigma per la generazione di immagini AI offre molta più flessibilità e controllo rispetto a qualsiasi altra cosa prima. Senza sacrificare la qualità delle immagini generate dall’intelligenza artificiale, un nuovo framework chiamato “Composer” consente il controllo e la manipolazione degli elementi dell’immagine a un livello completamente nuovo.
L’idea alla base di questo nuovo approccio rivoluzionario è scomporre un’immagine in livelli rappresentativi, come descrizione del testo, mappe di profondità, stile, semantica, tavolozze di colori e altro, quindi ricombinare o modificare questi livelli per generare una nuova versione dell’immagine.
Questo crea uno spazio di progettazione vasto e senza precedenti per la creazione di contenuti personalizzati! Nel loro articolo, gli autori mostrano come hanno lavorato con otto livelli di rappresentazione, ma in teoria potrebbero essercene molti di più. Tuttavia, con solo gli otto livelli di rappresentazione, “Composer” è già strabiliante
Diamo un’occhiata ad alcuni dei livelli di rappresentazione:
- Schizzo: creando o estraendo il livello di schizzo di un’immagine, alterandolo e quindi utilizzandolo per ricomporre l’immagine, è possibile aggiungere nuvole o modificare la posizione delle gambe.
- Segmentazione: creando e modificando il livello di segmentazione di un’immagine, puoi modificare la posizione delle orecchie o l’inquadratura.
- Tavolozza dei colori: estraendo o creando tavolozze di colori, è possibile ricomporre le immagini con tavolozze alterate.
- Descrizione del testo: la modifica del livello di descrizione del testo di un’immagine funziona in modo simile ai tradizionali strumenti di generazione di immagini AI (img2img), ma questa volta la conservazione della qualità e della composizione dell’immagine è di livello superiore.
Se pensavi che giocare con un livello rappresentativo fosse strabiliante, guarda cosa succede quando vengono combinati con il mascheramento: in alcuni esempi, l’area mascherata viene influenzata senza modificare la qualità dell’immagine.
Infine, la combinazione di immagini, tavolozze, mappe di profondità, schizzi e livelli di segmenti completamente diversi e precedentemente contraddittori crea infinite possibilità per la creazione di contenuti personalizzati.