Grafici e designer, attenzione: è in arrivo COLE, un nuovo strumento che promette di rivoluzionare il campo della progettazione grafica.
Intitolato in onore di Henry Cole, celebre per la creazione della prima cartolina di Natale grafica nel 1843, COLE permette agli utenti di inserire un’idea di design, come “un poster per un concerto invernale con musicisti in abiti pesanti nella neve”, e di far generare all’intelligenza artificiale l’immagine e il testo corrispondenti.
COLE è un amalgama di diversi modelli di intelligenza artificiale, tra cui Meta Llama2-13B, DeepFloyd IF, LLaVA1.5-13B, GPT-4V e il renderizzatore grafico open source Skia. Sviluppato da un team di 12 ricercatori di Microsoft Research Asia e dell’Università di Pechino, COLE affronta la sfida di progettare in un settore con pochi dati di addestramento disponibili, in particolare per i file .SVG.
Il team ha adottato un approccio innovativo, consolidando tutti gli elementi SVG in un unico livello di immagine, per poi chiedere all’IA di descriverlo nel testo. Allenato su 100.000 immagini di alta qualità da Internet, COLE si presenta più come un framework che come un prodotto finito.
La sua capacità di generare progetti grafici chiari e organizzati con elementi visivi e testo stilizzato è notevole, soprattutto considerando che integrare il testo nelle immagini è stata una sfida per la maggior parte dei generatori di arte basata su IA, come Midjourney e Stable Diffusion. COLE si distingue anche per la sua capacità di creare immagini con blocchi di testo e oggetti modificabili.
Con COLE, gli utenti possono modificare direttamente il progetto senza dover ricorrere a software esterni. Questa flessibilità è fondamentale per i progetti grafici che richiedono una continua evoluzione.
I ricercatori sostengono che COLE produce risultati di alta qualità, confrontabili con l’ultimo DALL-E 3 di OpenAI, e hanno testato il sistema su 200 progetti grafici, dai poster alle copertine, dimostrando che COLE eccelle nella generazione di copertine e poster.
COLE, tuttavia, non è ancora perfetto. Non permette agli utenti di modificare la disposizione dei blocchi tipografici e supporta solo un colore per immagine. I ricercatori sono intenzionati a migliorare questi aspetti nei loro lavori futuri.
Il design grafico è un’arte che molti apprezzano, dai poster di film e concerti alle grafiche funzionali come quelle stradali. COLE minaccia di sostituire i grafici? Non completamente. È stato progettato per integrare le competenze umane, suggerendo che una formazione in progettazione grafica rimane utile per ottenere i migliori risultati.
I ricercatori ritengono che COLE potrebbe consentire a persone senza esperienza in grafica di creare progetti di alta qualità, una visione condivisa da altre aziende come Adobe e Canva. Per ora, COLE non è ancora disponibile al pubblico, ma una demo è prevista a breve sul sito Github del progetto.