È tempo di accogliere un nuovo aggiornamento nell’innovativo mondo dell’intelligenza artificiale con l’avvento di Stable Diffusion XL, la grande versione della celebre IA generativa. Stable Diffusion 2.0, la sua iterazione precedente rilasciata da Stability AI alla fine del 2022, rimane un’opzione solida per gli utenti tecnologicamente esperti. Tuttavia, per coloro che hanno aderito alla beta di Stable Diffusion XL, l’aggiornamento alla versione 0.9 promette un’intensa ondata di innovazioni nella generazione di immagini a partire da comandi testuali.
Le vibrazioni di questa rivoluzione IA ci raggiungono direttamente dalla casa madre americana, che ha annunciato l’accessibilità del modello tramite ClipDrop a partire dal 23 giugno 2023. La release pubblica del software è prevista per metà luglio, con la transizione alla versione 1.0. Questa svolta tecnologica permetterà a chi possiede una moderna GPU consumer (in particolare NVIDIA) di creare immagini iperrealistiche per diversi ambiti, tra cui cinema, televisione, musica, video tutorial, modelli per design e uso industriale. Ancora una volta, SDXL si distingue come pioniere nell’arena delle immagini generate da IA.
Con l’aggiornamento 0.9, Stable Diffusion XL ha realizzato salti quantici rispetto alla precedente iterazione della beta. Come evidente nell’immagine di presentazione, l’aggiornamento offre la possibilità di generare immagini estremamente realistiche e dettagliate, ampliando le sue funzionalità oltre la generazione di immagini da semplici suggerimenti testuali. Tra le nuove caratteristiche spiccano l’opzione immagine a immagine (dove l’input di un’immagine produce variazioni di essa), inpainting (per la ricostruzione di parti mancanti di un’immagine) e outpainting (per la costruzione di un’estensione fluida di un’immagine esistente).
L’avanzamento principale dell’aggiornamento SDXL 0.9 si basa sull’incremento significativo dei parametri su cui il modello è stato addestrato rispetto alla versione beta. Ci riferiamo a un impressionante numero di 3,5 miliardi di parametri, tratti da immagini open source, che potrebbero potenzialmente raggiungere 6,6 miliardi. L’aggiornamento si basa su due modelli CLIP, tra cui uno dei modelli OpenCLIP più grandi addestrati finora (OpenCLIP ViT-G/14). Questo elemento potenzia la potenza di elaborazione e garantisce la creazione di immagini realistiche con profondità e risoluzione mai viste prima, raggiungendo i 1024×1024 pixel.
Per far girare SDXL 0.9, i requisiti di sistema includono Windows 10, 11 o Linux, con 16 GB di RAM, una scheda grafica Nvidia GeForce RTX 20 (o equivalente) con un minimo di 8 GB di VRAM, o una AMD con 16 GB di VRAM per gli utenti Linux. L’accesso al modello è disponibile su Clipdrop, e sarà disponibile per gli utenti di Stability AI API e DreamStudio a partire dal 26 giugno. All’inizio sarà utilizzabile esclusivamente per la ricerca, prima della sua distribuzione gratuita su Github.