La società di intelligenza artificiale generativa Stability AI ha annunciato la versione beta di Stable Diffusion XL (SDXL), il suo ultimo modello di generazione di immagini per i clienti aziendali. Secondo un comunicato stampa, SDXL eccelle nel fotorealismo e apporta una ricchezza alla generazione di immagini che è trasformativa in diversi settori, tra cui la progettazione grafica e l’architettura.
La versione beta di SDXL è disponibile nell’API di Stability e nella suite di programmazione DreamStudio, destinata agli sviluppatori aziendali. La società afferma che SDXL produce immagini e composizioni più dettagliate rispetto al suo predecessore Stable Diffusion 2.1, incluso fotorealismo di livello superiore, composizione dell’immagine migliorata e generazione di volti, utilizzo di prompt più brevi per creare immagini descrittive e maggiore capacità di produrre testo leggibile.
SDXL va anche oltre il prompt text-to-image per includere il prompt image-to-image, inpainting e outpainting. La società ha utilizzato l’etichetta “XL” perché questo modello viene addestrato utilizzando 2,3 miliardi di parametri mentre i modelli precedenti erano nell’intervallo di 900 milioni di parametri.
Tuttavia, la società sta ancora ricevendo input dai clienti per perfezionare il modello, quindi SDXL viene rilasciato solo in versione beta ai clienti API e DreamStudio. La società è interessata al feedback su tutti gli aspetti delle capacità e delle prestazioni del modello prima di rilasciarlo alla comunità open source.
Stability AI è stata impegnata a respingere una serie di sfide, inclusa la concorrenza di altri generatori di immagini AI come Midjourney. Inoltre, l’azienda ha affrontato delle critiche da parte di artisti che si oppongono all’uso delle loro opere come dati di addestramento per i modelli di diffusione stabile. A gennaio, tre artisti hanno intentato la prima azione legale collettiva per violazione del copyright sull’arte AI contro Stability AI e Midjourney, mentre a febbraio Getty Images ha intentato una causa sostenendo che le sue immagini erano state utilizzate in modo improprio da Stability AI.
Nonostante i piani dell’azienda di quotarsi in borsa, Semafor ha riferito che Stability AI “sta bruciando denaro ed è stato lento nel generare entrate, portando a una caccia ai dirigenti per aumentare le vendite”.
La situazione finanziaria di Stability AI sembra essere problematica, in quanto la società sta bruciando denaro senza generare abbastanza entrate. Questa situazione ha portato a una caccia ai dirigenti per aumentare le vendite.
Inoltre, la società ha affrontato delle sfide legali in relazione all’uso improprio di immagini e opere d’arte protette da copyright per l’addestramento dei propri modelli. Tuttavia, la società ha affermato di onorare le richieste degli artisti di rinunciare alla formazione di Stable Diffusion 3.
Nonostante queste sfide, Stability AI sta ancora avanzando con il suo ultimo modello di generazione di immagini, Stable Diffusion XL, che potrebbe rappresentare un’ulteriore evoluzione nell’ambito della generazione di immagini tramite l’uso dell’intelligenza artificiale. La società sta ancora lavorando al perfezionamento del modello e sta cercando il feedback dei clienti prima di rilasciarlo alla comunità open source.