In generale, la lezione che Stability AI ha imparato è che più grande non è sempre meglio quando si tratta di eseguire modelli di intelligenza artificiale generativa su hardware standard.
Oggi, presentano Stable Diffusion 3 Medium, un modello più piccolo ma altrettanto potente progettato per funzionare su GPU di livello consumer. Questo rende Stable Diffusion 3 un’opzione più accessibile per coloro che hanno risorse limitate ma vogliono comunque sfruttare una tecnologia di generazione di immagini avanzata.
Il nuovo modello è disponibile per l’uso tramite API e sul servizio Stable Artisan tramite Discord. I pesi del modello possono anche essere utilizzati gratuitamente su Hugging Face.
Stable Diffusion 3 Large è la versione più grande e ha 8 miliardi di parametri, mentre la versione Medium ha solo 2 miliardi di parametri. Quest’ultima è progettata per funzionare in modo efficiente su hardware consumer, richiedendo solo 5 GB di VRAM GPU come requisito minimo, sebbene consigliamo 16 GB per prestazioni ottimali.
Nonostante il numero inferiore di parametri, Stability AI afferma che Stable Diffusion 3 Medium offre una qualità eccezionalmente elevata, simile a quella della versione Large. Include funzionalità come fotorealismo, pronta comprensione del linguaggio naturale, miglioramento della tipografia e efficiente utilizzo delle risorse.
In particolare, la caratteristica principale del modello Medium è la sua efficienza nell’utilizzo delle risorse, rendendolo ideale per ambienti in cui la gestione delle risorse è cruciale.