Stability AI, la società creatrice di Stable Diffusion, presenta un nuovo modello di generazione di immagini chiamato Stable Cascade. Questo modello promette di essere più flessibile ed efficiente rispetto ai modelli di diffusione stabile attuali.

Differenze da Stable Diffusion

  • Architettura: Stable Cascade utilizza un’architettura modulare con tre modelli distinti (Fasi A, B e C) rispetto al singolo modello di grandi dimensioni di Stable Diffusion.
  • Efficienza: La separazione della generazione di testo in immagine dalla decodifica dell’immagine rende la formazione e la messa a punto del modello più efficienti.
  • Qualità dell’immagine: Stable Cascade ha sovraperformato Stable Diffusion in termini di qualità dell’immagine e allineamento rapido.
  • Generazione di testo: Stable Cascade ha mostrato migliori capacità di generazione di testo rispetto a SDXL.

Funzionalità avanzate

  • Variazioni di immagini: Stable Cascade può generare nuove varianti di una determinata immagine mantenendo stile e composizione.
  • Traduzione da immagine a immagine: Il modello può aggiungere rumore a un’immagine e generare una nuova immagine da essa.
  • Controllo avanzato: Supporta ControlNets per tecniche come in-painting e super-risoluzione.

Stable Cascade è attualmente in fase di anteprima di ricerca e disponibile per uso non commerciale con un codice disponibile su GitHub.

Stable Cascade rappresenta un passo avanti nella generazione di immagini AI, offrendo maggiore flessibilità, efficienza e qualità dell’immagine rispetto ai modelli precedenti. Le sue capacità avanzate lo rendono uno strumento promettente per artisti, designer e ricercatori.

Di Fantasy