Lo strumento gratuito di intelligenza artificiale da testo a immagine “Diffusione stabile” è ora disponibile pubblicamente
Rilasciato con una licenza Creative ML OpenRAIL-M, il modello è consentito per uso commerciale e non commerciale.
 
Stability AI ha recentemente annunciato il lancio di un nuovo generatore di text-to-image, “Stable Diffusion”. Lo strumento di generazione di immagini compete con artisti del calibro di DALLE-2 , Midjourney , Imagen e altri. A differenza di altri modelli text-to-image, Stable Diffusion è open source e non ha filtri per i contenuti.  

Il codice e la scheda modello di Stable Diffusion sono disponibili su GitHub e HuggingFace .

 
Recentemente l’azienda ha lanciato anche la versione beta della piattaforma, denominata DreamStudio . La piattaforma consente agli utenti di accedere e creare gratuitamente le prime 200 immagini. 

Il modello è stato rilasciato con una licenza ML OpenRAIL-M creativa . Questa è una licenza permissiva che consente l’uso commerciale e non commerciale. 

Con Stable Diffusion, l’azienda mira a consentire a miliardi di persone di creare opere d’arte straordinarie in pochi secondi. Il team ritiene che si tratti di una svolta in termini di velocità e qualità. Ciò significa che può funzionare su GPU consumer. 

Il direttore dell’IA di Tesla, Andrej Karpathy, ha elogiato Stable Diffusion e ha affermato che quello strumento segna un giorno di proporzioni storiche per la creatività umana. 

Stable Diffusion nasce da un’idea dei ricercatori di Stability AI, una startup con sede a Londra e Los Altos. I ricercatori includono Patrick Esser di Runway e Robin Rombach del gruppo di ricerca Machine Vision & Learning presso LMU Munich , che hanno precedentemente lavorato su Latent Diffusion Models , insieme al supporto delle comunità di EleutherAI , RunwayML, LMU Munich, LAION e altri. 

L’azienda sta inoltre progettando di creare un’alternativa per PowerPoint.

Informazioni su Stable Diffusion
 

Il modello di generazione da immagine a testo “Stable Diffusion” è stato costruito sul lavoro del team di CompVis e Runway nel loro modello di diffusione latente ampiamente utilizzato combinato con le intuizioni dei modelli di diffusione condizionale dal loro sviluppatore di intelligenza artificiale principale Katherine Crowson , Dall -E 2 di Open AI , Imagen di Google Brain e altri. 

“Siamo lieti che la generazione di media AI sia un campo cooperativo e speriamo che possa continuare in questo modo per portare il dono della creatività a tutti”, ha condiviso il team di Stability AI, nel suo post sul blog. 

Il fondatore di Stability AI, Emad Mostaque , ha affermato che continuerà a rilasciare modelli migliori e più veloci. “Non solo nell’immagine, nell’audio il mese prossimo, poi passiamo al 3D, al video”, ha aggiunto Mostaque. 

Di ihal