Lo strumento gratuito di intelligenza artificiale da testo a immagine “Diffusione stabile” è ora disponibile pubblicamente
Rilasciato con una licenza Creative ML OpenRAIL-M, il modello è consentito per uso commerciale e non commerciale.
 
Stability AI ha recentemente annunciato il lancio di un nuovo generatore di text-to-image, “Stable Diffusion”. Lo strumento di generazione di immagini compete con artisti del calibro di DALLE-2 , Midjourney , Imagen e altri. A differenza di altri modelli text-to-image, Stable Diffusion è open source e non ha filtri per i contenuti.  

Il codice e la scheda modello di Stable Diffusion sono disponibili su GitHub e HuggingFace .

 
Recentemente l’azienda ha lanciato anche la versione beta della piattaforma, denominata DreamStudio . La piattaforma consente agli utenti di accedere e creare gratuitamente le prime 200 immagini. 

Il modello è stato rilasciato con una licenza ML OpenRAIL-M creativa . Questa è una licenza permissiva che consente l’uso commerciale e non commerciale. 

Con Stable Diffusion, l’azienda mira a consentire a miliardi di persone di creare opere d’arte straordinarie in pochi secondi. Il team ritiene che si tratti di una svolta in termini di velocità e qualità. Ciò significa che può funzionare su GPU consumer. 

Il direttore dell’IA di Tesla, Andrej Karpathy, ha elogiato Stable Diffusion e ha affermato che quello strumento segna un giorno di proporzioni storiche per la creatività umana. 

Stable Diffusion nasce da un’idea dei ricercatori di Stability AI, una startup con sede a Londra e Los Altos. I ricercatori includono Patrick Esser di Runway e Robin Rombach del gruppo di ricerca Machine Vision & Learning presso LMU Munich , che hanno precedentemente lavorato su Latent Diffusion Models , insieme al supporto delle comunità di EleutherAI , RunwayML, LMU Munich, LAION e altri. 

L’azienda sta inoltre progettando di creare un’alternativa per PowerPoint.

Informazioni su Stable Diffusion
 

Il modello di generazione da immagine a testo “Stable Diffusion” è stato costruito sul lavoro del team di CompVis e Runway nel loro modello di diffusione latente ampiamente utilizzato combinato con le intuizioni dei modelli di diffusione condizionale dal loro sviluppatore di intelligenza artificiale principale Katherine Crowson , Dall -E 2 di Open AI , Imagen di Google Brain e altri. 

“Siamo lieti che la generazione di media AI sia un campo cooperativo e speriamo che possa continuare in questo modo per portare il dono della creatività a tutti”, ha condiviso il team di Stability AI, nel suo post sul blog. 

Il fondatore di Stability AI, Emad Mostaque , ha affermato che continuerà a rilasciare modelli migliori e più veloci. “Non solo nell’immagine, nell’audio il mese prossimo, poi passiamo al 3D, al video”, ha aggiunto Mostaque. 

Di ihal

Utilizzando il sito, accetti l'utilizzo dei cookie da parte nostra. maggiori informazioni

Questo sito utilizza i cookie per fornire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o cliccando su "Accetta" permetti il loro utilizzo.

Chiudi