Stable Diffusion nuovo generatore di text-to-image

Lo strumento gratuito di intelligenza artificiale da testo a immagine “Diffusione stabile” è ora disponibile pubblicamente
Rilasciato con una licenza Creative ML OpenRAIL-M, il modello è consentito per uso commerciale e non commerciale.

Stability AI ha recentemente annunciato il lancio di un nuovo generatore di text-to-image, “Stable Diffusion”. Lo strumento di generazione di immagini compete con artisti del calibro di DALLE-2 , Midjourney , Imagen e altri. A differenza di altri modelli text-to-image, Stable Diffusion è open source e non ha filtri per i contenuti.

Il codice e la scheda modello di Stable Diffusion sono disponibili su GitHub e HuggingFace .

Recentemente l’azienda ha lanciato anche la versione beta della piattaforma, denominata DreamStudio . La piattaforma consente agli utenti di accedere e creare gratuitamente le prime 200 immagini.

Il modello è stato rilasciato con una licenza ML OpenRAIL-M creativa . Questa è una licenza permissiva che consente l’uso commerciale e non commerciale.

Con Stable Diffusion, l’azienda mira a consentire a miliardi di persone di creare opere d’arte straordinarie in pochi secondi. Il team ritiene che si tratti di una svolta in termini di velocità e qualità. Ciò significa che può funzionare su GPU consumer.

Il direttore dell’IA di Tesla, Andrej Karpathy, ha elogiato Stable Diffusion e ha affermato che quello strumento segna un giorno di proporzioni storiche per la creatività umana.

Stable Diffusion nasce da un’idea dei ricercatori di Stability AI, una startup con sede a Londra e Los Altos. I ricercatori includono Patrick Esser di Runway e Robin Rombach del gruppo di ricerca Machine Vision & Learning presso LMU Munich , che hanno precedentemente lavorato su Latent Diffusion Models , insieme al supporto delle comunità di EleutherAI , RunwayML, LMU Munich, LAION e altri.

L’azienda sta inoltre progettando di creare un’alternativa per PowerPoint.

Informazioni su Stable Diffusion

Il modello di generazione da immagine a testo “Stable Diffusion” è stato costruito sul lavoro del team di CompVis e Runway nel loro modello di diffusione latente ampiamente utilizzato combinato con le intuizioni dei modelli di diffusione condizionale dal loro sviluppatore di intelligenza artificiale principale Katherine Crowson , Dall -E 2 di Open AI , Imagen di Google Brain e altri.

“Siamo lieti che la generazione di media AI sia un campo cooperativo e speriamo che possa continuare in questo modo per portare il dono della creatività a tutti”, ha condiviso il team di Stability AI, nel suo post sul blog.

Il fondatore di Stability AI, Emad Mostaque , ha affermato che continuerà a rilasciare modelli migliori e più veloci. “Non solo nell’immagine, nell’audio il mese prossimo, poi passiamo al 3D, al video”, ha aggiunto Mostaque.

Stable Diffusion nuovo generatore di text-to-image

Diihal

Di ihal

Articoli correlati

Tinder finanziario: Match It Up usa swipe ed AI per collegare founder, investitori e professionisti

Midjourney acquisisce l’app di astrologia Co-Star e prepara la sua prima app mobile per la generazione di immagini

ChatGPT Health collega cartelle cliniche e dati Apple Health alle conversazioni

Ultimi Post

Claude Opus 5 vince la guerra dei distributori automatici tra accordi traditi, menzogne e minacce

xAI presenta Grok Voice Think Fast 2.0 per agenti vocali in tempo reale

OpenAI offre gratuitamente GPT-5.6, ChatGPT Work e Codex a 100.000 ricercatori

Google DeepMind scioglie il gruppo AlphaFold e trasferisce i ricercatori sui progetti Gemini