Il creatore di Stable Diffusion Stability AI accelera l’IA open source e raccoglie $ 101 milioni 

Non c’è carenza di tecnologia rivoluzionaria alla base dell’IA generativa, ma un’innovazione chiave sono i modelli di diffusione . Ispirati da concetti termodinamici, i modelli di diffusione hanno suscitato l’interesse del pubblico, sostituendo rapidamente le reti generative contraddittorio (GAN) come metodo di riferimento per la generazione di immagini basata sull’intelligenza artificiale. 

Questi modelli apprendono corrompendo i dati di addestramento con rumore aggiunto in modo incrementale e quindi determinando come invertire questo processo di rumore per recuperare l’immagine originale. Dopo essere stati addestrati, i modelli di diffusione possono utilizzare questi metodi di denoising per generare nuovi dati “puliti” da input casuali. I generatori di testo a immagine più diffusi come DALL-E 2, Imagen e Midjourney utilizzano tutti modelli di diffusione. Un altro concorrente chiave in questa categoria è Stability AI , la startup dietro il modello Stable Diffusion, un generatore di testo a immagine potente, gratuito e open source lanciato nell’agosto 2022. 

Da Honeywell alle startup Come i leader stanno guidando una crescita prevedibile con l’IA
Fondata nel 2020 da Emad Mostaque, Stability AI afferma di essere la prima azienda al mondo di intelligenza artificiale (AI)   open source guidata dalla comunità che mira a risolvere la mancanza di “organizzazione” all’interno della comunità di intelligenza artificiale open source.

“L’IA promette di risolvere alcune delle più grandi sfide dell’umanità. Ma realizzeremo questo potenziale solo se la tecnologia sarà aperta e accessibile a tutti”, ha affermato Mostaque. “La Stability AI rimette il potere nelle mani delle comunità di sviluppatori e apre le porte a nuove applicazioni rivoluzionarie. Un’entità indipendente in questo spazio che supporta queste comunità può creare valore reale e cambiare”.


La società ha recentemente annunciato un finanziamento di 101 milioni di dollari. Il round di sottoscrizione in eccesso è stato guidato da Coatue, Lightspeed Venture Partners e O’Shaughnessy Ventures LLC. In una dichiarazione, Stability AI ha affermato che utilizzerà i finanziamenti per accelerare lo sviluppo di modelli di intelligenza artificiale open source per immagini, linguaggio, audio, video, 3D e altro, per casi d’uso dei consumatori e delle imprese a livello globale.

La diffusione stabile è veramente ‘aperta’ 

Proprio come la maggior parte delle sue controparti, Stable Diffusion mira a consentire a miliardi di persone di creare istantaneamente opere d’arte straordinarie. Il modello stesso si basa sul lavoro dei team CompVis e Runway nel loro modello di diffusione latente ampiamente utilizzato, nonché sugli approfondimenti dei modelli di diffusione condizionale di Katherine Crowson, principale sviluppatore di IA generativa di Stability AI, Dall-E 2 di OpenAI, Imagen di Google Brain , e molti altri.

Il set di dati di base è stato addestrato su LAION-Aesthetics, un sottoinsieme di LAION-5B, che è stato creato utilizzando un nuovo modello basato su CLIP che filtrava LAION-5B in base a quanto fosse “bella” un’immagine, in base alle valutazioni degli alpha tester di Stable Diffusion . Sulle GPU consumer, Stable Diffusion utilizza meno di 10 GB di VRAM per generare immagini con 512 x 512 pixel in pochi secondi. Ciò consente ai ricercatori e, infine, al pubblico in generale, di eseguire il programma in una varietà di condizioni, democratizzando la generazione di immagini. 

Il modello è stato addestrato su 4.000 ultracluster A100 Ezra-1 AI di Stability AI. L’azienda ha testato il modello su larga scala con oltre 10.000 beta tester che creano 1,7 milioni di immagini al giorno. 

 
L’enfasi sull’open source distingue Stable Diffusion da altri generatori di arte di intelligenza artificiale. Stability AI ha reso pubblici tutti i dettagli del suo modello AI, inclusi i pesi del modello, a cui chiunque può accedere e utilizzare. Stable Diffusion, a differenza di DALL-E o Midjourney, non ha filtri o limitazioni su ciò che può generare, inclusi contenuti violenti, pornografici, razzisti o comunque dannosi.

“Il modo aperto in cui è stato rilasciato il modello di generazione di immagini di Stable Diffusion, consentendo agli utenti di eseguirlo sui propri computer, non solo tramite API, lo ha reso un evento fondamentale per l’IA”, ha affermato Andrew Ng, Ph.D.,  riconosciuto a livello mondiale leader nell’IA. È fondatore e CEO di DeepLearning AI e fondatore e CEO di Landing AI .

Dal lancio, Stable Diffusion è stato scaricato e concesso in licenza da oltre 200.000 sviluppatori in tutto il mondo.

 
Trasformare l’immaginazione in realtà con DreamStudio 
Stability AI offre anche un prodotto rivolto ai consumatori, DreamStudio , che l’azienda descrive come “una nuova suite di strumenti multimediali generativi progettati per garantire a tutti il ​​potere dell’immaginazione illimitata e la facilità di espressione visiva senza sforzo attraverso una combinazione di elaborazione del linguaggio naturale e rivoluzionaria controlli di input per una creatività accelerata. Il prodotto ha attualmente un milione di utenti registrati da più di 50 paesi che hanno creato collettivamente più di 170 milioni di immagini. 

Mentre il modello Stable Diffusion è stato reso open source da Stability AI, il sito Web DreamStudio è un servizio progettato per consentire a chiunque di accedere a tali strumenti creativi senza la necessità di installazione di software, conoscenze di codifica o GPU locale per impieghi gravosi, ma lo fa vieni con un costo. Tutti i nuovi utenti riceveranno un bonus una tantum di 200 crediti DreamStudio gratuiti. Con le impostazioni predefinite, agli utenti verrà addebitato un credito per immagine. A seconda della risoluzione dell’immagine e del conteggio dei passaggi scelti dagli utenti (dimensioni, scala Cfg, seme, passaggi e conteggio delle immagini), il costo per immagine con impostazioni non predefinite può arrivare a partire da 0,2 crediti per immagine o fino a 28,2 crediti per immagine. Una volta esauriti i crediti gratuiti, gli utenti dovranno acquistarne di più. Le immagini generate vengono sempre salvate nella cronologia e puoi integrarle con le tue applicazioni esistenti utilizzando l’API.

 
Il futuro sfocato
Mentre la strategia aziendale di Stability AI rimane ancora confusa, in una recente intervista con l’appassionato di ML e YouTuber Yannic Kilcher , Mostaque ha affermato di essere già in trattative con “governi e grandi organizzazioni” per offrire la tecnologia di Stable Diffusion. “Abbiamo negoziato un gran numero di accordi, quindi saremo redditizi alla porta, rispetto alle grandi società che perdono la maggior parte dei loro soldi”, ha aggiunto.

“In Coatue, crediamo che le tecnologie di intelligenza artificiale open source abbiano il potere di sbloccare la creatività umana e ottenere un bene più ampio”, ha spiegato Sri Viswanath, partner generale di Coatue. “La stabilità AI è una grande idea che sogna oltre le applicazioni immediate dell’IA. Siamo entusiasti di far parte del viaggio di Stability AI e non vediamo l’ora di vedere cosa crea il mondo con la tecnologia di Stability AI”.

Di ihal