stable diffusion

Amazon Web Services ha recentemente annunciato che inizierà a offrire l’accesso agli algoritmi generativi Bloom e Stable Diffusion in Sagemaker Jumpstart, il loro servizio per algoritmi open source, preaddestrati e pronti per la distribuzione. Questi modelli sono diventati abbastanza noti attraverso lo spazio dell’IA generativa. 

I creatori di Stable Diffusion , un algoritmo generativo da testo a immagine, affermano che si tratta di uno “sforzo collettivo per creare un singolo file che comprima le informazioni visive dell’umanità in pochi gigabyte”. Stable Diffusion può anche essere applicato ad altri casi d’uso comuni di IA generativa come inpainting, outpainting e traduzioni da immagine a immagine guidate da un prompt di testo. Utilizza il metodo di diffusione per generare immagini, in cui l’algoritmo rimuove progressivamente il rumore dall’immagine finché l’immagine finale non assomiglia al prompt fornito dall’utente. 

Bloom è un modello multilingue che contiene oltre 176 miliardi di parametri. È la più grande collaborazione di ricercatori di intelligenza artificiale mai coinvolta in un progetto ed è stata addestrata su un colosso 386 GPU per 3,5 mesi. Può risolvere una varietà di problemi di pensiero logico in matematica, statistica di codifica e altro ancora. Può anche generare testo in 46 lingue naturali e 13 linguaggi di programmazione, rendendolo uno dei modelli di linguaggio di grandi dimensioni più robusti oggi disponibili. 

 
Perché Microsoft e Google non hanno raggiunto? 
Anche se i giganti della tecnologia hanno speso miliardi di dollari nella ricerca e nello sviluppo di algoritmi di intelligenza artificiale generativa, sono ancora riluttanti ad aprirlo al pubblico. Probabilmente, Microsoft Azure è stata una delle prime piattaforme a rendere disponibili questi servizi ai clienti aziendali. Nel 2020 ha ottenuto una licenza esclusiva per il modello linguistico GPT-3, che ha poi reso parte della piattaforma Azure OpenAI . Il servizio fornisce l’accesso API REST a molti modelli di linguaggio OpenAI, incluso GPT-3. 

Anche se Azure offre l’accesso API ai potenti algoritmi di OpenAI, non è aperto a tutti. Coloro che desiderano accedere al servizio devono prima passare attraverso un processo di richiesta e quindi una revisione del caso d’uso per assicurarsi che si tratti di uno scenario a basso rischio. Come possiamo vedere, questa è una tendenza continua tra i fornitori di servizi cloud poiché si rendono conto dell’impatto sociale del rilascio al pubblico di algoritmi di intelligenza artificiale generativa altamente accurati. 

Google, d’altra parte, ha completamente chiuso al grande pubblico i risultati della sua ricerca sull’IA. Hanno creato un generatore di testo in immagine chiamato Imagen , che è stato recentemente aggiornato per poter generare anche video. Tuttavia, il modello è stato mantenuto un “segreto commerciale” da Google, con i ricercatori che citano i possibili impatti sociali del rilascio di un tale algoritmo al pubblico. Citando “potenziali rischi di uso improprio”, hanno deciso di non rendere pubblico il codice e devono ancora offrirlo come servizio sulla loro piattaforma cloud. 

Il lato oscuro dell’IA generativa basata sul cloud
Microsoft afferma che mentre i modelli generativi hanno notevoli potenziali vantaggi, hanno anche un enorme potenziale per essere utilizzati in modo improprio per creare grandi volumi di contenuti dannosi. Inoltre, riconoscono che i set di dati utilizzati per addestrare questi algoritmi hanno anche pregiudizi intrinseci a causa della loro natura non curata. Microsoft ha anche preso una posizione forte contro l’uso irresponsabile di alcuni algoritmi di intelligenza artificiale, vedendo le probabili conseguenze negative di un’IA incontrollata abbinata a una potenza di cloud computing di facile utilizzo. 

Google ha anche bloccato l’accesso a Imagen con lo stesso ragionamento. Nel suo post sul blog riguardante l’uso dell’algoritmo, ha affermato che mentre sta lavorando a un framework per bilanciare il valore del controllo esterno e i rischi dell’accesso aperto senza restrizioni, ha anche scoperto che Imagen codifica diversi pregiudizi e stereotipi sociali. Nei suoi test, ciò ha comportato un pregiudizio nella generazione di immagini di persone con un tono della pelle più chiaro, una tendenza a ritrarre donne in professioni rinforzate da stereotipi di genere e molti altri problemi, che li hanno portati a rimandare la pubblicazione del modello. 

Quando si osserva l’atteggiamento estremo con cui altri fornitori di servizi cloud si sono avvicinati all’IA generativa, è sconcertante vedere AWS aprire sia Bloom che Stable Diffusion al pubblico senza restrizioni. Inoltre, sono anche pronti per essere distribuiti in qualsiasi ambiente aziendale, con la potenza dell’infrastruttura pressoché infinita di AWS. Hanno anche preaddestrato il modello, consentendo agli ingegneri di eseguirlo così com’è per l’inferenza o di perfezionarlo ulteriormente per adattare il tipo di contenuto che desiderano creare. 

Ad esempio, un utente con contenuti dannosi può utilizzare il già capace Bloom, ora ospitato sul cloud con la possibilità di scalare, per creare quantità voluminose di contenuti destinati a un determinato gruppo di persone, che possono quindi essere utilizzati per promuovere un diffamato obiettivo. D’altra parte, Stable Diffusion può essere utilizzato per creare immagini di contenuti offensivi o odiosi, aggravando ulteriormente i pregiudizi intrinseci già presenti in tali modelli. Offrire tali contenuti sul mercato aperto sembra una ricetta per il disastro per AWS. Resta da vedere quale impatto avrà questa mossa sul mondo nel suo insieme. 

stable diffusion

Di ihal