Il viaggio di Stability AI nell’Intelligenza Artificiale: un anno di successi, critiche e open source

Ieri, Stability AI, l’azienda di intelligenza artificiale con sede a San Francisco, ha celebrato il primo anniversario del suo viaggio nel campo dell’intelligenza artificiale generativa. Il CEO, Emad Mostaque, riflette con orgoglio sul suo contributo all’ambito dell’intelligenza artificiale open source e ritiene di meritare il Premio Nobel per aver sviluppato un’autentica intelligenza artificiale aperta attraverso i suoi modelli innovativi.

L’ambizione di Mostaque non è priva di fondamento: i modelli creati dalla sua azienda si sono affermati come i più diffusi, come conferma una recente analisi di Everypixel. I suoi modelli open source dominano il mercato con una quota dell’81,32%, distanziando concorrenti di rilievo come Midjourney (6,23%), DALL·E 2 di OpenAI (5,92%) e Adobe (6,5%).

Stando alle dichiarazioni di Mostaque, Stable Diffusion conta su oltre 10 milioni di utenti su varie piattaforme. Tuttavia, il suo concorrente Midjourney vanta la base utenti più ampia, con ben 15 milioni di utenti.

Nonostante il successo di Stability AI e la sua narrazione incentrata sull’open source, emergono anche aspetti negativi. Accanto all’importante finanziamento di 100 milioni di dollari e alla leadership predominante nel mercato, circolano accuse interne riguardanti lacune nella gestione del CEO e segnalazioni di fatture irregolari per un totale di 70.000 dollari, complicando ulteriormente la situazione. All’inizio di quest’estate, Forbes ha pubblicato un articolo rivelatore che mette in dubbio le affermazioni accademiche di Mostaque riguardo al conseguimento di un master a Oxford.

Nonostante le sfide interne che l’azienda sta affrontando, l’approccio all’open source è rimasto centrale alla strategia di Stability AI per coinvolgere la comunità sperimentale, e questo merita riconoscimento. Nel corso dell’anno, l’azienda ha lanciato vari strumenti, inclusa una versione open source di DreamStudio, un’interfaccia commerciale per Stable Diffusion. Le versioni dei modelli sono state resi liberamente accessibili al download e alla modifica fin dal loro debutto nell’agosto 2022. All’inizio di quest’anno, l’azienda ha inoltre rilasciato StableLM, una suite di modelli linguistici di ampia portata, anch’essi open source.

Gli strumenti di generazione artistica basati sull’intelligenza artificiale stanno producendo opere premiate, tra cui immagini, fumetti e copertine di riviste di alta qualità, ma allo stesso tempo sono al centro di dispute legali. Oltre alla crescente popolarità, sono sorte preoccupazioni sulla privacy, la disinformazione e la mancanza di contesto. A Natale scorso, i social media sono stati invasi dagli “avatar” generati da Lensa, un’applicazione popolare ma controversa basata su modelli di diffusione. Con la diffusione virale di Lensa, sono emerse preoccupazioni sul trattamento e l’archiviazione delle foto e delle immagini degli utenti. Prisma Labs, la società dietro Lensa, ha assicurato che le foto caricate vengono eliminate entro 24 ore dopo la generazione degli avatar.

Alcuni utenti hanno notato che Lensa tende a accentuare eccessivamente alcune parti del corpo delle donne o a alterare il colore degli occhi e le caratteristiche del volto per rimuovere attributi riconoscibili dal punto di vista razziale o etnico.

“Strumenti di questo genere possono avere un aspetto accattivante,” ha commentato Jennifer King, ricercatrice specializzata in privacy e politiche dei dati presso lo Stanford Institute for Human-Centered Artificial Intelligence. “Tuttavia, senza adeguate linee guida, possono sorgere numerosi problemi.”

Il rapporto di Everypixel evidenzia che nell’arco di soli diciotto mesi, l’arte generata dall’intelligenza artificiale ha superato in quantità ogni opera visiva creata dall’umanità negli ultimi centocinquanta anni.

È interessante notare che Adobe sta registrando la crescita più rapida nella base utenti di tutti i tempi. Questo veterano nel campo del software di progettazione ha raggiunto un miliardo di utenti per i suoi servizi di intelligenza artificiale in soli tre mesi dal lancio. Tuttavia, nonostante l’espansione della base utenti, l’approccio dell’azienda di evitare materiali protetti da copyright ha comportato una ridotta qualità del prodotto finale.

La ricerca ha anche rivelato che sono state create oltre 11 miliardi di immagini utilizzando modelli provenienti da tre repository – GitHub, HuggingFace e Civitai – nei quali gli utenti hanno caricato decine di migliaia di modelli basati su Stable Diffusion.

Nonostante le questioni legate al copyright siano un argomento familiare nell’ambito dell’intelligenza artificiale, aziende come DeepMind stanno trovando soluzioni attraverso iniziative come Visualizing AI. Questa iniziativa è un esempio di come l’industria possa evolversi in armonia con il panorama circostante, un percorso da cui Mostaque e altri possono trarre spunto.

Il viaggio di Stability AI nell’Intelligenza Artificiale: un anno di successi, critiche e open source

DiFantasy

Di Fantasy

Articoli correlati

ChatGPT Work porta GPT-5.6 nei workflow aziendali complessi

Anthropic introduce Reflect per analizzare il modo in cui gli utenti usano Claude

Meta lancia Muse Spark 1.1 per agenti AI, coding e workflow multimodali

Ultimi Post

ChatGPT Work porta GPT-5.6 nei workflow aziendali complessi

Anthropic introduce Reflect per analizzare il modo in cui gli utenti usano Claude

Meta lancia Muse Spark 1.1 per agenti AI, coding e workflow multimodali

TabFM di Google porta i foundation model nel machine learning tabellare