L’IA da testo a immagine può imparare l’etica o il futuro è condannato?
Nel febbraio di quest’anno, l’Ufficio del copyright degli Stati Uniti ha stabilito che “la paternità umana è un prerequisito per la protezione del copyright” per l’arte generata dall’IA e ha rifiutato di garantire la protezione del copyright per le immagini realizzate dall’IA.
Gli strumenti di generazione dell’IA da testo a immagine sono entrati nella loro fase di selvaggio west. La tendenza travolgente che DALL.E 2 di Open AI ha avviato con grande cautela si è drasticamente trasformata in un mondo in cui tutto è permesso.
La scorsa settimana, la startup Stability.ai con sede a Londra e Los Altos ha rilasciato al pubblico Stable Diffusion, il suo generatore di testo a immagine open source . Paragonabili in termini di qualità a DALL.E 2 e Midjourney , le implicazioni del passo compiuto da Stability.ai sono enormi e significano esattamente questo: chiunque ora può prendere il codice e replicarlo per creare app gratuite per il text-to-image compiti.
Inoltre, Stable Diffusion , a differenza dei suoi predecessori, non ha praticamente alcuna restrizione che impedisca agli utenti di generare immagini con contenuti inappropriati o personalità di spicco. La versione beta di DALL.E 2 , che ora sarà venduta a un milione di persone nella sua lista d’attesa in crescita, ha alcuni filtri di richiesta a livello di parole chiave e modifiche al modello che impediscono agli utenti di generare somiglianze di persone reali.
Livellare il campo di gioco
Durante il rilascio dello strumento, Emad Mostaque , il fondatore di Stability.ai, ha affermato di voler “democratizzare la generazione di immagini in un modo che creerebbe un ecosistema aperto che esplorerà veramente i confini dello spazio latente”. Mostaque, un alunno di Oxford, ha co-fondato un progetto chiamato Symmitree che è stato avviato per ridurre il costo degli smartphone e di Internet per le fasce svantaggiate della società.
In una recente intervista al Washington Post, Mostaque ha parlato con orgoglio dell’indipendenza della sua startup. Parlando contro la percepita cautela di altre organizzazioni Big Tech, Mostaque ha affermato: “Credo che il controllo di questi modelli non debba essere determinato da un gruppo di auto-nominati a Palo Alto. Credo che dovrebbero essere aperti”.
DALL.E 2 di OpenAI e Imagen di Google sono stati chiusi al pubblico sin dal loro lancio, ad eccezione di un numero selezionato di artisti. Mentre Imagen è ancora chiuso, OpenAI ha accelerato la disponibilità dello strumento per la sua lista d’attesa, anche se con riluttanza. Sebbene gli esperti abbiano raccomandato l’open sourcing di questi strumenti per migliorarli, Big Tech era diffidente nei confronti della responsabilità e della potenziale censura che sarebbero derivate dall’uso improprio di questi strumenti. Era naturale che un giocatore più piccolo mordesse il proiettile. E Stable Diffusion l’ha fatto.
Pericoli senza filtri, gratis per tutti
Dall’annuncio, le immagini generate da Stable Diffusion hanno iniziato ad apparire ovunque. Numerosi servizi di generazione artistica come Artbreeder e Pixelz.ai hanno raggiunto rapidamente e hanno iniziato a utilizzare Stable Diffusion. (Proprio la scorsa settimana, un portafoglio indiano di iniziative mediatiche Eros Investments ha annunciato una partnership con Stability.ai)
E con immagini artisticamente brillanti e fotorealistiche, sono arrivate molte problematiche. La modella è trapelata sul famigerato forum di discussione 4chan, popolare soprattutto tra i giovani maschi, che si è affrettato a sfornare contenuti pornografici e immagini con celebrità nude. L’empia combinazione di open source e senza restrizioni ha immediatamente portato la possibilità di deepfake molto più vicini di quanto non fossero.
Le immagini della guerra Russia-Ucraina, l’invasione cinese di Taiwan, il primo ministro britannico Boris Johnson che balla con una donna e il primo ministro indiano Modi con un coltello possono essere facilmente generati con un livello di abilità accettabile. Stable Diffusion ha anche superato di un miglio la qualità di strumenti open source alternativi come Craiyon di Hugging Face (precedentemente noto come DALL.E Mini) e Disco Diffusion. Anche un certo numero di suggerimenti problematici scivolano tra le crepe in Midjourney.
Lo strumento non è del tutto privo di garanzie. Ha uno strumento AI regolabile chiamato Safety Classifier come parte del pacchetto software Stable Diffusion che rileva e blocca le immagini offensive. Tuttavia, lo strumento può essere facilmente disabilitato, rendendolo inutile. Le persone hanno anche sviluppato Google Colabs per creare progetti dai prompt e disabilitare filigrane e filtri NSFW che da allora sono stati introdotti nella versione Stable Diffusion Github.
Copyright e questioni legali
A parte l’uso improprio di queste immagini per produrre notizie false e creare isteria, i problemi di copyright sono un altro punto controverso. Attualmente, c’è poco o nessun consenso legale sul copyright di un’opera d’arte AI. Nel febbraio di quest’anno, l’ Ufficio del copyright degli Stati Uniti ha stabilito che “la paternità umana è un prerequisito per la protezione del copyright” per l’arte generata dall’IA e ha rifiutato di garantire la protezione del copyright per le immagini realizzate dall’IA. La sentenza è attualmente impugnata in un tribunale federale. La decisione è difficile. L’arte generata dall’IA è per lo più tratta da arte realizzata nel mondo fisico reale. Gli artisti hanno trovato progetti che copiavano Stable Diffusion e utilizzavano truffe di vere opere d’arte realizzate da artisti.
In un altro caso , Carlos Paboudjiain, un dipendente di un’agenzia di commercio creativo chiamata VMLY&R, ha utilizzato DALL.E 2 e Midjourney per produrre un’intera collezione di abiti firmati sul tema delle immagini del lavoro del regista Wes Anderson.
I vantaggi di Stable Diffusion sono tanto pesanti quanto le sue cadute. Il vaso di Pandora che il rilascio dello strumento ha aperto richiede sfumature e considerazioni dettagliate sulle questioni etiche che lo circondano. Alcuni giorni fa, Mostaque ha affrontato la questione etica in un tweet: “Ad essere onesti, trovo che la maggior parte del dibattito sull’etica dell’IA sia giustificazione del controllo centralizzato, stupidità paternalistica che non si fida delle persone o della società. Stable Diffusion rappresenta Internet così com’è, ma andremo in paesi e società a livello globale per cambiare questa situazione”.
Nel bene e nel male, le immagini prodotte da Stable Diffusion sono un vero riflesso del bel pasticcio che è Internet.
da analyticsindiamag.com