Come previsto, sia il mondo che i creatori di intelligenza artificiale generativa stanno riconoscendo il valore dei contenuti prodotti dagli esseri umani. Tuttavia, al momento, sembra che vogliano ottenere questi contenuti gratuitamente.
Ah, internet. In passato era considerata una promettente utopia di informazioni e connessioni, ma ora sembra essere stata trasformata in un inquietante parco giochi distopico per l’IA generativa e i suoi sviluppatori che sembrano voler seminare il caos. Sebbene storie di macchine ribellanti contro i loro creatori siano presenti nella fantascienza, chi avrebbe mai pensato che questa ribellione si sarebbe manifestata nel modo sinistro di estrarre le nostre vite digitali attraverso il web?
Da diversi mesi, la Writer’s Guild of America sta protestando contro l’impiego dell’intelligenza artificiale nella scrittura di sceneggiature. Più di recente, circa 8.000 autori hanno sottoscritto una petizione rivolta alle grandi aziende tech per ottenere compensazioni per l’uso dei loro dati nell’addestramento dei modelli di intelligenza artificiale. Le persone stanno gradualmente riconoscendo che il loro contenuto originale è estremamente prezioso per questi modelli e quindi chiedono un compenso adeguato.
Dall’altra parte, le grandi aziende tech sembrano essere alla disperata ricerca di nuovi contenuti, agendo come avvoltoi tecnologici che si nutrono delle tracce dei nostri contenuti una volta privati e protetti. Sembra che ritengano che i loro modelli di intelligenza artificiale generativa, come Bard e ChatGPT, potrebbero declinare senza un aiuto esterno.
OpenAI, l’azienda dietro ChatGPT, ha introdotto GPTBot per scandagliare il web al fine di addestrare i suoi modelli di intelligenza artificiale, forse per la prossima generazione di GPT. Inoltre, se gli utenti desiderano evitare che i loro contenuti vengano utilizzati per addestrare questi modelli, devono volontariamente bloccare il bot di OpenAI. Inoltre, OpenAI ha stretto collaborazioni strategiche con agenzie di stampa per garantire una maggiore rilevanza legale ai propri modelli.
Tuttavia, questa discussione sull’estrazione di informazioni dal web non ha impedito a Google di prendere posizione con una prospettiva controversa. Secondo un rapporto recente, Google ha intrapreso un dialogo con il governo australiano per rivedere il quadro normativo del copyright in relazione all’IA, cercando di consentire ai sistemi di intelligenza artificiale generativa di Google di estrarre dati dal web. Ciò è accaduto dopo che Google ha aggiornato la sua politica sulla privacy, dichiarando di utilizzare tutte le informazioni per addestrare i propri modelli di intelligenza artificiale.
La Writer’s Guild of America è praticamente in piedi a difendere la scrittura scenica dall’intrusione dell’intelligenza artificiale. I membri si sono uniti per richiedere una compensazione per l’utilizzo dei loro dati. Sembra che la loro creatività sia stata non solo rubata, ma anche commercializzata. Ora si sono svegliati e stanno lottando contro i mastodontici modelli di intelligenza artificiale.
D’altro canto, mentre il progresso tecnologico dovrebbe portare benefici alla società, sembra che i modelli di intelligenza artificiale generativa abbiano completamente ignorato questo concetto. Modelli come GPT, Bard e Stable Diffusion stanno scivolando verso una mediocrità evidente, e le ragioni di tale declino non sono un segreto.
Il “cannibalismo dei dati” – ossia quando questi algoritmi vengono addestrati sui loro stessi risultati mediocri – sta portando a un deterioramento della qualità del loro output più velocemente di una canzone pop che diventa stantia. E ora sembrano dipendere sempre di più dai contenuti generati dagli esseri umani presenti su Internet.
Il punto centrale di questa questione è rappresentato da un’equazione molto semplice: maggiore quantità di contenuti generati dall’IA su Internet = modelli di intelligenza artificiale che si nutrono di questi contenuti + degrado della qualità nel dimenticatoio. Questo preoccupante fenomeno è stato recentemente analizzato in un articolo accademico realizzato dalla Stanford University e dalla Rice University. Intitolato “Self-Consuming Generative Models Go MAD” (Modelli Generativi Auto-Consumanti Impazziscono), il documento rivela la triste realtà dell’IA che precipita nella follia attraverso l’auto-indulgenza.
Ciò implica che i modelli di intelligenza artificiale delle grandi aziende tech, in particolare quelli generativi, bramano sempre più contenuti prodotti dagli esseri umani per migliorare se stessi. Non sembra importare se desideri o meno che i tuoi dati vengano utilizzati da loro; troveranno sempre un modo per accedere ai tuoi contenuti. Quando ci si iscrive al programma di Elon Musk, X, si sta già implicitamente accettando che i propri pensieri siano utilizzati per addestrare i modelli di intelligenza artificiale.
Quindi, è forse giunto il momento di staccare collettivamente la spina dalla nostra presenza online? Forse sì, almeno per un periodo di tempo. Questo è ciò che ha fatto persino Reddit. Sebbene Internet in passato promettesse informazioni e connessione, sta gradualmente trasformandosi in un territorio digitale desolato in cui l’IA si ciba dei nostri dati e restituisce sciocchezze prive di valore.
Tuttavia, se hai mai desiderato che la tua brillante scrittura servisse da nutrimento per l’IA, continua pure a condividere i tuoi contenuti. Sta a te decidere se vuoi contribuire a migliorare i modelli di intelligenza artificiale generativa o preservare la privacy dei tuoi dati. Tieni soltanto presente che ogni tweet spiritoso e post sincero potrebbe, inavvertitamente, contribuire a un’apocalisse guidata da algoritmi poco brillanti. Potrebbe essere perspicace guadagnare qualche guadagno da questa situazione, poiché i contenuti generati dagli esseri umani potrebbero diventare estremamente preziosi nei prossimi anni.