Nel panorama in continua evoluzione dell’intelligenza artificiale, le questioni legali relative all’uso dei dati per l’addestramento dei modelli sono diventate sempre più rilevanti. Recentemente, OpenAI ha ottenuto una vittoria significativa in questo contesto: il tribunale distrettuale meridionale di New York ha respinto una causa per violazione del copyright intentata da Raw Story Media, Inc. e AlterNet Media, Inc., due testate giornalistiche online di orientamento progressista. Le aziende avevano accusato OpenAI di aver utilizzato i loro contenuti senza autorizzazione per addestrare i propri modelli di intelligenza artificiale.

La causa si basava sulla presunta violazione della Sezione 1202(b) del Digital Millennium Copyright Act (DMCA), che protegge le “informazioni sulla gestione del copyright” (CMI). Queste informazioni includono dettagli come il nome dell’autore e il titolo dell’opera, che identificano i lavori protetti da copyright. La Sezione 1202(b) vieta la rimozione o l’alterazione non autorizzata di tali informazioni, specialmente se ciò facilita la violazione del copyright.

Raw Story e AlterNet sostenevano che OpenAI avesse utilizzato articoli dai loro siti web per addestrare modelli come ChatGPT, senza mantenere le CMI, violando così la suddetta sezione del DMCA. Tuttavia, il giudice Colleen McMahon ha accolto la mozione di OpenAI per respingere il caso, citando la mancanza di legittimazione da parte dei querelanti.

Questa decisione rappresenta un precedente importante nella discussione in corso sull’uso dei dati per l’addestramento dei modelli di intelligenza artificiale. Mentre le aziende tecnologiche sostengono che l’uso di dati pubblicamente disponibili rientri nel “fair use” e sia essenziale per lo sviluppo di modelli avanzati, le organizzazioni di media e i creatori di contenuti esprimono preoccupazioni riguardo alla protezione dei loro diritti d’autore e alla necessità di compensazione per l’uso dei loro lavori.

È importante notare che, sebbene questa causa sia stata respinta, altre azioni legali simili sono in corso. Ad esempio, il New York Times ha intentato una causa contro OpenAI e Microsoft per presunta violazione del copyright, sostenendo che i loro articoli siano stati utilizzati senza autorizzazione per addestrare modelli di intelligenza artificiale. Questi casi potrebbero avere implicazioni significative per il futuro dell’IA e per le pratiche di utilizzo dei dati da parte delle aziende tecnologiche.

Di Fantasy