Microsoft e Meta sono state recentemente citate in giudizio da un gruppo di autori cristiani, tra cui il noto ex governatore dell’Arkansas Mike Huckabee e la celebre scrittrice Lisa Tuckerst, per presunta violazione del copyright. La notizia, riportata da Reuters, sottolinea che le due tech-giganti avrebbero utilizzato senza permesso testi di varie opere per formare i loro modelli di intelligenza artificiale.
Le acquisizioni affermano che il contenuto è stato preso da un database denominato “Books3”, ritenuto contenere decine di migliaia di libri ottenuti illegalmente, tra cui opere degli stessi querelanti. Gli autori sottolineano che non c’è nulla di male nell’utilizzare libri come fonti di dati, ma l’approccio diventa problematico quando si utilizzano copie non autorizzate, privando gli autori dei dovuti compensi.
Eleuthe AI, un’organizzazione no-profit, è stata indicata come colpevole di includere “Books3” in un set di dati open-source denominato “Pile”, pensato per formare modelli linguistici avanzati. Meta avrebbe poi utilizzato questi dati per addestrare il proprio modello “Llama”, e successivamente collaborato con Microsoft per un’iterazione aggiornata, “Llama 2”. Anche Bloomberg viene tirato in causa, avendo utilizzato “Books3” per il suo modello linguistico focalizzato sul settore finanziario.
Queste cause legali mettono in evidenza una tendenza crescente nel settore tecnologico. Le aziende che sviluppano modelli di linguaggio su larga scala (LLM) si trovano sempre più nel mirino delle azioni legali per violazione del copyright. Solo di recente, case discografiche di fama mondiale hanno richiesto risarcimenti ad Antropic, mentre autori di best seller come George RR Martin e John Grisham hanno preso di mira OpenAI. La questione riguarda la crescente preoccupazione sul come e da dove le aziende ottengono i dati per formare i loro potenti algoritmi di intelligenza artificiale.