Nvidia è finita sotto accusa per aver raccolto contenuti protetti da copyright senza autorizzazione per addestrare i suoi modelli di intelligenza artificiale (IA). Secondo quanto riportato da 404 Media il 5 agosto, l’azienda avrebbe incaricato i suoi dipendenti di scaricare video da YouTube e Netflix per sviluppare il nuovo modello di IA chiamato “Cosmos”. Questo modello è utilizzato per progetti come la generazione di mondi 3D, i sistemi di guida autonoma e la creazione di avatar digitali.
Per evitare di essere scoperta, Nvidia avrebbe utilizzato tecniche come la modifica degli indirizzi IP e l’uso di macchine virtuali su Amazon Web Services (AWS). Si dice che l’azienda abbia scaricato l’equivalente di 80 anni di video in un solo giorno, utilizzando da 20 a 30 macchine virtuali contemporaneamente.
Nvidia ha dichiarato che queste pratiche erano legali. Un portavoce dell’azienda ha detto: “NVIDIA rispetta i diritti di tutti i creatori di contenuti e siamo certi che i nostri modelli e le attività di ricerca siano pienamente conformi alla legge sul copyright.” Ha anche aggiunto che la legge sul copyright protegge solo le espressioni creative, non le idee, i dati o le informazioni, che possono essere utilizzati per creare nuovi modelli.
Tuttavia, YouTube ha subito smentito queste affermazioni, affermando che l’uso dei suoi video per addestrare modelli di IA viola chiaramente i suoi termini di servizio. Netflix ha fatto eco a questa posizione, dichiarando che non ha alcun accordo con Nvidia per la raccolta dei suoi contenuti e che i suoi termini di servizio vietano lo scraping dei video.
Alcuni dipendenti di Nvidia hanno espresso preoccupazioni etiche e legali riguardo a queste pratiche, ma i manager dell’azienda hanno confermato che tali attività erano state approvate dai vertici.
Oltre ai video di YouTube e Netflix, Nvidia ha utilizzato anche altri dati, come trailer di film da Moviet, una libreria interna di filmati di videogiochi e set di dati come GitHub Webvid e “Internvid-10M”. Quest’ultimo contiene 10 milioni di ID video di YouTube. Alcuni di questi dati erano destinati solo alla ricerca accademica, come la libreria “HD-VG-130M” con 130 milioni di video di YouTube, ma Nvidia ha affermato che i dati utilizzati per i suoi prodotti commerciali non violavano tali condizioni.