In una causa che mette in tensione privacy, proprietà intellettuale e operazioni aziendali nell’era dell’IA, OpenAI ha ottenuto una battaglia cruciale: il giudice Ona T. Wang, del distretto meridionale di New York, ha revocato una parte significativa dell’ordine che imponeva alla società di conservare in modo indefinito tutti i log di ChatGPT, compressi quelli che altrimenti verrebbero cancellati. Una decisione che alleggerisce vincoli operativi e questioni etiche, pur lasciando aperto il conflitto sul merito della causa per violazione del copyright con il New York Times.
L’origine della controversia risale a dicembre 2023, quando il New York Times intentò una causa contro OpenAI (e Microsoft), sostenendo che le AI avessero assorbito e utilizzato senza autorizzazione contenuti protetti da copyright, danneggiando il modello di business dell’editore basato sugli abbonamenti. Come parte del procedimento, il tribunale aveva emesso, il 13 maggio 2025, un’ordinanza che imponeva a OpenAI di conservare indefinitamente tutti i dati di output — cioè i risultati generati dai modelli, anche quelli che gli utenti avessero richiesto di cancellare — e di segregare questi log in modo da preservare le prove. La misura aveva generato forti obiezioni da parte di OpenAI, che l’aveva definita eccessiva, contraria agli impegni di privacy e gravosa in termini tecnici e operativi.
Nel nuovo ordine, emesso in ottobre, la giudice Wang ha sostanzialmente ridimensionato l’ampiezza di quell’obbligo. OpenAI non è più vincolata a conservare permanentemente i log creati dopo il 26 settembre, e molte delle restrizioni originarie sono state ritirate. Resta però l’obbligo di conservare alcuni dati identificati come rilevanti per utenti specifici coinvolti nella causa, nonché i log già archiviati sotto l’originale ordinanza, che continuano ad essere accessibili per fini processuali.
Questa sentenza è significativa su più piani. Da un lato, rappresenta un alleggerimento concreto per OpenAI: dover mantenere eternamente ogni log di output equivaleva a un costo ingente e a un rischio per la privacy, considerando che gli utenti si aspettano che le chat eliminate vengano effettivamente tolte dai server. OpenAI aveva già fatto leva su questo aspetto, sostenendo che la conservazione perpetua violava le sue stesse politiche e i principi di riservatezza.
Dall’altro lato, però, la causa per violazione del copyright non è conclusa: la sentenza non interviene sul merito dell’accusa che OpenAI abbia “copiato” contenuti del New York Times. Ciò che cambia è l’onere di conservazione e le modalità di gestione dei dati nel corso del processo, non il diritto dell’editore a sostenere che i modelli abbiano sfruttato il suo materiale in modo illecito. Il risultato è un compromesso, nella misura in cui il tribunale mira a bilanciare esigenze probatorie e protezione della privacy.
In pratica, per gli utenti di ChatGPT, questo vuol dire che le politiche di eliminazione delle chat possono riprendere a operare per la maggior parte dei casi: non ogni output verrà conservato indefinitamente. Tuttavia, per quegli account o conversazioni implicate nella causa, potrebbero continuare a esserci vincoli speciali. Il compromesso è una forma di “eccezione processuale” più che un ritorno totale alla normalità.
Un aspetto da non sottovalutare è la posta che va oltre la contesa legale specifica: questa vicenda illumina un nodo che ogni azienda che opera con modelli generativi deve affrontare, ovvero il bilanciamento fra trasparenza (o conservazione dei dati per fini probatori) e tutela della privacy degli utenti. In un mondo in cui le AI dialogano con milioni di persone, il modo in cui si registrano, si archiviano o si cancellano le conversazioni assume un valore giuridico e reputazionale.
La vittoria parziale può essere interpretata come un segnale: la magistratura riconosce che imporre una conservazione “indefinita e incondizionata” è un fardello troppo gravoso rispetto agli obiettivi del processo. Ma non risolve la questione fondamentale: se e in quale misura OpenAI abbia utilizzato contenuti protetti da copyright nei suoi modelli, o se gli output che risultano simili ai testi del New York Times siano frutto di mera ricombinazione legittima, fair use o un’evoluzione consentita nei modelli di linguaggio.