arXiv, il principale repository di preprint per informatica, matematica, fisica e discipline affini, ha annunciato una nuova politica sanzionatoria nei confronti degli autori che pubblicano paper contenenti prove evidenti di un utilizzo negligente dei modelli linguistici di grandi dimensioni. La misura è operativa e prevede, in caso di violazione accertata, il divieto di pubblicazione sulla piattaforma per un periodo di un anno. Non si tratta di un avviso o di un monito, ma di una politica denominata esplicitamente “one-strike”: una sola infrazione documentata è sufficiente per l’esclusione.
Per capire il peso di questa decisione è necessario contestualizzare il ruolo di arXiv nell’ecosistema della ricerca scientifica contemporanea. La piattaforma non è una rivista peer-reviewed: è un archivio di preprint, ovvero di manoscritti che vengono condivisi pubblicamente prima di aver superato un processo formale di revisione tra pari. Questo modello ha accelerato enormemente la circolazione della conoscenza scientifica, in particolare nei campi a rapida evoluzione come il machine learning e la fisica teorica, dove attendere mesi o anni per la pubblicazione su rivista significherebbe rendere obsoleti i contributi prima ancora della loro diffusione ufficiale. Proprio per questo, arXiv è diventata la fonte primaria a cui ricercatori, ingegneri e accademici si rivolgono per tenersi aggiornati sullo stato dell’arte. La sua autorevolezza de facto supera spesso quella delle stesse riviste indicizzate.
Il problema che la nuova politica cerca di affrontare è specifico e documentato: con la diffusione dei modelli linguistici avanzati, è aumentata drasticamente la quantità di paper che utilizzano questi strumenti in modo non controllato, lasciando nel testo dell’elaborato tracce inequivocabili di generazione automatica non supervisionata. I casi più gravi riguardano due categorie distinte di artefatti. La prima è quella delle hallucinated references: citazioni bibliografiche generate dal modello che non esistono nella realtà, con titoli plausibili, autori verosimili e anni di pubblicazione credibili, ma che corrispondono a paper mai scritti. Questo tipo di errore è particolarmente insidioso perché può superare una lettura superficiale e minare l’intero apparato referenziale del paper, rendendo impossibile per chiunque verificare le fonti dichiarate. La seconda categoria riguarda le tracce di interazione diretta con il modello rimaste nel testo finale: frasi come “migliora questo paragrafo in stile accademico” o “riscrivi questa sezione con un tono più formale” che l’autore ha copiato e incollato da una sessione di chat con un LLM e che sono finite nel documento pubblicato senza essere state rimosse. Questo tipo di artefatto dimostra in modo inequivoco non solo che il modello è stato utilizzato per generare o modificare il testo, ma che l’autore non ha nemmeno riletto il proprio lavoro prima di inviarlo.
La logica sottostante alla nuova politica è esplicitata chiaramente dal responsabile della sezione di informatica di arXiv, Thomas Dietterich: la presenza di queste tracce nel paper è trattata come prova che l’autore non ha verificato il contenuto del proprio elaborato. Non è l’uso dell’AI in sé ad essere sanzionato — arXiv non vieta l’assistenza dei modelli linguistici nella scrittura o nella revisione — ma la mancanza di supervisione intellettuale da parte dell’autore sul prodotto finale. La responsabilità del contenuto resta interamente in capo a chi firma il paper, indipendentemente da come quel contenuto è stato generato. Quando le tracce di un’elaborazione non supervisionata sono visibili nel documento, quella responsabilità non è stata esercitata, e la policy interviene di conseguenza.
La sanzione non scatta in modo automatico. Il processo prevede che il personale di arXiv identifichi il problema, che il responsabile di sezione competente esamini le prove disponibili e che solo a seguito di questa verifica venga emessa la decisione definitiva. Gli autori mantengono la possibilità di fare appello. Questo impianto garantisce un minimo di giudizio umano nel processo sanzionatorio e riduce il rischio di falsi positivi, che sarebbero particolarmente dannosi in un contesto dove la reputazione dei ricercatori è strettamente legata alla loro capacità di pubblicare.
Dopo la scadenza del ban annuale, la revoca dell’accesso non è immediata e incondizionata: per un ulteriore periodo, i paper dell’autore sanzionato potranno essere caricati su arXiv solo se già accettati da una rivista peer-reviewed o da una conferenza con revisione formale. Questa clausola aggiuntiva è significativa perché introduce de facto un requisito di validazione esterna come condizione per il ripristino dell’accesso diretto alla piattaforma. È una misura che riconosce implicitamente che il danno di un paper con hallucinated references su arXiv — che viene letto, citato e diffuso prima di qualsiasi revisione — può essere sostanzialmente più grave di un errore analogo che avviene dentro il ciclo formale di peer review, dove i referee hanno la possibilità di intercettarlo prima della pubblicazione.
Questa decisione si inserisce in un contesto più ampio di crescente preoccupazione per quello che viene chiamato “AI slop” nella letteratura scientifica: un volume crescente di output generati con strumenti AI che hanno l’apparenza formale della ricerca accademica ma che mancano del rigore intellettuale necessario per essere scientificamente utili. arXiv aveva già introdotto in precedenza un sistema di endorsement per i nuovi utenti, richiedendo che un ricercatore già registrato sulla piattaforma validasse l’accesso di chi si iscriveva per la prima volta. La nuova policy sanzionatoria rappresenta un ulteriore innalzamento del livello di guardia, e segna una presa di posizione netta: la democratizzazione dell’accesso alla pubblicazione scientifica non può avvenire al costo della degradazione della qualità del corpus scientifico disponibile.
