Immagine AI

Negli ultimi mesi ricercatori e sviluppatori hanno osservato un fenomeno insolito che coinvolge numerosi modelli linguistici generativi. Quando viene richiesto di creare racconti originali, molti sistemi AI tendono a generare personaggi, ambientazioni e schemi narrativi sorprendentemente simili. Tra gli esempi più evidenti compare il nome Elias Thorne, un personaggio immaginario che ricorre con frequenza anomala nelle storie prodotte da modelli sviluppati da aziende differenti. Il fenomeno non riguarda soltanto un singolo sistema, ma è stato osservato in chatbot e modelli linguistici appartenenti a diverse famiglie tecnologiche.

L’origine del problema sembra essere collegata al modo in cui vengono costruiti, addestrati e perfezionati i moderni modelli di intelligenza artificiale. Una ricerca condotta presso la Cornell University ha analizzato circa 20.000 racconti generati da diversi sistemi AI, rilevando la presenza ricorrente degli stessi nomi, professioni e archetipi narrativi. Oltre a Elias, compaiono frequentemente personaggi come Mara ed Elara, insieme a figure come guardiani di fari, bibliotecari, orologiai e pescatori. I ricercatori hanno riscontrato che un insieme molto ristretto di parole e personaggi appare in una percentuale estremamente elevata delle storie generate.

La spiegazione tecnica risiede nella crescente dipendenza dell’ecosistema AI da dati sintetici e da procedure di addestramento che riutilizzano contenuti prodotti da altri modelli. Molte aziende utilizzano infatti dataset generati artificialmente per creare nuove basi di addestramento, ampliare set di istruzioni o sviluppare sistemi di allineamento e sicurezza. Questo processo può portare alla propagazione involontaria di particolari schemi linguistici che finiscono per diffondersi da un modello all’altro. Quando un determinato nome o una determinata struttura narrativa compare abbastanza spesso nei dati sintetici, la probabilità che venga nuovamente generata aumenta progressivamente nelle generazioni successive.

Secondo gli studiosi, una delle possibili fonti del fenomeno è rappresentata dai grandi dataset di conversazioni utilizzati per il fine-tuning dei modelli. In questi archivi possono essere presenti migliaia di esempi creati da precedenti generazioni di sistemi AI. Quando tali dati vengono riutilizzati da altri sviluppatori, particolari preferenze statistiche possono essere amplificate invece di essere diluite. Di conseguenza, personaggi inesistenti come Elias Thorne possono trasformarsi in una sorta di “fantasma digitale” che attraversa modelli differenti pur non appartenendo ad alcuna opera letteraria specifica.

Il caso di Elias Thorne rappresenta inoltre un esempio concreto di un fenomeno più ampio noto come model collapse o knowledge collapse. Questo termine descrive una situazione nella quale i modelli iniziano ad apprendere sempre più da contenuti generati da altri modelli invece che da fonti umane originali. Con il passare del tempo la varietà delle risposte tende a ridursi e i sistemi convergono verso schemi linguistici sempre più simili. Alcuni studi evidenziano come la dipendenza crescente da dati sintetici possa compromettere la diversità informativa e creativa delle future generazioni di modelli.

Fenomeni analoghi sono stati osservati anche per altri nomi ricorrenti. Diversi ricercatori hanno documentato la tendenza di numerosi modelli a scegliere personaggi chiamati Elara, Elena Vasquez, Marcus Chen o altre combinazioni che emergono con frequenze molto superiori a quanto ci si aspetterebbe da una generazione realmente casuale. Alcuni studi recenti descrivono questi personaggi come “ghost names”, identità fittizie che finiscono per propagarsi attraverso il web, documenti generati automaticamente e contenuti prodotti da sistemi AI differenti.

Il caso Elias Thorne rappresenta un segnale interessante per comprendere i limiti degli attuali modelli linguistici. Sebbene tali sistemi siano in grado di produrre testi apparentemente originali, gran parte della loro creatività deriva dalla ricombinazione statistica di schemi appresi durante l’addestramento. Quando gli stessi dati vengono riutilizzati ripetutamente all’interno dell’ecosistema AI, le probabilità linguistiche tendono a convergere, generando risultati sempre meno diversificati.

L’emergere spontaneo di personaggi come Elias Thorne mostra quindi come l’industria dell’intelligenza artificiale stia affrontando una nuova sfida: preservare la varietà culturale, narrativa e informativa dei dati utilizzati per addestrare i modelli. Con una quota crescente di contenuti online generata artificialmente, la capacità di distinguere e mantenere fonti umane originali potrebbe diventare uno dei fattori più importanti per evitare che i futuri sistemi AI finiscano per imparare sempre più da sé stessi e sempre meno dal mondo reale.

Di Fantasy