L’intelligenza artificiale (IA) ha fatto enormi progressi nel comprendere e generare linguaggio naturale, ma quando si tratta di riprodurre con autenticità il linguaggio storico, le sfide diventano evidenti. Uno studio recente condotto da ricercatori delle università dell’Illinois, della British Columbia e della Cornell ha esaminato le difficoltà dei modelli linguistici nel simulare lo stile e il contenuto di testi storici senza incorrere in anacronismi.
I ricercatori hanno testato diversi approcci per generare testi che imitassero lo stile linguistico di inizio Novecento. Inizialmente, hanno utilizzato semplici prompt con testi dell’epoca, chiedendo a modelli come ChatGPT-4o di continuare i brani nello stesso stile. Tuttavia, i risultati ottenuti non erano soddisfacenti: anche con prompt accurati, il modello tendeva a produrre testi con un linguaggio moderno, distaccandosi dallo stile richiesto. Questo suggerisce che l’addestramento superficiale non è sufficiente per catturare le sfumature linguistiche e concettuali del passato.
Successivamente, gli studiosi hanno affinato un modello GPT-2 su una selezione di libri pubblicati tra il 1880 e il 1914. I risultati sono migliorati: il modello fine-tuned ha prodotto testi stilisticamente più coerenti con l’epoca. Tuttavia, anche in questo caso, i lettori umani riuscivano a individuare tracce di linguaggio moderno, indicando che l’addestramento su un corpus limitato non è sufficiente a riprodurre fedelmente il linguaggio storico.
Una delle conclusioni principali dello studio è che l’anacronismo potrebbe essere un compromesso inevitabile quando si cerca di emulare il linguaggio del passato. Anche con modelli addestrati su testi storici, è difficile evitare completamente l’influenza del linguaggio contemporaneo. Gli stessi ricercatori suggeriscono che la rappresentazione del passato attraverso l’IA implica sempre una negoziazione tra autenticità storica e fluidità conversazionale.
Questi risultati hanno implicazioni significative per l’uso dell’IA nella ricerca storica e nella creazione di contenuti narrativi. Se da un lato l’IA può essere uno strumento potente per analizzare e sintetizzare informazioni storiche, dall’altro lato, la sua capacità di riprodurre fedelmente il linguaggio e le prospettive del passato rimane limitata. Gli storici e i narratori devono essere consapevoli di queste limitazioni e considerare l’IA come un complemento, piuttosto che un sostituto, del lavoro umano nella comprensione e rappresentazione del passato.