Il nuovo modello di intelligenza artificiale di DeepMind aiuta a decifrare, datare e localizzare antiche iscrizioni
Uno “strumento complementare” per aiutare gli storici a svelare il testo antico


Le tecniche di apprendimento automatico stanno fornendo nuovi strumenti che potrebbero aiutare gli archeologi a comprendere il passato, in particolare quando si tratta di decifrare testi antichi. L’ultimo esempio è un modello di intelligenza artificiale creato dalla sussidiaria di Alphabet DeepMind che aiuta non solo a ripristinare il testo mancante dalle antiche iscrizioni greche, ma offre suggerimenti su quando il testo è stato scritto (entro un periodo di 30 anni) e le sue possibili origini geografiche.

“Le iscrizioni sono davvero importanti perché sono fonti dirette di prove … scritte direttamente dagli stessi antichi popoli”, ha detto ai giornalisti Thea Sommerschield, storica ed esperta di apprendimento automatico che ha contribuito a creare il modello, in una conferenza stampa.

“È DAVVERO DIFFICILE PER UN ESSERE UMANO SFRUTTARE TUTTI I DATI RILEVANTI ESISTENTI”
A causa della loro età, questi testi sono spesso danneggiati, rendendo il restauro una sfida gratificante. E poiché sono spesso incisi su materiale inorganico come pietra o metallo, significa che metodi come la datazione al radiocarbonio non possono essere utilizzati per scoprire quando sono stati scritti. “Per risolvere questi compiti, gli epigrafi cercano parallelismi testuali e contestuali in iscrizioni simili”, ha affermato Sommerschield, che è stato co-responsabile del lavoro insieme allo scienziato ricercatore dello staff di DeepMind Yannis Assael. “Tuttavia, è davvero difficile per un essere umano sfruttare tutti i dati esistenti e rilevanti e scoprire i modelli sottostanti”.

Ecco dove l’apprendimento automatico può aiutare.

Le iscrizioni greche antiche sono spesso frammentate. Il software Ithaca può suggerire quali lettere mancano.

Il nuovo software, chiamato Itaca, è addestrato su un set di dati di circa 78.608 iscrizioni greche antiche, ognuna delle quali è etichettata con metadati che descrivono dove e quando è stata scritta (al meglio delle conoscenze degli storici). Come tutti i sistemi di apprendimento automatico, Ithaca cerca modelli in queste informazioni, codificando queste informazioni in modelli matematici complessi e utilizza queste inferenze per suggerire testo, data e origini.

In un articolo pubblicato su Nature che descrive Itaca, gli scienziati che hanno creato il modello affermano che è accurato al 62% quando si ripristinano lettere in testi danneggiati. Può attribuire l’origine geografica di un’iscrizione a una delle 84 regioni del mondo antico con una precisione del 71% e può datare un testo entro, in media, 30 anni dall’anno di scrittura noto.

Queste sono statistiche promettenti, ma è importante ricordare che Itaca non è in grado di operare indipendentemente dall’esperienza umana. I suoi suggerimenti si basano in definitiva sui dati raccolti dai metodi archeologici tradizionali e i suoi creatori lo stanno posizionando semplicemente come un altro strumento in un insieme più ampio di metodi forensi, piuttosto che come uno storico dell’IA completamente automatizzato. “Itaca è stato progettato come strumento complementare per aiutare gli storici”, ha affermato Sommerschield.

Itaca è il primo modello ad attribuzione geografica e cronologica con restauro testuale.
 Immagine: mente profonda
Eleanor Dickey, professoressa di classici dell’Università di Reading specializzata in sociolinguisti greci e latini antichi, ha detto a The Verge che Itaca è stato uno “sviluppo emozionante che potrebbe migliorare la nostra conoscenza del mondo antico”. Ma ha aggiunto che un’accuratezza del 62% per il ripristino del testo perso non era rassicurante – “quando le persone ci fanno affidamento, dovranno tenere a mente che è sbagliato circa un terzo delle volte” – e che non era sicura di come il software si adatterebbe alle metodologie accademiche esistenti.


Ad esempio, DeepMind ha evidenziato i test che hanno mostrato che il modello ha contribuito a migliorare l’accuratezza degli storici ripristinando il testo mancante nelle iscrizioni antiche dal 25% al ​​72%. Ma Dickey osserva che coloro che sono stati testati erano studenti, non epigrafi professionisti. Dice che i modelli di intelligenza artificiale possono essere ampiamente accessibili, ma ciò non significa che possano o debbano sostituire il piccolo gruppo di accademici specializzati che decifrano i testi.

“Non è ancora chiaro fino a che punto l’uso di questo strumento da parte di editori veramente qualificati comporterebbe un miglioramento delle edizioni generalmente disponibili, ma sarà interessante scoprirlo”, ha affermato Dickey. Ha aggiunto che stava cercando di provare il modello Ithaca da sola. Il software, insieme al suo codice open source, è disponibile online per essere testato da chiunque.

Itaca e il suo predecessore (chiamato Pizia e pubblicato nel 2019 ) sono già stati utilizzati per aiutare i recenti dibattiti archeologici, incluso l’aiuto per datare le iscrizioni scoperte nell’Acropoli di Atene. Tuttavia, il vero potenziale del software deve ancora essere visto.

Sommerschield sottolinea che il vero valore di Itaca potrebbe risiedere nella sua flessibilità. Sebbene sia stato addestrato su antiche iscrizioni greche, potrebbe essere facilmente configurato per funzionare con altre antiche scritture. “L’architettura di Itaca lo rende realmente applicabile a qualsiasi lingua antica, non solo al latino, ma anche al Maya, cuneiforme; davvero qualsiasi mezzo scritto: papiri, manoscritti”, ha detto. “Ci sono molte opportunità”.

Di ihal