Recentemente, Google ha annunciato l’aggiunta di 110 nuove lingue a Google Translate, un passo importante nella sua iniziativa per supportare 1.000 lingue. Questa espansione porta il totale delle lingue supportate a 243, un grande progresso rispetto alle 24 lingue aggiunte all’inizio del 2022.
Questa rapida espansione è possibile grazie alla traduzione automatica Zero-Shot. Questa tecnologia consente di tradurre tra lingue per le quali non sono disponibili dati di traduzione paralleli (frasi tradotte tra due lingue diverse). In altre parole, i modelli possono tradurre senza aver bisogno di esempi specifici di traduzioni per ogni coppia di lingue.
In passato, Google Translate usava modelli statistici. Questi modelli analizzavano grandi insiemi di dati di traduzione per trovare le traduzioni più probabili, ma traducevano il testo prima in inglese e poi nella lingua di destinazione, utilizzando ampie collezioni di dati come le trascrizioni delle Nazioni Unite e del Parlamento europeo.
Successivamente, nel 2016, Google ha adottato la traduzione automatica neurale (NMT), che traduce intere frasi in una sola volta, migliorando la fluidità e l’accuratezza delle traduzioni. I modelli NMT, basati su reti neurali, sono stati poi ulteriormente migliorati con l’introduzione dei trasformatori nel 2017. I trasformatori, grazie al meccanismo di attenzione, sono più efficienti e scalabili rispetto ai modelli precedenti, permettendo una traduzione più precisa e veloce.
Nel 2023, Google ha introdotto PaLM 2, una nuova versione del suo modello di traduzione, che ha ulteriormente potenziato le capacità di Google Translate. PaLM 2 ha migliorato la traduzione di lingue strettamente correlate e di creoli francesi, grazie a un design ottimizzato e set di dati migliorati. Questo progresso ha facilitato l’aggiunta di 110 nuove lingue nel 2024.
Nonostante questi avanzamenti, ci sono ancora sfide nella traduzione automatica. I modelli attuali possono avere difficoltà con il contesto e la coerenza, specialmente con frasi lunghe e complesse. Inoltre, le sfumature culturali e le espressioni idiomatiche possono essere mal interpretate o perse nella traduzione.
Le lingue rare o specializzate, come quelle usate nei settori legali o medici, e le lingue a bassa risorsa, continuano a rappresentare una sfida. Anche i metodi di valutazione automatica delle traduzioni hanno limiti e non sempre catturano le sfumature qualitative delle traduzioni.
Infine, c’è una dimensione etica da considerare. La traduzione Zero-Shot potrebbe influenzare la conservazione delle lingue minoritarie, che rischiano di essere trascurate se l’affidamento alla traduzione automatica cresce.
Google Translate ha fatto passi da gigante, ma il viaggio verso una traduzione automatica completamente perfetta e culturalmente sensibile è ancora in corso.