Il modello di intelligenza artificiale open source di Meta non lascia dietro di sé alcun linguaggio
Con ogni innovazione, l’azienda del metaverso sociale, Meta , è sempre più vicina a realizzare la sua missione di “dare alle persone il potere di costruire comunità e riunire il mondo”. Oggi, l’azienda ha annunciato una svolta nella ricerca nel suo progetto No Language Left Behind (NLLB) progettato per sviluppare capacità di traduzione automatica di alta qualità per la maggior parte delle lingue del mondo.
Nelle parole del fondatore e CEO di Meta, Mark Zuckerburg, “Abbiamo appena creato un modello di intelligenza artificiale che abbiamo creato in open source in grado di tradurre in 200 lingue diverse, molte delle quali non sono supportate dagli attuali sistemi di traduzione. Chiamiamo questo progetto No Language Left Behind e le tecniche di modellazione dell’IA che abbiamo utilizzato stanno aiutando a realizzare traduzioni di alta qualità per le lingue parlate da miliardi di persone in tutto il mondo”.
Il futuro del servizio clienti basato sull’intelligenza artificiale
Più lingue, meno comunicazione
Con una popolazione digitale mondiale di oltre cinque miliardi di persone che parlano 7.151 lingue , non sorprende che i moderni sistemi di traduzione siano molto richiesti. Tuttavia, la scarsità di dati linguistici limita la portata delle tecnologie di traduzione che tentano di superare le barriere linguistiche nel consumo di contenuti digitali. Nonostante la sofisticatezza dell’offerta di traduzione automatica neurale multilingue di Google, Google Translate , le sue capacità di traduzione sono limitate a 133 lingue.
Microsoft Bing Translator , un altro strumento di traduzione di una delle più grandi aziende tecnologiche del mondo, fa poco più di 100 lingue. Considerando che più della metà della popolazione mondiale parla solo 23 delle 7.151 lingue mondiali molto comuni su Internet, molte lingue a basso contenuto di risorse (soprattutto in Africa e in Asia) non sono supportate in questi sistemi. Ciò indica un flusso interattivo stentato tra i parlanti di queste lingue e il contenuto che desiderano consumare.
MetaBeat riunirà i leader del pensiero del metaverso per fornire indicazioni su come la tecnologia del metaverso trasformerà il modo in cui tutti i settori comunicano e fanno affari dal 3 al 4 ottobre a San Francisco, in California.
Intelligenza artificiale e traduzione nell’impresa
Tra i molti modi in cui l’intelligenza artificiale (AI) sta ridefinendo l’interazione e l’efficienza umana, la traduzione è una delle più eccitanti. La traduzione automatica, la manifestazione dell’IA nella traduzione, è un mercato del valore di 800 milioni di dollari nel 2021 , con un valore previsto di 7,5 miliardi di dollari entro il 2030.
Global Market Insights ha rivelato che la crescente necessità per le aziende di migliorare l’esperienza del cliente è uno dei principali motori della crescita del settore della traduzione automatica. Ciò è corroborato dalla ricerca di Gartner , che rivela che la traduzione è un’ampia preoccupazione aziendale, soprattutto perché diventa sempre più rilevante in quattro principali casi d’uso sincroni e asincroni: multimedia (ad es. formazione e seminari), vendita online ai clienti e supporto (ad es. query e chatbot), contenuti multimediali in tempo reale (riunioni, ecc.) e documenti, testi e segmenti (es. blog e informazioni sui prodotti,).
Pertanto, le aziende che sperano di raggiungere una portata più globale richiedono soluzioni di traduzione inclusive che soddisfino le richieste sempre più complesse di una base di consumatori globale. È qui che entra in gioco il progetto di Meta.
Una svolta nella traduzione automatica di alta qualità
Il progetto NLLB, lanciato oltre sei mesi fa, è l’ambizioso tentativo di Meta di costruire un traduttore di lingue universale in grado di elaborare ogni lingua indipendentemente dai dati linguistici disponibili per l’IA. Oggi, Meta ha annunciato una svolta in questo progetto chiamato NLLB-200 , un unico modello di intelligenza artificiale che traduce oltre 200 lingue diverse con risultati all’avanguardia.
Questo modello supporta la traduzione di alta qualità delle lingue meno utilizzate, soprattutto dall’Asia e dall’Africa. Ad esempio, il modello supporta la traduzione di 55 lingue africane con risorse limitate, un aumento del 46% rispetto a quanto è ottenibile con gli strumenti di traduzione esistenti.
Meta afferma che per alcune lingue africane e indiane, questo modello migliora i sistemi di traduzione esistenti di oltre il 70% e ottiene anche un aumento medio del 44% dei punteggi complessivi di valutazione bilingue understudy (BLEU) nelle 10.000 direzioni del benchmark FLORES-101 .
Per dare un’idea della scala , Zuckerburg rivela che “il modello in 200 lingue ha oltre 50 miliardi di parametri, [addestrati] utilizzando il nuovo Research SuperCluster (RSC) di [Meta] , che è uno dei supercomputer di intelligenza artificiale più veloci del mondo. I progressi qui consentiranno oltre 25 miliardi di traduzioni ogni giorno attraverso le nostre app”.
Nonostante questa svolta, Meta si rende conto che il raggiungimento degli obiettivi del progetto di NLLB sarà impossibile senza una collaborazione innovativa. Per consentire ad altri ricercatori di espandere la portata del linguaggio e costruire tecnologie più inclusive, ha reso open source il modello NLLB-200 e ha anche fornito sovvenzioni fino a $ 200.000 alle organizzazioni senza scopo di lucro per applicare NLLB-200 alle loro operazioni.
Le implicazioni di vasta portata di questo modello per gli oltre 25 miliardi di traduzioni sulle piattaforme di Meta accelereranno migliori collaborazioni e creazione di comunità che sfidano le barriere linguistiche e geografiche. Secondo Zuckerburg, “Comunicare tra le lingue è un superpotere che l’IA fornisce, ma mentre continuiamo a far progredire il nostro lavoro sull’IA, sta migliorando tutto ciò che facciamo, dalla visualizzazione dei contenuti più interessanti su Facebook e Instagram, al consiglio di annunci più pertinenti, al mantenimento del nostro servizi sicuri per tutti”.
Wikipedia sfrutterà questa tecnologia anche per tradurre i propri pezzi multimediali in oltre 20 lingue a basso contenuto di risorse.