Meta ha introdotto una nuova pietra miliare nell’intelligenza artificiale con l’avvento di SeamlessM4T, un innovativo modello capace di tradurre e trascrivere discorsi in quasi 100 lingue diverse. Questo gigante tecnologico sta presentando SeamlessM4T come un traduttore linguistico universale in tempo reale, che supera gli ostacoli dei sistemi esistenti vincolati a determinate lingue e modalità di comunicazione.
SeamlessM4T si distingue per la sua capacità di eseguire traduzioni da voce a testo, da voce a voce, da testo a voce e da testo a testo in un’ampia gamma di lingue, superando di gran lunga le limitazioni di altri sistemi di traduzione vocale, che spesso sono confinati a una frazione delle circa 7.000 lingue presenti nel mondo. Questa straordinaria versatilità è possibile grazie alla sua capacità di condensare quasi 100 lingue di input e output in un unico modello integrato. Questo approccio unificato risolve le sfide associate alla frammentazione dei processi di traduzione vocale su vari sottosistemi, rappresentando una svolta nel raggiungere una comunicazione fluida tra lingue diverse. Puoi osservare le sue capacità in azione nel video allegato qui sotto.
Una caratteristica distintiva di questo sistema è la sua capacità di riconoscere automaticamente le lingue di origine, eliminando così la necessità di un modello di identificazione separato. Inoltre, il modello presenta notevoli miglioramenti nelle prestazioni per lingue con risorse linguistiche limitate, mantenendo al contempo un’elevata precisione nelle lingue più ampiamente supportate, come l’inglese e lo spagnolo. Meta ha preso la decisione di rendere il modello open source, al fine di stimolare ulteriori ricerche e sviluppi da parte della comunità di sviluppatori di intelligenza artificiale. Insieme a SeamlessM4T, Meta ha reso disponibile un set di dati multimodale chiamato SeamlessAlign, composto da 270.000 ore di dati, insieme a una serie di librerie e strumenti di supporto.
Mark Zuckerberg, CEO di Meta, ha commentato l’innovazione affermando: “Oggi presentiamo SeamlessM4T, un nuovo modello di intelligenza artificiale multimodale che amplifica l’efficacia della comunicazione tra persone che parlano lingue diverse.” Ha inoltre rivelato che nel tempo, queste avanzate funzionalità di intelligenza artificiale verranno integrate su piattaforme quali Facebook, Instagram, WhatsApp, Messenger e Threads.
SeamlessM4T è il risultato del costante impegno di Meta nell’applicare l’intelligenza artificiale alla traduzione delle lingue. Questo sviluppo segue da vicino la condivisione, lo scorso luglio, di un modello di alta qualità per la traduzione tra 200 lingue, denominato NLLB-200, basato sul progetto No Language Left Behind (NLLB) di Meta. Questo modello è arrivato solo un paio d’anni dopo l’introduzione di un modello di traduzione in 100 lingue, che ha eliminato la necessità di utilizzare l’inglese come lingua intermediaria. Nel corso dello scorso autunno, Meta ha lanciato un modello esclusivamente vocale per la traduzione, adatto a lingue con limitata o nulla forma scritta. Tutti questi progressi sono alimentati dai vasti set di dati conversazionali basati su intelligenza artificiale che Meta ha reso disponibili nel 2021.