È anche il primo traduttore AI che si traduce direttamente dall’input audio all’output


Sappiamo tutti che la comunicazione dipende più da quello che dici. Come dici che spesso è altrettanto importante. Questo è il motivo per cui l’ultimo traduttore AI di Google non si limita a tradurre le parole che escono dalla tua bocca, ma anche il tono e la cadenza della tua voce.

Il sistema si chiama Translatotron, ei ricercatori di Google entrano nel dettaglio su come funziona in un recente post sul blog . Non dicono che Translatotron arriverà presto a prodotti commerciali, ma probabilmente succederà nel tempo. Come il responsabile della traduzione di Google ha spiegato a The Verge all’inizio di quest’anno , l’obiettivo dell’azienda al momento è quello di aggiungere più sfumature ai suoi strumenti di traduzione, creando un linguaggio più realistico.

MNon è una traduzione perfetta, ma è comunque impressionante. Puoi ascoltare molti più campioni audio da Translatotron qui :https:/ /google-research.github.io/lingvo-lab/translatotron/

Sebbene catturare l’inflessione della voce di un oratore è ciò che è più impressionante per i laici, l’attrazione di Translatotron per gli ingegneri di intelligenza artificiale è che traduce il parlato direttamente dall’input audio all’uscita audio senza tradurlo nel solito testo intermedio.

TRANSLATOTRON SI TRADUCE DA AUDIO IN AUDIO, IL CHE SIGNIFICA MENO ERRORI E PRESTAZIONI PIÙ VELOCI
Questo tipo di modello di intelligenza artificiale è noto come un sistema end-to-end, perché non ci sono fermate per attività o attività secondarie. Google afferma che rendere la traduzione end-to-end produce risultati più rapidi evitando il rischio di introdurre errori durante le varie fasi di traduzione.

Forse ancora più interessante, i dati che il modello sta elaborando non sono audio crudo. Invece, utilizza i dati dello spettrogramma o visualizzazioni dettagliate del suono. In sostanza, ciò significa che stiamo traducendo il parlato da una lingua all’altra usando le immagini, che è da capogiro.

Come sempre con gli sforzi di traduzione di Google, c’è motivo di essere scettici su come sistemi come questo funzioneranno allo stato selvatico. La compagnia spesso svela nuovi e ambiziosi strumenti di traduzione e di parlato, e spesso si comportano in modo meno fluido di quanto speriamo. Ancora: il futuro prosegue e la traduzione dell’IA sta migliorando.

Di ihal