Sebbene non sia perfetta, la traduzione automatica è molto migliore e più semplice grazie all’IA migliorata. È tempo di condividere la ricerca in più lingue

 

Mentre era ancora al liceo, Xinyi Liu ha lavorato brevemente in un laboratorio dell’Università Beihang di Pechino ed è rimasta sorpresa nel vedere ricercatori cinesi utilizzare regolarmente Google Translate per generare la prima bozza di articoli scientifici in inglese. La traduzione è d’obbligo se gli scienziati vogliono sottoporsi a riviste di alto profilo, quasi tutte in inglese.

“Era normale che i postdoc usassero semplicemente Google Translate per tradurre prima tutto e poi per modificarlo e perfezionarlo. Ma dopo la prima traduzione, l’intero articolo non aveva senso”, ha detto Liu, uno studente in ascesa presso l’Università della California, Berkeley, che si sta specializzando in biologia molecolare e cellulare. “Letteralmente, tutte le parole, tutti i termini erano incollati insieme in modo casuale.”

Ci doveva essere un modo migliore, pensò.

Così l’anno scorso, quando ha visto un nuovo seminario tenuto da Rebecca Tarvin sull’infrangere le barriere linguistiche nella scienza, si è iscritta.

Quella classe, che sarà tenuta all’Università di Berkeley per la terza volta nella primavera del 2023, è stata una prova per Tarvin, un assistente professore di biologia integrativa. Con il rinnovato interesse in tutto il campus per la diversità, l’equità e l’inclusione, lei e i gruppi di lavoro all’interno del suo dipartimento hanno pensato che la classe potesse aiutare la UC Berkeley ad affrontare una questione scientifica di lunga data: l’inglese, la lingua dominante della scienza, è un grosso ostacolo per gli scienziati che non sono madrelingua inglese.

Non sono solo gli studenti e gli scienziati stranieri ad essere svantaggiati quando la scienza viene comunicata principalmente in inglese. Così sono molti studenti nati in America. Nell’autunno 2020, circa il 40% delle matricole che entrano nella UC Berkeley erano studenti universitari di prima generazione e, all’interno del sistema a 10 campus dell’Università della California , il 39% degli studenti di prima generazione è cresciuto con una lingua diversa dall’inglese come prima lingua.

“Molti dei nostri studenti della California sono cresciuti traducendo per i loro genitori”, ha detto Tarvin. “La traduzione fa parte della loro vita sin da quando erano molto piccoli”.

Per Tarvin, la classe — Infrangere le barriere linguistiche nell’evoluzione e nell’ecologia— è stata “un’opportunità sia per insegnare agli studenti le abilità nell’alfabetizzazione traduttiva, sia per incoraggiare gli studenti a essere attivisti in questo regno di cambiamento strutturale. E in effetti, ho visto un’accoglienza davvero positiva di questo tipo di attivismo da parte degli studenti, poiché sembrano tutti concordare sul fatto che affrontare le barriere linguistiche sia davvero importante dopo aver frequentato il corso”.

La classe ha portato Tarvin e alcuni studenti laureati presso l’UC Berkeley, insieme a collaboratori in Canada, Israele e Ungheria, a scrivere un articolo scientifico valutando nuovi strumenti di traduzione automatica che possono essere utilizzati da persone in tutto il mondo per rendere i loro articoli scientifici accessibili a chi non parla inglese . Il documento è apparso online questo mese sulla rivista BioScience. Sono online anche le traduzioni in spagnolo, francese, portoghese e ungherese, le lingue dei coautori .

“L’idea qui è che stiamo cercando di dare alle persone gli strumenti e la motivazione per tradurre la propria ricerca scientifica”, ha detto Tarvin. “La scienza non ha bisogno di essere basata su un unico linguaggio. E ci sono molti vantaggi aggiuntivi che derivano dall’incorporazione di approcci multilingue in ogni fase della scienza. Ad esempio, la pubblicazione in più lingue andrà a beneficio della società grazie a una migliore comunicazione scientifica”.

“La lingua può essere una barriera, oltre che uno strumento fantastico, per unire le persone”, ha sottolineato Emma Steigerwald, che è il primo autore del documento e uno studente laureato in scienze ambientali, politica e gestione dell’Università di Berkeley. “È una barriera che possiamo superare utilizzando questa nuova tecnologia. Spieghiamo la tecnologia e come può essere implementata e le cose di cui dobbiamo essere consapevoli quando utilizziamo la tecnologia e tutti i modi meravigliosi e positivi in ​​cui la comunicazione scientifica può essere trasformata mettendo in pratica questa nuova tecnologia”.

Verso una rete scientifica multilingue

Fino a poco tempo, la traduzione informatica era oggetto di battute. Le persone hanno condiviso esempi divertenti di traduzioni errate, che spesso sembravano denigrare lingue diverse dall’inglese e, di conseguenza, altre culture.

Ma l’apprendimento automatico, o intelligenza artificiale, ha notevolmente aumentato l’accuratezza della traduzione nella misura in cui i turisti utilizzano servizi Internet come Google Translate per comunicare con le persone nei paesi che visitano.

Ma per il testo che contiene molto gergo – in gran parte scientifico, ma anche da molti altri campi accademici – Google Translate è tristemente inadeguato.

“La qualità della traduzione non è per un diario”, ha affermato Ixchel Gonzalez Ramirez, uno dei tutor degli studenti laureati per il corso. “Molte volte, le persone devono pagare per convincere un traduttore professionista a tradurre il proprio lavoro, ed è molto costoso”.

Il nuovo documento mette in evidenza alcuni dei numerosi servizi, la maggior parte dei quali gratuiti, che possono convertire la scrittura scientifica inglese in altre lingue. Oltre alla famosa piattaforma Google Translate, questi includono DeepL , che utilizza le reti neurali e afferma di essere molte volte più accurato dei concorrenti quando traduce l’inglese in cinese, giapponese, lingue romanze o tedesco e viceversa; Baidu Translate , un servizio della società Internet cinese Baidu che inizialmente si concentrava sulla traduzione tra inglese e cinese; Naver Pagago , un traduttore multilingue creato da un’azienda in Corea del Sud; e Yandex.Translate , che utilizza la traduzione automatica statistica e si concentra principalmente su russo e inglese.

“La traduzione sta diventando sempre più alla portata di chiunque. Indipendentemente dal fatto che tu sia un esperto o meno e che tu sia bilingue o meno, la capacità di tradurre è così accelerata da così tante tecnologie che abbiamo oggi a disposizione”, ha affermato Steigerwald. “E quindi come possiamo integrarlo nel nostro flusso di lavoro come scienziati e in che modo questo cambia le aspettative che circondano la comunicazione scientifica?”

L’inglese è la lingua franca della scienza

L’interesse di Tarvin per la traduzione è nato da una delle sue studentesse laureate, Valeria Ramírez Castañeda, che nel 2020 ha pubblicato un articolo descrivendo i costi sostenuti dai suoi compagni dottorandi colombiani che volevano pubblicare o interagire con i colleghi in un mondo dominato dall’inglese.

In qualità di biologa evoluzionista interessata a come alcuni animali sono arrivati ​​​​a usare il veleno, Tarvin ha deciso di concentrare il suo nuovo seminario sulla traduzione di documenti nei campi dell’evoluzione e dell’ecologia, anche se gli studenti che si sono iscritti alla fine hanno tracciato i propri corsi. Ha cercato in particolare studenti, come Liu, e mentori, come Gonzalez Ramirez, che fossero bilingue o multilingue.

“Tutti nella classe hanno avuto una sorta di relazione familiare con la lingua”, ha detto Tarvin.

Tarvin ha anche chiesto a Mairi-Louise McLaughlin, professoressa di francese e linguistica alla UC Berkeley ed esperta di traduzione giornalistica e letteraria, di parlare alla classe di come i professionisti si avvicinano alla traduzione e di come la traduzione influisca sul significato. Quel soggetto ha avuto risonanza con gli studenti quando hanno provato a tradurre abstract scientifici e talvolta interi articoli.

Ruoming Cui, al secondo anno in ascesa che ha frequentato il corso nella primavera del 2022, ha scelto Baidu per tradurre abstract scientifici. Ha immediatamente scoperto che le frasi lunghe e complesse dell’inglese e l’uso di più parole per descrivere un concetto sembravano ridondanti quando venivano tradotte in cinese.

“Di solito non lo facciamo in cinese perché renderebbe ogni frase molto lunga ed è molto noioso”, ha detto.

Liu ha aggiunto che senza una notevole rifinitura, molte traduzioni in inglese vengono confuse, ha detto.

“Ho sentito dire che anche se il tuo risultato è sorprendente, se scrivi un articolo confuso a causa della traduzione, le persone si infastidiscono perché non riescono a capire cosa stai facendo”, ha detto Liu. “E ciò influenzerà notevolmente il modo in cui le persone convalideranno la ricerca o se la leggeranno. Penso che sia una grande barriera nel mondo scientifico”.

Steigerwald, Tarvin e i loro coautori si sono anche resi conto che scrivere articoli scientifici in un inglese più semplice – qualcosa che i non scienziati incoraggiano da molto tempo – avvantaggia sia gli anglofoni che i non anglofoni.

“Se la tua prima lingua non è l’inglese, e stai solo cercando di leggere la versione in lingua inglese del giornale, sembrerà molto meno ambiguo e molto più leggibile quando lo scrittore ha usato un linguaggio semplice”, ha detto Steigerwald. “Ma anche, cosa molto importante, quando andrai a tradurre quel pezzo di testo, gli strumenti di apprendimento automatico avranno un tempo molto più facile per tradurre qualcosa che è scritto in un linguaggio semplice. Quindi, questo è un tipo di scrittura a prova di futuro, in modo che se qualcuno vuole tradurla in un milione di lingue, se la caverà molto più facilmente quando sarà scritta in quel modo”.

Permangono ostacoli alla traduzione diffusa di articoli scientifici, compreso dove renderli disponibili e come gestire i diritti d’autore. La maggior parte delle riviste non accetta nemmeno articoli che non siano in inglese e pochi consentono esplicitamente la copubblicazione di articoli con una traduzione. Tarvin ha scoperto che poche riviste hanno delle politiche sulle traduzioni e, a causa delle restrizioni generali sul copyright, molti editori addebitano commissioni esorbitanti per pubblicare una traduzione online dopo la pubblicazione.

“È piuttosto sbalorditivo quante riviste non ti permettano di pubblicare liberamente traduzioni dopo la pubblicazione e quante poche abbiano il supporto della piattaforma in cui potresti avere anche solo un abstract in una seconda o terza lingua”, ha detto Tarvin. “Penso che un ostacolo importante per questo siano le piattaforme web; non solo le regole di pubblicazione e copyright, ma anche la funzionalità della piattaforma”.

Con il seminario Breaking Barriers e ora il paper BioScience , Tarvin e i suoi colleghi sperano di cambiare gradualmente la norma scientifica per non tradurre gli articoli in altre lingue, in particolare la lingua del paese in cui è stata condotta la ricerca e le lingue del co- autori.

E più traduzioni ci sono, più materiale c’è per addestrare i sistemi di traduzione automatica a fare un lavoro migliore, aumentando gradualmente la qualità della traduzione scientifica.

“Nel mio laboratorio, stiamo traducendo molte delle nostre ricerche, e ora anche le persone nel laboratorio di Emma lo stanno facendo”, ha detto. “Penso che condividere il nostro atteggiamento positivo nei confronti di questo e di come possa fare la differenza per le persone abbia influenzato un piccolo, ma in crescita, gruppo di persone che stanno iniziando a incorporare la traduzione nel loro flusso di lavoro scientifico”.

Ulteriori coautori di BioScienceil documento include le studentesse di dottorato Valeria Ramírez-Castañeda e Débora Brandt dell’UC Berkeley; András Báldi dell’Istituto di Ecologia e Botanica del Centro di Ricerca Ecologica di Vácrátót, Ungheria; la borsista post-dottorato Julie Teresa Shapiro dell’Università Ben-Gurion del Negev a Be’er Sheva, Israele; e Lynne Bowker, professoressa di traduzione e interpretazione presso l’Università di Ottawa in Canada.

Di ihal