Alexa, pensa in francese: ML trova un legame cruciale tra cultura e lingua
Come evitare l’overfitting nelle reti neurali
“I ricercatori hanno utilizzato l’apprendimento automatico per creare il primo studio su larga scala basato sui dati per chiarire come la cultura influisce sul significato delle parole”.
Il linguaggio umano fa una grande ingiustizia nel rappresentare le misteriose capacità del cervello. Tuttavia, serve come un parametro economico per misurare i pensieri e l’intelligenza. Se questo è lontanamente vero e se prendiamo sul serio le nostre attività di AGI, allora è quasi inevitabile finire con l’elaborazione del linguaggio naturale. Ma quanto bene abbiamo capito la lingua stessa?
In un nuovo articolo pubblicato su Nature , Willian Thompson della Princeton University ei suoi colleghi hanno sfruttato l’apprendimento automatico per analizzare oltre 1.000 parole in 41 lingue.
I ricercatori hanno studiato il significato delle parole in relazione alla cultura, alla storia e alla geografia. Hanno scoperto che questo è vero anche per alcuni concetti come emozioni, caratteristiche del paesaggio e parti del corpo.
Semantica della bellezza
“Il modo in cui interpretiamo il mondo attraverso le parole fa parte della nostra eredità culturale.”
Linguisti e antropologi hanno cercato di decifrare il modo in cui comunichiamo. Tuttavia, condurre questi studi richiede tempo. Gli antropologi devono confrontarsi con persone di culture diverse, registrare interviste e poi tessere le loro scoperte, se ce ne sono, con l’aiuto di linguisti. Il processo è noioso, per non dire altro.
I computer moderni sono ben attrezzati per trascrivere e tradurre accuratamente molte lingue universali. Quindi, i ricercatori di Princeton hanno sviluppato un algoritmo di apprendimento automatico e hanno sfruttato la sua elevata dimensionalità per trovare il collegamento tra cultura e lingua.
Parlando del processo tradizionale, uno degli autori ha affermato che potrebbero volerci anni per documentare una specifica coppia di lingue e le loro differenze. Considerando che, i modelli di apprendimento automatico offrono un nuovo livello di precisione per elaborare queste vaste informazioni.
Come illustrato sopra, l’algoritmo ha tradotto gli associati semantici di una parola particolare. Ad esempio, i vicini semantici della parola “bello” sono stati tradotti in francese, e poi quelli di “beau” sono stati tradotti in inglese. Possiamo vedere che le rispettive liste erano sostanzialmente diverse a causa delle diverse associazioni culturali di francesi e inglesi.
I ricercatori hanno anche applicato un altro algoritmo per confrontare la somiglianza delle culture in base al linguaggio. Per questo esperimento, hanno utilizzato un set di dati antropologici che confronta cose come pratiche matrimoniali, sistemi legali e organizzazione politica di persone che parlano una determinata lingua.
I set di dati che sono stati inseriti in questi modelli sono stati creati da antropologi del XX secolo e da studi linguistici e psicologici più recenti. Secondo i ricercatori, i risultati dei loro esperimenti indicano che i significati delle parole comuni riflettono l’aspetto culturale, storico e geografico dei loro utenti.
Risultati chiave
Tipi di parole universalmente traducibili che si riferivano ad animali, cibo ed emozioni, avevano un significato molto meno abbinato.
Gli algoritmi potrebbero prevedere correttamente la facilità con cui due lingue potrebbero essere tradotte in base alla somiglianza delle due culture che le parlano.
Alexa, pensa in cinese
“Se accettiamo che un libro non abbia una mente propria, non possiamo quindi dotare un computer di intelligenza e rimanere coerenti”.
Nel famigerato esperimento della stanza cinese , John Searle, un filosofo americano, ha messo in dubbio il concetto di intelligenza nel contesto dei computer. Quando possiamo attribuire intelligenza alle macchine? L’enigma della stanza cinese di Searle è un esperimento mentale in cui un parlante non cinese nascosto su un lato della stanza inganna un madrelingua cinese facendogli credere che il messaggero sia di origine cinese. L’oratore non cinese comunica semplicemente seguendo un mucchio di istruzioni in mandarino. Non è cinese. Quindi, ha chiesto Searle, possiamo, in modo simile, chiamare un computer intelligente quando sta solo seguendo un mucchio di istruzioni?
Che fosse il test di Turing o l’esperimento nella stanza cinese, l’intelligenza nelle macchine era stata valutata attraverso il linguaggio. Pensa: chatbot. E cosa costituisce una lingua? Demografia, spunti culturali e altre complessità. La sovrapposizione di cultura, lingua e misura dell’intelligenza rende questo grande esperimento dei ricercatori dell’Università di Princeton un serio contendente per la prossima rivoluzione dell’IA. O, almeno, gli Alexas del futuro si comportano in francese, indiano e giapponese!