Un esperto del suono spiega il passato e il futuro della voce umana
Dall’evoluzione all’intelligenza artificiale
“Parlare è solo qualcosa che fai, non è vero?” Chiede Trevor Cox . “Diamo per scontato le chiacchiere, eppure è una parte così importante della nostra vita e una cosa così complicata.”
Cox è un professore di ingegneria acustica presso l’Università di Salford e un esperto nella scienza del suono. È anche l’autore di Now You’re Talking: Human Conversational from Neanderthals to Artificial Intelligence .
The Verge parlò a Cox della storia della voce umana, dell’IA e della stranezza della voce interiore.
Questa intervista è stata leggermente modificata per chiarezza.
Per iniziare, puoi parlarmi dell’evoluzione del linguaggio umano? Dal tuo libro sembra che ancora non sappiamo esattamente quando o come è successo.
Non sappiamo per certo esattamente come si è sviluppata la lingua parlata. La polemica al momento riguarda se l’ Homo sapiens fosse l’unica persona che abbia mai parlato o se anche i Neanderthal lo facessero. E le prove indicano sempre di più che anche i Neandertaliani parlavano.
Dal mio punto di vista, sembra abbastanza probabile che loro potessero parlare, e io metterei l’avvento della lingua a forse mezzo milione di anni. Ci sono persone in cerca di eventi chiave – ciò che ha innescato l’inizio del discorso – e sembra probabile che il fattore scatenante sia stato ottenere un cervello più grande. Potrebbe non avere nulla a che fare con la parola. Avremmo potuto ottenere cervelli più grandi a causa della necessità di controllare le nostre mani, e hanno appena creato un’intelligenza superiore, che era il punto di partenza per parlare. I nostri primati antenati piangevano e facevano chiamate, e avremmo avuto anche quello.
Cosa c’è di speciale nella voce umana? Cosa manca?
Naturalmente, animali come gli uccelli possono fare cose davvero notevoli. Ciò che ci distingue dai primati, i nostri cugini più vicini, è che abbiamo un controllo molto complicato dal nostro cervello. I nostri cervelli sono veramente bravi a controllare un centinaio di muscoli necessari per parlare. Possiamo comunicare incredibilmente rapidamente, e ciò deriva in realtà dal modo in cui controlliamo tutti quei muscoli. Parte di questo è parti migliori, parte è fisiologia. Abbiamo una laringe inferiore che libera la lingua per cambiare le nostre parole incredibilmente velocemente.
Hai parlato degli sforzi delle persone per preservare le loro voci. Ci sono alcune opzioni chirurgiche, ma quali sono quelle non invasive?
Una delle cose straordinarie della voce umana è che invecchia molto lentamente. Ho poco più di 50 anni e ho i capelli grigi, ma la mia voce in realtà non è poi così diversa da quando ero più giovane. Penso che la chiave sia solo per continuare a parlare.
In realtà, la tua voce è abbastanza robusta finché non urli o urli. Ci sono molti muscoli coinvolti e ci sono molte connessioni nel cervello con quei muscoli che devono essere mantenuti funzionanti. Più lo usi, continua a rinfrescarsi. È come scendere in palestra e spostare i pesi.
Unirsi a un coro è una buona idea, non solo perché è necessario esercitare il sistema vocale, ma perché la creazione di musica impedisce un certo isolamento della vecchiaia, quando si smette di parlare con le persone.
Una parte del tuo libro riguarda la “voce interiore”. Puoi dirmi di più a riguardo?
La voce interiore è affascinante, è qualcosa che ci accompagna per tutta la vita, ma raramente ci pensiamo. Un progetto interessante che ho imparato riguarda i ricercatori che hanno parlato con gli autori di come usano le voci nel loro lavoro. E hanno detto che devono quasi origliare le conversazioni dei loro personaggi per trovare la loro “voce” per poterlo scrivere. Quindi non è un dettato semplice. C’è qualcosa in realtà nell’ascoltare i personaggi nella tua testa. È davvero complicato, è come se tu stessi esprimendo pensieri, ma altre volte non sei proprio tu.
Stai lavorando a un progetto sui problemi di intelligibilità in teatro, TV e film. Perché dovremmo avere questi problemi?
Gli stili di recitazione e gli stili di canto sono cambiati negli ultimi 120 anni. Le persone non cercano di proiettare la propria voce. Non parlano in questo modo attoriale. Se non devi farlo, puoi sussurrare e fare accenti diversi. È fantastico per liberare gli attori, ma rende le persone meno udibili e meno intelligibili. Quindi ottieni questa situazione in cui le persone agiscono in modo più naturale, ma è più difficile raccogliere le parole. Nella maggior parte delle conversazioni, comunque, ti mancano alcune parole. Ma quando guardi la TV, le persone trovano inaccettabile che tu non riesca a trovare poche parole. Quindi sono coinvolto in progetti sul remix di drammi.
In che modo l’IA cambierà le voci e come interagiremo con la tecnologia?
Non appena dai qualcosa a una voce, sembra avere un’agenda. Penso che ci farà trattare i computer in modo diverso. Sembrerà avere il proprio carattere. Inizieremo a trattarli più come gli umani. Non penseremo ai computer come schiavi idioti. Forse saranno più come un animale domestico.
Il discorso artificiale sta migliorando e avremo sempre più persone che lo usano come una truffa. Vedrai telefonate che pensi provengano da un essere umano ma da un computer. Conoscete le truffe di phishing che provengono da amici che dicono: “Sono perso in qualche paese, potete aiutarmi?” Immaginate se si trattasse di un messaggio vocale su un telefono. Sarebbe molto più potente. Sono sicuro che vedremo usi falsi e le persone cercheranno di usarlo come un modo per estrarre denaro da noi. Ci sono molte conseguenze su tutta la linea.