Con gli enormi progressi nel modo in cui le tecnologie AI/ML vengono implementate, uno dei progressi più entusiasmanti, controversi e in rapida evoluzione riguarda la voce umana . Un esempio particolare salta fuori in quanto incapsula il complesso di problemi ed emozioni legati alle voci alimentate dall’intelligenza artificiale.In che modo Mondelez International utilizza la tecnologia a basso codice di DronaHQ per l’abilitazione delle vendite rapidamente, in tutte le aree geografiche_
La scorsa estate, la tecnologia dell’IA è stata utilizzata per dare voce ad alcuni degli scritti del compianto Anthony Bourdain , parole che non ha mai pronunciato o letto ad alta voce ma che erano comunque sue; La tecnologia di clonazione vocale ha dato vita al testo in Roadrunner: A Film About Anthony Bourdain . Alcuni tra il pubblico si sono sentiti ingannati dal fatto che non fosse davvero Bourdain, altri hanno pensato che la mossa fosse un passo falso poiché Bourdain non era vivo per dare il permesso di manipolare la sua voce in quel modo, mentre molti pensavano che fosse semplicemente un dispositivo creativo per la narrazione.
L’esempio di Bourdain mette in evidenza due questioni chiave che saliranno in primo piano nel modo in cui le tecnologie vocali basate sull’intelligenza artificiale verranno utilizzate in futuro. Da un lato, ci sono domande su chi ha la proprietà di una voce, e quindi il controllo su come potrebbe essere utilizzata ora e in futuro. Dall’altro c’è la questione etica: è moralmente giusto permettere che la voce di qualcuno sia usata nel pubblico dominio dopo la sua morte quando non ha alcun controllo su come verrà usata o cosa viene detto?
Queste domande stanno emergendo perché la tecnologia vocale basata sull’intelligenza artificiale sta iniziando a decollare davvero; c’è stata un’enorme quantità di tempo e denaro spesi in ricerca e sviluppo per far suonare “reali” le voci generate dalla macchina. Ora sono in grado di trasmettere le emozioni, la consistenza, la cadenza, nonché l’ascesa e la caduta naturali e molti altri distinti indicatori che caratterizzano il linguaggio umano (per non parlare del canto). Questo sta cambiando il gioco, perché è diventato difficile per gli ascoltatori determinare la differenza tra il discorso di un essere umano e quello di una macchina.
In quanto tale, abbiamo raggiunto un momento decisivo nello sviluppo della tecnologia in cui abbiamo bisogno di capire le linee guida di base e impostare i guardrail, o come tante tecnologie prima, le applicazioni della tecnologia vocale verranno utilizzate in modi in cui non erano mai stati previsti.
Proprietà delle identità digitali
Siamo diventati una società globale assetata di esperienze ricche di contenuti, che si tratti di film, televisione e servizi di streaming o mezzi generati dagli utenti come YouTube e TikTok. E presto il metaverso offrirà modi ancora più nuovi per interagire con i contenuti. Tutte queste strade offrono enormi opportunità per la voce e i video basati sull’intelligenza artificiale. Voce e video basati sull’intelligenza artificiale rendono esponenzialmente più veloce, più facile e meno costoso la creazione di contenuti, per non parlare dell’adattamento per altre lingue. Queste tecnologie sono anche altamente accessibili tramite servizi di sintesi vocale, quindi essenzialmente chiunque può sfruttare l’IA per la creazione di contenuti senza richiedere uno studio e molte apparecchiature fantasiose, stimolando una forte domanda nel settore dell’intrattenimento.
Allo stesso tempo, c’è molta paura che circonda la proprietà e la monetizzazione della propria identità virtuale . In un mondo di falsi profondi, false dichiarazioni e furto di identità, è giusto che le persone si chiedano cosa succede se qualcuno coopta la propria identità digitale per i propri scopi. Non solo l’individuo perderebbe il controllo su come viene distribuita la sua somiglianza, così come qualsiasi ricavo o riconoscimento del marchio ad essa associato, ma potrebbe essere utilizzato in modi inappropriati, persino illegali, o almeno così si pensa.
Questo è altamente improbabile, tuttavia. Ogni voce umana, così come il volto, ha la sua impronta unica, composta da decine di migliaia, a milioni, di caratteristiche. Con le tecnologie avanzate di rilevamento e gestione delle frodi in fase di sviluppo, le identità basate sull’intelligenza artificiale possono essere salvaguardate in modo relativamente semplice. Ciò che è molto più complicato, tuttavia, è gestire quell’identità digitale nel tempo. Non si tratta solo di affari, ma di una serie di decisioni etiche che sono indissolubilmente intrecciate.
L’etica della rappresentazione virtuale e le identità basate sull’intelligenza artificiale
Andava bene per il regista usare la voce digitalizzata di Bourdain nel suo film? Il regista avrebbe ottenuto il permesso di usare la sua voce clonata dall’IA per pronunciare le battute in questione, ma da chi? Chi detiene in definitiva il diritto di decidere?
Allo stesso modo, la voce basata sull’intelligenza artificiale del famoso cantante folk rock sudcoreano Kim Kwang-Seok è stata recentemente utilizzata per pubblicare una nuova canzone . L’artista è morto da 25 anni, ma una società di radiodiffusione ha negoziato un accordo con la famiglia dell’artista per utilizzare l’IA per clonare la sua voce e utilizzarla per qualcosa di completamente nuovo, in gran parte per la gioia del pubblico. Ci sono molti altri casi di società di intrattenimento e creatori di contenuti che cercano di riportare la voce e le sembianze di personaggi famosi per concerti o film. Ma è eticamente responsabile?
In superficie, è qualcosa che può essere affrontato abbastanza semplicemente attraverso accordi di licenza e contratti con l’eredità dell’intrattenitore o, idealmente, determinato mentre l’artista è ancora vivo. Man mano che la pratica diventa più comune, dovremmo essere preparati a vedere una sorta di clausola di nome, immagine, voce, somiglianza all’interno della Volontà di una persona, in particolare quella che regola i suoi desideri postumi o nomina un manager per supervisionare la carriera del loro sé virtuale – molto allo stesso modo in cui hanno un business manager nella vita.
Le identità virtuali non sono solo per le celebrità
Una cosa è che le celebrità considerino tali contenuti e accordi di gestione, ma che dire delle persone normali e comuni? Forse chi soffre per i propri cari, come questa donna che ha perso la sua giovane figlia a causa di una malattia? Incontrandosi in un ambiente di realtà virtuale, la donna è stata in grado di connettersi con sua figlia in forma avatar, apparentemente viaggiando in una versione del paradiso e tenendo una festa di compleanno. L’esperienza è chiaramente abbastanza significativa per la giovane madre e la sua famiglia, ma l’interazione non è in alcun modo reale. Alcune aziende, così come i consumatori, non vogliono partecipare allo sviluppo di tali esperienze perché si prendono delle libertà con la somiglianza e la personalità del bambino, mentre altre vedono un’opportunità per fornire conforto e chiusura alle famiglie che soffrono.
E che dire della creazione di nuove esperienze virtuali per scopi educativi, come il pluripremiato Interactive Holograms: Survivor Stories Experience ? In un momento in cui studenti e cittadini si chiedono se l’Olocausto sia stato reale o cosa significhi effettivamente essere nazisti, non c’è spazio per usare questa tecnologia per sempre? Quali linee sono appropriate in termini di licenza creativa?
Entrare in un futuro basato sull’intelligenza artificiale con identità basate sull’intelligenza artificiale
Non ci sono risposte facili quando si tratta di un’identità virtuale o basata sull’intelligenza artificiale. Siamo sul precipizio di un mezzo completamente nuovo di creazione di contenuti, in cui presto alle persone famose e normali verrà chiesto di pensare a come la loro voce e immagine potrebbero essere utilizzate non solo oggi ma molto tempo dopo che se ne saranno andate.
L’identità virtuale diventerà una valuta che dovrebbe essere considerata simile alle loro risorse fisiche, una valuta in cui possono specificare i loro desideri in vita o in morte e nominare manager ed esecutori testamentari per approvarne l’utilizzo in futuro. Può sembrare inverosimile, ma le voci digitali non invecchiano, né gli avatar. Con il metaverso che sta diventando mainstream, i nostri sé virtuali possono vivere ben oltre i nostri anni.
Diventerà un nuovo imperativo che tutti determinino e definiscano chiaramente i parametri con cui sono a proprio agio in termini di identità digitale. Allo stesso modo, le aziende che offrono piattaforme per la creazione di voce e video basate sull’intelligenza artificiale devono sviluppare politiche chiare per l’adozione e l’uso di una specifica identità virtuale basata sull’intelligenza artificiale. In questo modo si protegge sia gli individui che le aziende dal cadere in un pendio scivoloso quando le identità virtuali altamente dirompenti basate sull’intelligenza artificiale vengono normalizzate.
Taesu Kim l’amministratore delegato di Neosapience