Questo falso Joe Rogan generato dall’intelligenza artificiale deve essere ascoltato per essere creduto
Il clone della voce di IA più realistico che abbiamo mai sentito
L’intelligenza artificiale non sta creando foto e video falsi, ma può anche generare voci false.
Fino ad ora, queste voci sono state sensibilmente truccate e robotizzate , ma i ricercatori della startup AI Dessa hanno creato quello che è di gran lunga il clone vocale più convincente che abbiamo mai sentito – mimando perfettamente il suono del commentatore MMA trasformato in podcast Joe Rogan .
Ascolta le clip di Dessa’s AI Rogan qui sotto, o fai un quiz sul sito della compagnia per vedere se riesci a individuare la differenza tra Rogan reale e finto Rogan. (È sorprendentemente difficile!)
In termini di fare un falso convincente, Dessa ha scelto bene il suo obiettivo. Rogan è probabilmente il podcaster più famoso al mondo e ha registrato quasi 1.300 episodi di The Joe Rogan Experience fino ad oggi. Ciò fornisce ampi dati di allenamento per qualsiasi sistema di intelligenza artificiale.
Non fa male che gli ingegneri della compagnia abbiano evidentemente familiarità con i punti di discussione preferiti di Rogan. Speculando se stiamo vivendo o meno in una simulazione al computer o ammirando la forza della parte superiore del corpo degli scimpanzè, questo è tutto il materiale principale di Rogan.
Ma ovviamente, essere in grado di fingere in modo convincente la voce di qualcuno ha anche implicazioni preoccupanti. Come notano gli ingegneri di Dessa in un post sul blog , i casi di utilizzo fraudolento di voci false includono chiamate spam che impersonano i tuoi cari; usando voci false per intimidire o molestare la gente; e creando disinformazione attraverso registrazioni fasulle di politici.
“Chiaramente, le implicazioni sociali per tecnologie come la sintesi vocale sono enormi”, scrive Dessa. “E le implicazioni influenzeranno tutti. Poveri consumatori e ricchi consumatori. Imprese e governi. “
LE VOCI DI IA FASULLE POTREBBERO ESSERE UTILIZZATE PER DISINFORMAZIONE, MA POTREBBERO ANCHE MIGLIORARE LA TECNOLOGIA
La compagnia nota che ci sono anche dei vantaggi. Questi includono la creazione di assistenti AI più realistici; doppiaggio più rapido e accurato per TV e film; e progettando voci sintetiche realistiche e personalizzate per persone con problemi di linguaggio.
Abbiamo contattato Dessa per avere maggiori informazioni sul loro lavoro, ma la compagnia dice che a causa della possibilità di usi maliziosi, non pubblicherà la sua ricerca per intero o non renderà pubblici i suoi modelli di IA. (Una posizione che abbiamo visto dai più grandi laboratori di intelligenza artificiale come OpenAI , che controvoglia hanno negato la versione finale del suo sistema di intelligenza artificiale che genera testo.)
Sebbene ci sia una buona argomentazione per far sì che i timori sui deepfake siano esagerati (la tecnologia è disponibile da anni ma un falso deve ancora influenzare la politica generale), è anche chiaro che la tecnologia migliorerà e diventerà più accessibile nel futuro.
“Al momento, sono necessarie esperienza tecnica, ingegnosità, potenza di calcolo e dati per rendere i modelli come RealTalk performanti,” afferma l’azienda. “Ma nei prossimi anni (o anche prima), vedremo la tecnologia avanzare al punto in cui sono necessari solo pochi secondi di audio per creare una replica realistica della voce di qualcuno sul pianeta.”
Ascoltare AI Joe Rogan parlare di scimpanzé che ti strappano le palle è, stranamente, solo l’inizio.
In un post su Instagram , Rogan ha risposto al clone vocale di Dessa, dicendo: “A questo punto ho registrato da tempo abbastanza contenuti che possono praticamente farmi dire tutto ciò che vogliono, quindi la mia posizione è quella di scrollare le spalle e scuotere la testa e accettarlo. Il futuro sarà davvero fottutamente strano, ragazzi. “