OpenAI, noto per i suoi avanzati modelli di intelligenza artificiale come ChatGPT, sta ora esplorando un nuovo territorio: il clonare le voci umane. Il loro nuovo modello chiamato “Voice Engine” è stato in sviluppo dal 2022 e alimenta ora l’API di sintesi vocale di OpenAI, oltre a nuove funzionalità come ChatGPT Voice e Read Aloud.
Questo modello permette di registrare una clip vocale di 15 secondi da un oratore umano, che il Voice Engine di OpenAI utilizza per generare un discorso dall’aspetto naturale simile alla voce originale. Questo può essere poi utilizzato per leggere qualsiasi testo digitato da un utente umano.
Le implicazioni sono enormi per professionisti come podcaster, doppiatori, artisti vocali, narratori di audiolibri e molte altre professioni. Inoltre, mette pressione su altre aziende come ElevenLabs, Meta e altre che lavorano su tecnologie simili.
OpenAI sottolinea che Voice Engine può anche supportare persone non verbali, offrendo voci personalizzate e non robotiche per terapie e programmi educativi.
Finora, Voice Engine è stato condiviso solo con un piccolo gruppo di partner come Age of Learning, HeyGen, Dimagi, Livox e Norman Prince Neurosciences Institute at Lifespan per l’uso in vari contesti, dalla traduzione video all’assistenza sanitaria.
Tuttavia, OpenAI adotta un approccio cauto per il rilascio pubblico della tecnologia, considerando il potenziale abuso della sintesi vocale. Stanno conducendo test limitati e dialogando sulla responsabilità nell’uso di voci sintetiche prima di una potenziale implementazione su larga scala.
Questo approccio riflette la preoccupazione generale sulla sicurezza e l’etica nell’utilizzo delle tecnologie di intelligenza artificiale, con OpenAI che si impegna a garantire un uso responsabile della loro tecnologia.