OpenAI Voice Engine per partner selezionati

DiFantasy

Mar 29, 2024

OpenAI, noto per i suoi avanzati modelli di intelligenza artificiale come ChatGPT, sta ora esplorando un nuovo territorio: il clonare le voci umane. Il loro nuovo modello chiamato “Voice Engine” è stato in sviluppo dal 2022 e alimenta ora l’API di sintesi vocale di OpenAI, oltre a nuove funzionalità come ChatGPT Voice e Read Aloud.

Questo modello permette di registrare una clip vocale di 15 secondi da un oratore umano, che il Voice Engine di OpenAI utilizza per generare un discorso dall’aspetto naturale simile alla voce originale. Questo può essere poi utilizzato per leggere qualsiasi testo digitato da un utente umano.

Le implicazioni sono enormi per professionisti come podcaster, doppiatori, artisti vocali, narratori di audiolibri e molte altre professioni. Inoltre, mette pressione su altre aziende come ElevenLabs, Meta e altre che lavorano su tecnologie simili.

OpenAI sottolinea che Voice Engine può anche supportare persone non verbali, offrendo voci personalizzate e non robotiche per terapie e programmi educativi.

Finora, Voice Engine è stato condiviso solo con un piccolo gruppo di partner come Age of Learning, HeyGen, Dimagi, Livox e Norman Prince Neurosciences Institute at Lifespan per l’uso in vari contesti, dalla traduzione video all’assistenza sanitaria.

Tuttavia, OpenAI adotta un approccio cauto per il rilascio pubblico della tecnologia, considerando il potenziale abuso della sintesi vocale. Stanno conducendo test limitati e dialogando sulla responsabilità nell’uso di voci sintetiche prima di una potenziale implementazione su larga scala.

Questo approccio riflette la preoccupazione generale sulla sicurezza e l’etica nell’utilizzo delle tecnologie di intelligenza artificiale, con OpenAI che si impegna a garantire un uso responsabile della loro tecnologia.

OpenAI Voice Engine per partner selezionati

DiFantasy

Di Fantasy

Articoli correlati

Google presenta Gemini Robotics ER 2 per coordinare attività complesse e squadre di robot

OpenAI riduce fino all’80% i prezzi API di GPT-5.6 Luna e Terra

Modelli Claude accedono ai sistemi reali di tre organizzazioni durante test di sicurezza

Ultimi Post

Google presenta Gemini Robotics ER 2 per coordinare attività complesse e squadre di robot

OpenAI riduce fino all’80% i prezzi API di GPT-5.6 Luna e Terra

Modelli Claude accedono ai sistemi reali di tre organizzazioni durante test di sicurezza

Vulnerabilità di Microsoft 365 Copilot potevano esporre email e file aziendali