OpenAI ha annunciato il rilascio in alfa della sua nuova Modalità Voce Avanzata per un gruppo selezionato di utenti ChatGPT Plus. Questa modalità consente agli utenti di interagire vocalmente in modo più naturale con il chatbot AI tramite l’app mobile ufficiale di ChatGPT per iOS e Android.
In un post su X, l’azienda ha comunicato che la modalità sarà disponibile per “un piccolo gruppo di utenti ChatGPT Plus,” aggiungendo che “continueremo ad aggiungere più persone progressivamente e prevediamo che tutti gli utenti [ChatGPT] Plus avranno accesso in autunno.”
ChatGPT Plus è il servizio di abbonamento individuale da 20 dollari al mese che OpenAI offre per accedere al suo chatbot basato su un modello di linguaggio avanzato (LLM), insieme ad altri piani Free, Team ed Enterprise.
Non è chiaro come OpenAI abbia selezionato gli utenti iniziali per l’accesso alla Modalità Voce Avanzata, ma ha comunicato che “gli utenti in questa fase alfa riceveranno un’email con istruzioni e un messaggio nell’app mobile” di ChatGPT, quindi gli interessati dovrebbero controllare lì.
Funzionalità della Modalità Voce Avanzata
La modalità, mostrata per la prima volta all’evento Spring Update di OpenAI nel maggio 2024, consente agli utenti di conversare in tempo reale con quattro voci AI generate, con il chatbot che risponde in modo naturale, gestendo interruzioni e rilevando e trasmettendo emozioni diverse nelle sue risposte.
OpenAI ha illustrato numerosi casi d’uso per questa modalità vocale più naturale e conversazionale, inclusi tutoraggio, consulenza di moda e guida per non vedenti, quando combinata con le capacità di visione AI di vedere e rispondere ai video in tempo reale.
Ritardi e Problemi
Il rilascio della funzione è stato ritardato rispetto alla stima iniziale di fine giugno a causa di una controversia sollevata dall’attrice di Hollywood Scarlett Johansson, che ha accusato OpenAI di aver cercato di collaborare con lei e poi di aver imitato la sua voce anche dopo il suo rifiuto.
OpenAI ha negato qualsiasi somiglianza intenzionale tra la sua voce AI “Sky” e quella di Johansson nel film Her, ma ha ritirato la voce dalla sua libreria, e rimane offline.
Sicurezza e Qualità
L’annuncio ufficiale di OpenAI ha sottolineato i continui sforzi per garantire la qualità e la sicurezza delle conversazioni vocali. “Da quando abbiamo mostrato per la prima volta la Modalità Voce Avanzata, abbiamo lavorato per rafforzare la sicurezza e la qualità delle conversazioni vocali mentre ci prepariamo a portare questa tecnologia di frontiera a milioni di persone,” ha dichiarato l’azienda su X.
La modalità vocale attualmente non permette di generare nuove voci AI o di clonare voci, ma potrebbe essere utilizzata per ingannare chi non è consapevole che si tratta di un’IA.
Prospettive Future
La lenta introduzione della Modalità Voce Avanzata sembra progettata per affrontare le critiche e rassicurare gli utenti, i regolatori e i legislatori che OpenAI sta prendendo sul serio la sicurezza, ponendola al pari o al di sopra dei profitti.
Il rilascio della Modalità Voce Avanzata di ChatGPT differenzia ulteriormente OpenAI dai concorrenti come Meta con il nuovo modello Llama e Claude di Anthropic, aumentando la pressione su startup focalizzate sulla voce emotiva come Hume.