OpenAI sta per lanciare una nuova modalità vocale avanzata su ChatGPT, come annunciato recentemente. La notizia è stata condivisa da un utente su X (precedentemente Twitter), che ha rivelato che questa nuova funzionalità sarà disponibile dal 24 settembre 2024. Attualmente, l’accesso alla modalità vocale avanzata è in fase di distribuzione limitata in una versione alpha, riservata a un gruppo selezionato di utenti.
Questa modalità vocale avanzata rappresenta un’importante evoluzione per ChatGPT, in grado di offrire esperienze vocali avanzate su diverse piattaforme. Durante l’evento “Spring Update” di quest’anno, OpenAI aveva già rilasciato GPT-4o, con capacità multimodali su testo, visione e audio, dimostrando le potenzialità del nuovo modello. Tuttavia, la modalità vocale avanzata non era ancora stata introdotta, suscitando grande attesa.
Secondo quanto dichiarato da OpenAI, l’accesso alla modalità avanzata dipenderà da vari fattori, come inviti specifici e criteri di partecipazione stabiliti per la fase di test. La scelta degli utenti è stata fatta tra coloro che hanno dimostrato un forte coinvolgimento con la piattaforma, come gli utenti Plus di lunga data e quelli selezionati per SearchGPT.
La concorrenza nel campo della voce AI è sempre più intensa. Recentemente, il laboratorio francese Kyutai ha lanciato Moshi, un modello multimodale in grado di conversare in tempo reale con gli esseri umani, dimostrando capacità simili a quelle che OpenAI intende offrire con la sua modalità vocale avanzata. Allo stesso tempo, Hume AI ha presentato EVI 2, un modello AI vocale che migliora l’interazione umana grazie a conversazioni rapide e fluide, con supporto multilingue e adattabilità al tono e allo stile dell’interlocutore.
Anche Amazon Alexa e Google hanno investito nello sviluppo di agenti AI avanzati per migliorare le loro capacità conversazionali. Alexa ha collaborato con Anthropic, mentre Google ha lanciato Astra, un agente AI universale basato sulla famiglia di modelli Gemini, capace di gestire input multimodali.
Con l’introduzione della modalità vocale avanzata su ChatGPT, OpenAI mira a consolidare la sua posizione di leader nel campo dell’AI conversazionale, offrendo una nuova dimensione di interazione vocale che promette di ridefinire il modo in cui gli utenti interagiscono con l’intelligenza artificiale.