La nuova modalità vocale avanzata di ChatGPT, sviluppata da OpenAI, ha finalmente fatto il suo debutto, dopo un ritardo di oltre un mese e qualche critica da parte di Scarlett Johansson. Attualmente, solo un gruppo selezionato di utenti “alfa” ha accesso a questa funzione innovativa, che offre un’esperienza di conversazione audio molto più naturale e simile a quella umana. La modalità è disponibile tramite l’app ufficiale di ChatGPT per iOS e Android.
Nei pochi giorni successivi al rilascio per i tester alfa, sono già emersi esempi sorprendenti delle capacità della nuova modalità. Gli utenti hanno condiviso video e audio in cui ChatGPT mostra una sorprendente espressività, imitando personaggi dei Looney Tunes e parlando a una velocità tale da sembrare fuori dal comune.
Ecco alcuni dei momenti più interessanti emersi finora:
- Insegnamento delle lingue e traduzione: Alcuni utenti hanno osservato che la modalità vocale avanzata di ChatGPT potrebbe rappresentare una sfida per app come Duolingo, grazie alla sua capacità di fornire istruzioni interattive e personalizzate per l’apprendimento delle lingue.
- Tecnologia di base: La modalità vocale si basa sul nuovo modello GPT-4o di OpenAI, progettato per gestire input e output visivi e audio senza dover ricorrere a modelli specializzati. Questo significa che può interpretare ciò che vede attraverso la fotocamera del telefono dell’utente, come dimostrato da un esempio di traduzione di Pokémon Yellow da una versione giapponese.
- Espressività umana: Cristiano Giardina ha condiviso una demo virale in cui ChatGPT conta fino a 50 sempre più velocemente, fermandosi per “prendere fiato” verso la fine, il che dimostra la sua capacità di imitare pause naturali nel linguaggio.
- Beatboxing: Ethan Sutin ha mostrato come ChatGPT può fare beatbox in modo fluido e convincente, simile a un MC umano.
- Narrazione e gioco di ruolo: ChatGPT può raccontare storie con effetti sonori generati dall’AI e partecipare a giochi di ruolo, creando scenari immaginari come un viaggio nell’antica Roma.
- Imitazione di accenti e personaggi: La modalità avanzata può imitare una vasta gamma di accenti regionali e personaggi di fantasia, dimostrando una notevole versatilità.
OpenAI prevede di rendere questa modalità disponibile a tutti gli abbonati paganti di ChatGPT Plus entro l’autunno. La domanda rimane: quanto sarà utile questa modalità nella pratica? Oltre a fornire divertenti dimostrazioni, sarà in grado di attrarre un pubblico più ampio e migliorare l’usabilità di ChatGPT? E quali impatti potrebbe avere, ad esempio, sulle truffe basate sull’audio? Man mano che l’accesso si espande, queste risposte diventeranno più chiare.