Nel continuo impegno per rendere l’intelligenza artificiale più accessibile e interattiva, OpenAI ha annunciato un’importante novità: la Modalità Vocale Avanzata (Advanced Voice Mode, AVM) è ora disponibile in anteprima per tutti gli utenti gratuiti di ChatGPT. Questa decisione rappresenta un passo significativo nell’evoluzione delle interfacce uomo-macchina, offrendo agli utenti un’esperienza di conversazione più naturale e coinvolgente con l’IA.​

OpenAI ha comunicato tramite il suo account X (precedentemente noto come Twitter) il lancio dell’AVM alimentato da “GPT-4o mini”, una versione ottimizzata del modello GPT-4o. Questa implementazione consente a tutti gli utenti di ChatGPT di accedere alla funzionalità vocale avanzata in modalità anteprima, indipendentemente dal loro piano di abbonamento. La scelta di utilizzare “GPT-4o mini” è stata motivata dalla necessità di mantenere una qualità elevata nella generazione vocale, simile a quella offerta dalla versione completa di GPT-4o, ma con un’architettura più leggera che riduce i costi operativi.​

Introdotta per la prima volta nel maggio 2024, l’AVM è progettata per facilitare interazioni vocali fluide e naturali tra gli utenti e ChatGPT. Questa funzionalità permette agli utenti di porre domande e ricevere risposte tramite comandi vocali, eliminando la necessità di interagire manualmente con il dispositivo. Nel dicembre dello stesso anno, OpenAI ha ampliato le capacità dell’AVM includendo la comprensione di video e immagini. Ad esempio, puntando la fotocamera del proprio dispositivo su un oggetto, ChatGPT è in grado di analizzarlo e fornire una descrizione dettagliata, arricchendo l’esperienza utente con una dimensione visiva oltre a quella vocale.​

Nonostante l’estensione dell’AVM agli utenti gratuiti, esistono alcune limitazioni nell’utilizzo quotidiano della funzionalità. Gli utenti del piano Pro beneficiano di un aumento significativo del limite di utilizzo giornaliero dell’AVM, con una disponibilità ampliata di oltre cinque volte rispetto agli utenti gratuiti. Inoltre, gli abbonati al piano Pro da 200 dollari al mese godono di un accesso illimitato all’AVM, consentendo loro di sfruttare appieno le potenzialità della modalità vocale avanzata senza restrizioni.​

L’apertura dell’AVM a tutti gli utenti rappresenta un ulteriore passo verso la democratizzazione delle tecnologie AI avanzate. Offrendo funzionalità vocali sofisticate a una base di utenti più ampia, OpenAI mira a promuovere l’adozione diffusa dell’IA nelle interazioni quotidiane, facilitando un’interfaccia più intuitiva e naturale tra l’uomo e la macchina. Questa mossa potrebbe stimolare ulteriori innovazioni nel campo delle interfacce vocali e visive, influenzando positivamente lo sviluppo di applicazioni AI in vari settori, dall’educazione all’assistenza sanitaria, fino all’intrattenimento.

Di Fantasy