OpenAI ha recentemente ampliato le capacità di ChatGPT introducendo funzionalità di condivisione dello schermo e analisi video in tempo reale, posizionandosi in diretta concorrenza con soluzioni come Gemini 2 di Google. Queste innovazioni, disponibili per gli utenti su dispositivi iOS e Android, consentono interazioni più immersive e dinamiche con l’assistente AI.
La modalità video avanzata trasforma l’interazione con ChatGPT in un’esperienza simile a una videochiamata, dove l’assistente può osservare l’ambiente circostante dell’utente, identificare oggetti e persino ricordare persone presentate durante la conversazione. Ad esempio, in una dimostrazione, ChatGPT ha assistito un utente nella preparazione del caffè, riconoscendo gli strumenti presenti e fornendo istruzioni dettagliate sul processo.
La funzione di condivisione dello schermo estende ulteriormente le capacità di ChatGPT, permettendo all’assistente di interagire con altre applicazioni sul dispositivo dell’utente. Attraverso un semplice menu, è possibile condividere lo schermo e chiedere assistenza su contenuti specifici visualizzati, come rispondere a messaggi o analizzare immagini ricevute.
Queste funzionalità sono attualmente disponibili per gli utenti dei piani ChatGPT Plus e Pro nella maggior parte dei Paesi, con un’estensione prevista per gli abbonati Enterprise ed Edu a partire da gennaio. Tuttavia, al momento, gli utenti dell’Unione Europea, Svizzera, Islanda, Norvegia e Liechtenstein non hanno accesso alla modalità vocale avanzata.
L’introduzione di queste novità da parte di OpenAI segue l’annuncio di Google del suo Project Astra, in cui Gemini 2.0 risponde a domande basate su ciò che viene mostrato in video, come l’identificazione di sculture o oggetti in strada. Inoltre, dispositivi come il Humane Pin e il Rabbit r1 mirano a offrire assistenti vocali AI capaci di rispondere a domande su ciò che “vedono” attraverso video.