Immagine AI

Google ha recentemente portato una novità significativa nel suo browser Chrome, integrando un chatbot basato sull’intelligenza artificiale chiamato “Gemini”. Questa innovazione consente agli utenti di interagire con Gemini tramite una chat vocale direttamente sullo schermo del browser, senza dover visitare un sito web esterno o aprire applicazioni separate.

L’annuncio è stato fatto il 20 maggio durante la conferenza per sviluppatori Google I/O, dove è stato comunicato che a partire dal 25 maggio gli utenti delle versioni Beta, Developer e Canary di Chrome, oltre agli abbonati ai piani AI Pro e AI Ultra, potranno accedere a questa funzionalità tramite un pulsante dedicato posizionato nell’angolo in alto a destra del browser.

Ciò che rende Gemini particolarmente innovativo rispetto ad altri chatbot basati su web è la sua capacità di rilevare in tempo reale il contenuto visualizzato sullo schermo del browser. Questa caratteristica permette a Gemini di offrire una serie di interazioni avanzate, come riassumere automaticamente il contenuto di una pagina web, analizzare i video di YouTube e persino esplorare dettagli sugli acquisti online. Ad esempio, può estrarre ricette direttamente dai video di cucina o aiutare a cercare prodotti specifici su Amazon durante la navigazione.

Gemini include anche una funzione “Live” che permette agli utenti di porre domande e ricevere risposte vocali in tempo reale, trasformando così l’esperienza di navigazione in un dialogo più naturale e immediato. Come riportato da The Verge, Google con questa mossa va oltre il tradizionale concetto di chatbot, entrando nell’era degli “agenti di intelligenza artificiale” capaci di assistere gli utenti in modo molto più dinamico e contestualizzato.

Tuttavia, Gemini presenta ancora alcune limitazioni. Per ora, è in grado di interagire solo con le informazioni visibili sullo schermo del browser e non può accedere a dati in tempo reale come disponibilità di prodotti o la posizione geografica dell’utente. Inoltre, in alcune situazioni le risposte possono risultare troppo lunghe o portare a domande successive ripetitive, segnalando la necessità di migliorare ulteriormente l’esperienza utente.

Google è consapevole di queste sfide e sta lavorando per far evolvere Gemini da semplice strumento di domande e risposte a un vero e proprio agente AI capace di eseguire compiti complessi. In questo contesto, è prevista l’introduzione futura della modalità “Agent Mode” tramite il “Project Mariner”. Quando sarà attivata, questa modalità consentirà a Gemini di gestire contemporaneamente fino a dieci attività diverse, amplificando significativamente le sue capacità operative e di supporto.

Di Fantasy