OpenAI ha recentemente annunciato un significativo aggiornamento per il suo agente assistito dal computer (CUA) “Operator”, sostituendo il precedente modello GPT‑4o con l’innovativo modello di inferenza o3. Questa evoluzione mira a migliorare le capacità di ragionamento, sicurezza e prestazioni generali dell’agente, rendendolo più efficiente nell’esecuzione di compiti complessi attraverso il web.
Operator è un agente di intelligenza artificiale sviluppato da OpenAI che utilizza un browser virtuale basato su cloud per eseguire compiti per conto dell’utente. A differenza dei tradizionali assistenti vocali, Operator è in grado di interagire con interfacce grafiche utente (GUI), come cliccare su pulsanti, compilare moduli e navigare tra le pagine web, in modo autonomo. Questo lo rende particolarmente utile per attività come prenotazioni online, acquisti e raccolta di informazioni da diverse fonti.
Il passaggio al modello o3 rappresenta un passo avanti significativo per Operator. Rispetto al precedente modello GPT‑4o, o3 offre prestazioni superiori in vari ambiti. Ad esempio, ha ottenuto punteggi più alti nei benchmark OSWorld e WebArena, che valutano le capacità dell’agente nelle attività basate sul browser. In particolare, nell’indice GAIA, che misura le capacità degli agenti ad alta dimensionalità, o3 ha raggiunto un punteggio di 62,2, rispetto ai 12,3 punti di GPT‑4o.
Inoltre, o3 ha mostrato miglioramenti significativi nella capacità di seguire le istruzioni, nella chiarezza delle risposte e nella persistenza delle informazioni. Ad esempio, durante l’elaborazione di una richiesta di prenotazione di un ristorante, o3 ha fornito informazioni organizzate in formato tabellare, includendo dettagli come posizione, valutazione Michelin e disponibilità dei posti, mentre la versione precedente era stata giudicata meno efficace in termini di quantità e organizzazione delle informazioni.
OpenAI ha posto particolare attenzione alla sicurezza e alla privacy nell’aggiornamento di Operator. Il modello o3 è stato affinato con dati aggiuntivi specifici per l’uso del computer, inclusi set di dati di sicurezza progettati per insegnare all’agente i confini decisionali, come confermare o rifiutare determinate azioni. Questo approccio ha contribuito a ridurre la probabilità che l’agente esegua attività illecite o cerchi dati personali sensibili.
Attualmente, la versione aggiornata di Operator basata su o3 è disponibile come anteprima di ricerca per gli abbonati al piano ChatGPT Pro, che costa 200 $ al mese. Tuttavia, la versione API dell’agente continuerà a utilizzare il modello GPT‑4o per il momento. OpenAI prevede di estendere l’accesso a Operator a consumatori, aziende e istituzioni in futuro, ampliando così le possibilità di utilizzo di questo potente strumento.