Nel panorama in rapida evoluzione dell’intelligenza artificiale, OpenAI ha introdotto una novità che promette di trasformare il modo in cui interagiamo con il web: Operator, il primo agente AI semi-autonomo dell’azienda. Progettato per “operare” un browser web in modo simile a un essere umano, Operator è in grado di navigare, cliccare, digitare e svolgere una serie di attività online per conto dell’utente. Dalla prenotazione di ristoranti tramite OpenTable all’ordine di generi alimentari su Instacart e DoorDash, questo agente amplia le capacità dell’AI oltre le tradizionali interfacce come ChatGPT o le API di OpenAI.
“Questo prodotto segna l’inizio del nostro percorso verso gli agenti,” ha dichiarato Sam Altman, CEO e co-fondatore di OpenAI, durante una demo trasmessa in diretta sul canale YouTube dell’azienda. Greg Brockman, presidente e co-fondatore, ha aggiunto su X (precedentemente noto come Twitter): “Il 2025 è l’anno degli agenti.”
Attualmente in fase di anteprima per gli abbonati statunitensi al piano ChatGPT Pro di OpenAI (al costo di $200 al mese), Operator mira a dimostrare il potenziale dell’AI agentica raccogliendo al contempo feedback essenziali per perfezionarne le capacità.
A differenza di altre soluzioni, Operator non prende il controllo del browser dell’utente. Invece, gli utenti accedono a un nuovo sito web dedicato e si trovano di fronte a una casella di input simile a quella di ChatGPT. Inserendo una richiesta, come “trova biglietti per la partita dei LA Lakers di stasera”, Operator avvia un browser virtuale separato, eseguendo compiti come compilare moduli, gestire prenotazioni online e acquistare biglietti per eventi sportivi e concerti. L’utente può osservare in tempo reale il cursore che si muove autonomamente nel browser basato su cloud. In caso di problemi, l’agente si ferma e comunica con l’utente tramite un messaggio di testo, simile alle risposte di ChatGPT.
Sotto il browser virtuale, l’utente vede suggerimenti di azioni che Operator può intraprendere per suo conto. Tuttavia, l’utente può riprendere il controllo in qualsiasi momento, in modo simile ai sistemi di guida semi-autonoma nelle auto moderne. Operator richiede inoltre all’utente di inserire le proprie credenziali di pagamento quando raggiunge una schermata di acquisto su un altro sito web. Gli utenti possono salvare particolari flussi di lavoro che desiderano riutilizzare in futuro e avviarli nuovamente con facilità.
Operator è alimentato da una combinazione avanzata di modelli linguistici e capacità di navigazione web, consentendo all’agente di comprendere le richieste dell’utente e di interagire con vari siti web in modo efficace. Questa integrazione rappresenta un passo significativo verso l’automazione di attività online complesse, riducendo il tempo e lo sforzo necessari per completare compiti quotidiani.
L’introduzione di Operator solleva anche importanti questioni riguardanti la sicurezza e la privacy. OpenAI ha sottolineato che l’agente non memorizza le credenziali di pagamento degli utenti e che questi ultimi mantengono il controllo completo sulle azioni dell’agente. Tuttavia, come con qualsiasi tecnologia emergente, sarà fondamentale monitorare attentamente l’uso di Operator per garantire che venga utilizzato in modo etico e responsabile.