Immagine AI

Vercel ha annunciato un aggiornamento significativo del proprio strumento Agent-Browser, una soluzione progettata per consentire agli agenti AI di controllare e navigare automaticamente i browser. L’azienda ha completamente riscritto il progetto utilizzando il linguaggio di programmazione Rust, con l’obiettivo di migliorare drasticamente efficienza, velocità e consumo di risorse. Secondo i dati condivisi dal team di sviluppo, questa nuova implementazione consente di ridurre il consumo di memoria di circa 18 volte e di diminuire le dimensioni del pacchetto di installazione fino a 99 volte rispetto alle versioni precedenti.

Agent-Browser nasce come strumento pensato per una nuova categoria di applicazioni software: gli agenti AI autonomi in grado di svolgere operazioni sul web come compilare moduli, navigare tra pagine, recuperare informazioni o automatizzare workflow complessi. A differenza degli strumenti tradizionali di browser automation, come quelli utilizzati per il testing delle applicazioni web, questa tecnologia è stata progettata sin dall’inizio per essere utilizzata direttamente da sistemi di intelligenza artificiale. L’obiettivo non è soltanto eseguire script programmati manualmente, ma fornire agli agenti un’interfaccia strutturata che consenta loro di comprendere l’ambiente del browser e interagire con esso in modo efficiente.

Nelle architetture AI moderne, la possibilità per un agente di utilizzare un browser rappresenta un elemento cruciale. Molti sistemi intelligenti devono infatti accedere a contenuti web in tempo reale, recuperare dati da siti esterni, eseguire operazioni su interfacce web o integrare servizi online all’interno di workflow automatizzati. Tuttavia, l’utilizzo dei browser tradizionali comporta costi computazionali significativi, soprattutto in termini di memoria e consumo di risorse di sistema. Per questo motivo gli sviluppatori stanno cercando soluzioni più leggere e ottimizzate per consentire agli agenti AI di operare sul web senza introdurre overhead eccessivi.

La riscrittura completa di Agent-Browser in Rust rappresenta una risposta diretta a queste esigenze. Rust è un linguaggio di programmazione noto per le sue prestazioni elevate e per la gestione sicura della memoria, caratteristiche che lo rendono particolarmente adatto alla costruzione di strumenti di sistema e infrastrutture ad alte prestazioni. Utilizzando una implementazione nativa in Rust, Vercel è riuscita a ridurre drasticamente l’astrazione software e il numero di dipendenze necessarie per eseguire lo strumento. Questa scelta architetturale consente di ottenere tempi di avvio più rapidi, una maggiore efficienza nell’utilizzo delle risorse e una distribuzione del software molto più leggera rispetto agli approcci basati su runtime più pesanti.

Agent-Browser si presenta come una CLI (Command Line Interface) progettata per essere utilizzata sia dagli sviluppatori sia direttamente dagli agenti AI. Attraverso un insieme di comandi specifici, l’agente può aprire pagine web, analizzare la struttura delle interfacce, interagire con elementi della pagina e recuperare contenuti in modo programmabile. Il sistema supporta operazioni comuni come cliccare su elementi della pagina, compilare moduli, catturare screenshot o estrarre informazioni testuali. Questa modalità di controllo basata su comandi rende l’interazione tra l’agente AI e il browser più semplice da orchestrare rispetto a metodi più complessi basati su script o integrazioni profonde con framework di automazione.

Uno degli aspetti più innovativi dell’architettura di Agent-Browser riguarda il modo in cui viene rappresentata la struttura delle pagine web. Nei sistemi tradizionali di automazione browser, gli strumenti devono spesso trasmettere all’agente l’intero albero DOM o la struttura di accessibilità della pagina, che può contenere migliaia di elementi. Questo approccio richiede una grande quantità di dati e può consumare una parte significativa del contesto disponibile nei modelli linguistici utilizzati dagli agenti AI. Agent-Browser introduce invece un sistema più compatto basato su snapshot della pagina e riferimenti semplificati agli elementi interattivi. In questo modo l’agente può interagire con i componenti della pagina utilizzando identificatori sintetici invece di analizzare strutture HTML complete. Questo approccio consente di ridurre significativamente la quantità di informazioni che l’agente deve elaborare.

Un altro elemento centrale della nuova architettura riguarda la gestione della persistenza delle sessioni. In molti strumenti di automazione tradizionali, ogni operazione richiede l’avvio di un nuovo processo o l’inizializzazione completa dell’ambiente di esecuzione del browser. Agent-Browser adotta invece un modello in cui il daemon del browser può rimanere attivo tra un comando e l’altro, riducendo i tempi di esecuzione delle operazioni successive e migliorando la reattività complessiva del sistema. Questo tipo di ottimizzazione è particolarmente importante quando gli agenti AI devono eseguire numerose operazioni consecutive, come durante attività di scraping, test automatizzati o workflow di navigazione complessi.

La riduzione del consumo di memoria rappresenta uno dei risultati più rilevanti dell’aggiornamento. Secondo le informazioni condivise dal team di sviluppo, la nuova implementazione nativa consente di ridurre l’utilizzo di memoria fino a 18 volte rispetto alla versione precedente, mentre il pacchetto di installazione è stato ridotto fino a 99 volte. Inoltre, l’aggiornamento migliora anche i tempi di avvio a freddo, rendendo lo strumento circa 1,6 volte più veloce durante l’avvio iniziale. Questi miglioramenti hanno un impatto significativo soprattutto negli ambienti cloud e nei sistemi serverless, dove l’efficienza delle risorse è un fattore determinante per i costi e le prestazioni.

Agent-Browser si integra all’interno dell’ecosistema più ampio di strumenti AI sviluppati da Vercel. L’azienda, già nota per la piattaforma di deployment utilizzata da molti sviluppatori web e per il framework Next.js, sta investendo sempre di più nella creazione di infrastrutture pensate per applicazioni basate su intelligenza artificiale. All’interno di questo ecosistema, gli agenti AI possono essere utilizzati per automatizzare attività di sviluppo, analizzare codice, monitorare applicazioni o eseguire operazioni direttamente sugli ambienti di produzione.

La scelta di utilizzare Rust per questa nuova implementazione evidenzia anche una tendenza crescente nell’industria del software. Sempre più progetti infrastrutturali ad alte prestazioni stanno adottando questo linguaggio per sfruttarne la combinazione di sicurezza della memoria e prestazioni comparabili a quelle dei linguaggi di basso livello. Per strumenti destinati a essere eseguiti in ambienti distribuiti, containerizzati o serverless, la riduzione delle dipendenze e la leggerezza dell’eseguibile possono rappresentare vantaggi significativi.

Di Fantasy