Immagine AI

Uno dei nodi tecnici più ostici nello sviluppo di agenti AI di livello enterprise non è la qualità del modello sottostante, ma la capacità di far girare in modo affidabile un’esecuzione che può durare ore o addirittura giorni, attraverso centinaia di passaggi consecutivi, sopravvivendo a riavvii, errori di rete, attese di approvazione umana e cambi di stato. È esattamente il problema che Google ha deciso di affrontare con il rilascio di Agent eXecutor (AX), un nuovo runtime open source presentato come standard per l’esecuzione, la ripresa e il deployment distribuito di agenti, sviluppato inizialmente per uso interno e ora reso disponibile in versione preview su GitHub.

Il cuore tecnico di AX è la cosiddetta durable execution: lo stato dell’agente non vive solo in memoria, ma viene persistito sotto forma di event log e snapshot, in modo che ogni passaggio della traiettoria sia ricostruibile. Se un server cade nel mezzo di un workflow di tre giorni, l’agente può riprendere esattamente dal punto in cui si era interrotto, con il contesto, le chiamate ai tool e i risultati intermedi intatti. Questo modello ricorda da vicino approcci già noti nel mondo del workflow orchestration, ma calato sulle specificità degli agenti LLM, dove la traiettoria non è un grafo statico ma una sequenza emergente di decisioni del modello.

Attorno a questa spina dorsale, AX impacchetta una serie di garanzie operative pensate per ambienti di produzione reali. L’esecuzione di agenti, tool e codice generato avviene dentro sandbox isolate, in modo che eventuali comportamenti malevoli o errori non si propaghino oltre il perimetro del singolo task; un punto critico quando lo stesso runtime ospita agenti che manipolano dati di utenti diversi. La coerenza dello stato in contesti distribuiti è gestita con un’architettura single-writer, che impedisce a più processi di sovrascrivere contemporaneamente la stessa sessione, eliminando alla radice una classe di bug particolarmente subdoli nei sistemi concorrenti. A questo si aggiungono il recupero della connessione dopo interruzioni di rete, con ripristino delle risposte precedenti, e il trajectory branching, che consente di partire da un checkpoint specifico e biforcare l’esecuzione in più percorsi paralleli, utile sia per A/B testing comportamentali sia per la sperimentazione su policy diverse a parità di stato iniziale.

Un aspetto interessante dal punto di vista strategico è la postura di interoperabilità. AX è progettato per orchestrare agenti costruiti con stack eterogenei: agenti nativi Google, integrazioni con Antigravity, agenti custom realizzati internamente dalle aziende, framework di terze parti come LangChain, LangGraph e l’ADK, e sistemi che parlano il protocollo Agent2Agent. La promessa esplicita è quella di ridurre il lock-in su un singolo modello o cloud, permettendo all’azienda di scegliere infrastruttura, modello sottostante, sandbox e policy in modo indipendente dal runtime.

Insieme ad AX è stato presentato anche Agent Substrate, un layer basato su Kubernetes pensato per lo scheduling su larghissima scala, dell’ordine di centinaia di milioni di agenti. La differenza rispetto a un Kubernetes tradizionale è che quest’ultimo è ottimizzato per servizi long-running, mentre il workload tipico degli agenti è fatto di milioni di tool call brevissime al secondo, transizioni di stato continue e movimenti tra risorse di calcolo idle per ottimizzare latenza e costo. Substrate è la risposta infrastrutturale a questo cambio di profilo di workload.

La mossa va letta dentro un quadro competitivo in cui Microsoft con AutoGen e AWS con Bedrock AgentCore stanno spingendo strategie simili: rendere il framework open source per favorire adozione e standardizzazione, monetizzando poi sull’infrastruttura cloud e sui servizi managed costruiti sopra. Più di un osservatore ha già paragonato questa traiettoria a quella seguita anni fa con Kubernetes, dove l’apertura del runtime ha funzionato come leva per espandere l’uso di Google Cloud sul lungo periodo.

Per chi sviluppa agenti oggi, AX rappresenta un tassello che fino a poco fa mancava nello stack: un livello di runtime serio che si prende carico di durabilità, isolamento, consistenza e ripresa, lasciando allo sviluppatore la logica di alto livello dell’agente. La preview è scaricabile da GitHub all’indirizzo github.com/google/ax.

Di Fantasy