L’economia operativa degli AI agent per sviluppo software sta iniziando a mostrare dimensioni molto diverse rispetto ai tradizionali chatbot conversazionali. Il progetto open source OpenClaw ha infatti reso pubblici dati che mostrano un utilizzo di oltre 603 miliardi di token in soli 30 giorni, per un costo API complessivo superiore a 1,3 milioni di dollari, pari a circa 19,5 miliardi di won coreani. Il dato rappresenta uno degli esempi più concreti finora emersi dell’enorme consumo computazionale richiesto dagli ambienti di agentic coding avanzato.
Secondo le informazioni condivise dal team, l’infrastruttura era composta da circa 100 istanze autonome di Codex AI agent operative contemporaneamente. Gli agenti non venivano utilizzati soltanto per completamento di codice o generazione di snippet, ma per workflow software completi: revisione automatica di pull request, identificazione di vulnerabilità di sicurezza, monitoraggio continuo delle performance, deduplicazione di issue GitHub e generazione autonoma di patch e commit.
Uno degli aspetti più significativi è che questi agenti operavano in modalità cooperativa e persistente. Alcuni sistemi analizzavano roadmap di progetto e producevano nuove PR in autonomia, mentre altri eseguivano benchmark continui per rilevare regressioni prestazionali e notificare automaticamente i risultati su server Discord dedicati. In alcuni casi gli agenti elaboravano persino contenuti provenienti da meeting tecnici per trasformare discussioni operative in task di sviluppo concreti.
Il dato evidenzia quanto i moderni workflow agentici siano molto più costosi rispetto all’utilizzo standard di un LLM tramite interfaccia chat. Nei sistemi agent-based, infatti, il modello deve continuamente rieseguire retrieval contestuale, rileggere repository, rivalutare stato dei task, orchestrare tool call e mantenere sincronizzazione tra agenti multipli. Questo genera cicli iterativi lunghissimi che consumano enormi quantità di token anche per task apparentemente semplici.
Il team OpenClaw ha inoltre specificato che gran parte del costo deriva dall’utilizzo della modalità “Fast Mode” di Codex, progettata per ridurre la latenza aumentando però significativamente il consumo API. Disattivando questa modalità, il costo totale sarebbe sceso intorno ai 300 mila dollari mensili, cifra comunque enorme per un progetto gestito da appena tre sviluppatori.
Il caso mette in evidenza anche una trasformazione economica più ampia nel settore AI. Fino a pochi mesi fa la competizione tra laboratori si concentrava soprattutto sulla qualità dei modelli, mentre ora il problema centrale sta diventando il costo operativo degli agenti persistenti. Gli ambienti di coding autonomo richiedono infatti execution continua, memoria contestuale prolungata, orchestration multi-agent e accesso simultaneo a repository, terminali, benchmark e sistemi CI/CD. Tutto questo moltiplica drasticamente il numero di inferenze necessarie.
Anche il rapporto tra pricing commerciale e costo reale sta emergendo come elemento strategico. Secondo quanto riportato, OpenAI avrebbe sostenuto direttamente gran parte della spesa computazionale del progetto, mostrando come le aziende AI stiano ancora sovvenzionando massicciamente l’adozione degli agenti di coding pur di accelerarne sviluppo e diffusione. Questo fenomeno sta diventando comune anche tra competitor come Anthropic e Cursor, che continuano a offrire accesso a sistemi agentici avanzati a prezzi spesso inferiori al reale costo infrastrutturale.
Il caso OpenClaw mostra soprattutto un cambiamento fondamentale: gli LLM non vengono più utilizzati soltanto come assistenti conversazionali, ma come infrastrutture operative permanenti capaci di eseguire pipeline software autonome 24 ore su 24. In questo modello il vero collo di bottiglia non è più la qualità della generazione testuale, ma la sostenibilità computazionale necessaria per mantenere attivi ecosistemi di agenti specializzati su larga scala.