Group-Evolving Agents GEA: un nuovo framework di agenti AI che migliora da solo e raggiunge prestazioni da esperto umano

La diffusione di sistemi agentici basati su intelligenza artificiale ha aperto prospettive radicalmente nuove per l’automazione di compiti complessi, ma ha anche rivelato limiti fondamentali nella capacità dei singoli agenti di adattarsi autonomamente a contesti dinamici e imprevedibili. Un nuovo studio realizzato dai ricercatori dell’Università della California a Santa Barbara propone un paradigma innovativo: Group-Evolving Agents (GEA), un framework in cui gruppi di agenti evolvono collettivamente condividendo esperienze e apprendimenti per superare vincoli legati all’architettura statica dei sistemi tradizionali. Questo approccio non solo ha dimostrato prestazioni competitive con le soluzioni ingegnerizzate da esperti umani su benchmark sfidanti, ma introduce un meccanismo di evoluzione autonoma senza aumentare i costi di inferenza al momento del deployment operativo.

Il problema centrale che GEA intende affrontare deriva dalle strutture evolutive “individual-centriche” utilizzate nei sistemi di auto-miglioramento basati su analogie biologiche. In questi sistemi tradizionali, un agente selezionato genera discendenti attraverso mutazioni del proprio codice o strategie, ma ciascuna linea evolutiva rimane isolata dalle altre. Questo significa che le innovazioni sviluppate da un agente possono rimanere confinate a una singola linea, scomparendo se quella linea non viene selezionata nelle generazioni successive. Tale isolamento limita drasticamente la capacità complessiva dell’intelligenza artificiale di apprendere in modo significativo da esperienze parallele e di combinare strumenti e approcci in modi nuovi e sinergici.

Il framework Group-Evolving Agents supera questa limitazione trattando un gruppo di agenti come l’unità fondamentale dell’evoluzione, consentendo a ciascun individuo di accedere a una “pool” condivisa di esperienze, strumenti e soluzioni. In pratica, il sistema seleziona un insieme di agenti d’élite basandosi su criteri di performance e novità comportamentale e raccoglie i loro dati evolutivi in una memoria condivisa. Questa memoria comprende modifiche di codice, tattiche di risoluzione delle attività e storie di utilizzo di strumenti. Un modulo di riflessione alimentato da un grande modello di linguaggio analizza questa base di conoscenza collettiva per identificare pattern, scoprire strumenti ad alte prestazioni e generare direttive evolutive di alto livello. Tali direttive vengono poi impiegate nella generazione della nuova generazione di agenti, garantendo che la “discendenza” incorpori non solo i tratti migliori di un singolo antenato, ma le migliori innovazioni prodotte dall’intero gruppo.

I risultati sperimentali su benchmark rigorosi nel dominio dell’ingegneria del software sono particolarmente significativi. Quando confrontato con uno degli attuali sistemi di auto-evoluzione di riferimento, noto come Darwin Goldel Machine, GEA ha mostrato un aumento sostanziale delle capacità autonome su compiti reali. Sui test di SWE-bench Verified, che includono problemi di debugging reali e richieste di implementazione, il framework GEA ha raggiunto un tasso di successo del 71 %, rispetto al 56,7 % della baseline, evidenziando una capacità superiore di affrontare sfide di manutenzione software complesse. Allo stesso modo, su Polyglot, un benchmark pensato per valutare la generazione di codice in molteplici linguaggi programmativi, GEA ha ottenuto un successo dell’88,3 %, contro il 68,3 % della tecnologia di riferimento, dimostrando un adattamento più robusto a stack tecnologici diversi.

Un aspetto di grande rilevanza per le organizzazioni che considerano l’adozione di agenti autonomi è che il framework GEA non aumenta i costi di inferenza nel deployment operativo: il processo di evoluzione avviene nella fase di training o di generazione di nuove versioni di agenti, mentre al momento dell’esecuzione finale viene distribuito un singolo agente evoluto. Di conseguenza, il costo computazionale per ogni chiamata API o iterazione runtime rimane comparabile a quello di un singolo agente tradizionale, evitando l’escalation dei costi spesso associata a sistemi multi-agente attivi simultaneamente.

Un altro vantaggio critico di GEA riguarda la robustezza del sistema: nelle prove in cui i ricercatori hanno volutamente inserito bug nei modelli agenti, il framework è stato in grado di riparare gli errori in un numero medio di iterazioni significativamente inferiore rispetto all’approccio classico. Questo comportamento emerge dalla capacità del gruppo di agenti sani di “sostenere” quelli compromessi, trasferendo conoscenze corrette per individuare e correggere difetti, riducendo la dipendenza da interventi di ingegneri umani nella manutenzione degli agenti.

Dal punto di vista ingegneristico, l’adozione di un approccio di evoluzione collettiva come quello proposto da GEA può cambiare profondamente il modo in cui le organizzazioni progettano sistemi agentici. Mentre gli agenti tradizionali richiedono spesso un tuning manuale da parte di esperti di prompt engineering e architetture multi-agente, GEA promette un percorso in cui gran parte di questa ottimizzazione viene generata automaticamente dal sistema stesso, sfruttando l’apprendimento incrociato tra membri del gruppo. Ciò potenzialmente riduce la necessità di risorse umane altamente specializzate per il mantenimento e la configurazione di agenti autonomi e apre la strada a un’adozione più rapida e scalabile di soluzioni AI evolutive.

Group-Evolving Agents GEA: un nuovo framework di agenti AI che migliora da solo e raggiunge prestazioni da esperto umano

DiFantasy

Di Fantasy

Articoli correlati

Perplexity Personal Computer: il sistema AI che trasforma un Mac mini in un assistente digitale operativo 24 ore su 24

OpenAI valuta l’integrazione del generatore video AI Sora direttamente in ChatGPT

Claude ora collega Excel e PowerPoint: Anthropic introduce il contesto condiviso tra le applicazioni Microsoft

Ultimi Post

Perplexity Personal Computer: il sistema AI che trasforma un Mac mini in un assistente digitale operativo 24 ore su 24

OpenAI valuta l’integrazione del generatore video AI Sora direttamente in ChatGPT

Claude ora collega Excel e PowerPoint: Anthropic introduce il contesto condiviso tra le applicazioni Microsoft

La piattaforma PAI di Utopai trasforma sceneggiature scritte in film generati con intelligenza artificiale