Stanford DeLM riduce del 50% i costi dei sistemi multi-agente eliminando l’orchestratore centrale

I ricercatori della Stanford University hanno presentato DeLM (Decentralized Language Models), un framework per sistemi multi-agente che sostituisce il tradizionale orchestratore centrale con un modello di coordinamento decentralizzato basato su contesto condiviso verificato e code di lavoro distribuite. L’obiettivo è affrontare uno dei principali limiti delle architetture multi-agente moderne: il collo di bottiglia generato dall’agente coordinatore incaricato di assegnare attività, raccogliere risultati e integrare continuamente il lavoro degli altri agenti.

Nelle implementazioni convenzionali, ogni informazione prodotta dagli agenti deve transitare attraverso un nodo centrale che filtra, valida e redistribuisce gli aggiornamenti. Questo approccio introduce costi computazionali aggiuntivi, aumenta il traffico di token tra gli agenti e rallenta la capacità del sistema di scalare quando il numero di attività parallele cresce. DeLM elimina questo passaggio intermedio permettendo agli agenti di operare in modo asincrono attraverso una memoria condivisa verificata che funge da spazio comune di coordinamento. Gli agenti prelevano autonomamente i task da una coda, consultano il contesto accumulato, eseguono il proprio ragionamento locale e pubblicano aggiornamenti sintetici che diventano immediatamente disponibili per tutti gli altri componenti del sistema.

La caratteristica centrale dell’architettura è proprio la sostituzione della comunicazione diretta e della supervisione gerarchica con un meccanismo di collaborazione basato su stato condiviso. Invece di inviare continuamente messaggi tra agenti o attendere la fusione dei risultati da parte di un coordinatore, ogni agente può costruire il proprio lavoro sfruttando le informazioni già validate e depositate nel contesto comune. Questo riduce la duplicazione delle elaborazioni e consente di riutilizzare in modo efficiente scoperte, errori identificati e soluzioni parziali generate durante il processo di ragionamento.

Le valutazioni sperimentali sono state condotte su benchmark che richiedono coordinamento complesso tra agenti. Nel benchmark SWE-bench Verified, dedicato alla risoluzione di problemi software reali, DeLM ha raggiunto un pass@4 del 77,4%, ottenendo le migliori prestazioni tra i sistemi confrontati e riducendo contemporaneamente il costo di inferenza per attività a circa 0,12 dollari, pari a una riduzione vicina al 50% rispetto alle architetture concorrenti. I ricercatori attribuiscono il miglioramento alla capacità degli agenti di condividere rapidamente informazioni utili senza doverle continuamente aggregare e ridistribuire tramite un controllore centrale.

Risultati positivi sono emersi anche nelle attività di ragionamento su documenti multipli e contesti molto estesi. Nei test LongBench-v2 Multi-Doc QA, DeLM ha ottenuto la migliore accuratezza media tra diverse famiglie di modelli linguistici, superando i sistemi di riferimento fino a 5,7 punti percentuali. In questi scenari gli agenti possono analizzare simultaneamente gruppi differenti di documenti, mantenendo una rappresentazione condivisa e compatta delle evidenze raccolte durante l’elaborazione.

Il lavoro suggerisce che la crescita futura dei sistemi multi-agente potrebbe passare da architetture fortemente gerarchiche a modelli distribuiti nei quali il coordinamento emerge attraverso la condivisione strutturata dello stato del problema. Riducendo il peso dell’orchestrazione centrale, DeLM punta a migliorare contemporaneamente scalabilità, velocità operativa ed efficienza economica, elementi sempre più rilevanti per l’impiego dei sistemi agentici in applicazioni software e processi aziendali di larga scala.

Stanford DeLM riduce del 50% i costi dei sistemi multi-agente eliminando l’orchestratore centrale

DiFantasy

Di Fantasy

Articoli correlati

Ricerca AI e pubblicità conversazionale stanno sostituendo l’economia dei clic del web

Project Perception: Microsoft integra il modello MAI-Cyber-1-Flash nella sicurezza informatica agentica

Il malware ENCFORGE colpisce i server Langflow e distrugge modelli, pesi e dati di addestramento AI

Ultimi Post

Ricerca AI e pubblicità conversazionale stanno sostituendo l’economia dei clic del web

Project Perception: Microsoft integra il modello MAI-Cyber-1-Flash nella sicurezza informatica agentica

Il malware ENCFORGE colpisce i server Langflow e distrugge modelli, pesi e dati di addestramento AI

Meta AI integra Muse Spark 1.1 e introduce attività autonome e ricorrenti