Immagine AI

Un gruppo di ricercatori di University of Illinois Urbana-Champaign, Stanford, MIT e NVIDIA ha sviluppato “RecursiveMAS”, un framework progettato per aumentare l’efficienza dei sistemi multi-agent sostituendo parte della comunicazione testuale tra agenti AI con uno scambio diretto di rappresentazioni latenti interne, cioè embedding e stati nascosti elaborati dai modelli durante il ragionamento. L’approccio nasce da un problema ormai evidente nelle architetture agentiche moderne: quando più modelli collaborano tra loro, gran parte della potenza computazionale viene consumata nella generazione, serializzazione e reinterpretazione continua di testo naturale tra un agente e l’altro.

RecursiveMAS introduce un componente chiamato “RecursiveLink”, una struttura leggera che permette agli agenti di trasferire informazioni direttamente nello spazio latente senza convertirle ogni volta in linguaggio naturale. In pratica, invece di produrre una risposta testuale completa che deve poi essere riletta e reinterpretata da un secondo modello, gli agenti condividono rappresentazioni vettoriali già elaborate internamente dalla rete neurale. Questo riduce il numero di token elaborati, abbassa la latenza e limita la perdita di informazione che normalmente avviene durante la trasformazione continua tra embedding e testo.

Dal punto di vista architetturale, il framework tratta l’intero ecosistema multi-agent come un’unica computazione ricorsiva coordinata. Gli agenti non operano più come moduli completamente indipendenti collegati da prompt e output testuali, ma come componenti di un sistema condiviso che raffina iterativamente uno stato collaborativo comune. Per rendere possibile questo comportamento, i ricercatori hanno sviluppato un algoritmo di ottimizzazione “inner-outer loop” che consente la propagazione dei gradienti attraverso più cicli ricorsivi e più agenti contemporaneamente, permettendo un addestramento end-to-end dell’intero sistema.

I benchmark pubblicati mostrano risultati rilevanti sia sul piano computazionale sia su quello qualitativo. Secondo i test effettuati su nove benchmark relativi a matematica, medicina, ricerca documentale, ragionamento scientifico e generazione di codice, RecursiveMAS ha ottenuto un miglioramento medio dell’accuratezza dell’8,3% rispetto ai sistemi multi-agent tradizionali basati su comunicazione testuale, con accelerazioni dell’inferenza comprese tra 1,2x e 2,4x e una riduzione del consumo di token che arriva fino al 75,6%.

Uno degli aspetti più interessanti riguarda la scalabilità futura dei sistemi agentici enterprise. Nei workflow avanzati basati su AI, ogni passaggio tra agenti introduce costi API, aumento della latenza e complessità di orchestrazione. Riducendo drasticamente la dipendenza dal linguaggio naturale come livello di comunicazione interno, RecursiveMAS propone un modello in cui il testo resta principalmente un’interfaccia verso l’essere umano, mentre l’elaborazione collaborativa reale avviene nello spazio latente. Questo approccio potrebbe avere un impatto significativo soprattutto nei sistemi con molti agenti specializzati, dove la comunicazione interna rappresenta oggi uno dei principali colli di bottiglia economici e computazionali.

Di Fantasy