Google ha introdotto Agentic RAG, una nuova architettura per la ricerca e il ragionamento aziendale progettata per superare alcune delle principali limitazioni dei tradizionali sistemi Retrieval-Augmented Generation. La tecnologia è attualmente disponibile in anteprima pubblica all’interno della piattaforma Gemini Enterprise Agent e punta a migliorare la capacità dei sistemi AI di rispondere a domande che richiedono informazioni distribuite tra più archivi, database e repository documentali.
Nei sistemi RAG convenzionali il processo è generalmente composto da due fasi: il recupero dei documenti considerati pertinenti alla richiesta e la generazione della risposta da parte di un modello linguistico basata sulle informazioni recuperate. Questo approccio si dimostra efficace quando tutte le informazioni necessarie sono contenute in una singola fonte o in un insieme limitato di documenti correlati. Tuttavia, negli ambienti aziendali reali i dati sono spesso distribuiti tra differenti sistemi informativi e richiedono attività di correlazione che un flusso RAG tradizionale non è in grado di eseguire autonomamente.
Per affrontare questo problema, Google ha sviluppato un’architettura multi-agente coordinata da un componente centrale di orchestrazione. L’orchestratore analizza la richiesta dell’utente e la scompone in attività specializzate assegnate a differenti agenti. Il Planner Agent determina quali fonti informative devono essere consultate, mentre il Query Rewriter trasforma la richiesta iniziale in una serie di interrogazioni più specifiche e ottimizzate per la ricerca. Successivamente il Search Fanout Agent esegue interrogazioni parallele su repository differenti e raccoglie le informazioni disponibili prima che il modello linguistico proceda alla sintesi finale.
L’elemento più innovativo dell’architettura è rappresentato dal Sufficient Context Agent, un componente progettato per verificare se il sistema dispone realmente di tutte le informazioni necessarie per fornire una risposta completa. Invece di generare immediatamente un risultato sulla base dei documenti recuperati, l’agente confronta la domanda originale, le informazioni raccolte e le risposte intermedie per identificare eventuali lacune informative.
Quando rileva dati mancanti, il sistema non conclude il processo ma avvia automaticamente nuove attività di ricerca. In un contesto sanitario, ad esempio, una richiesta relativa ai farmaci prescritti, alle restrizioni alimentari e alle eventuali reazioni allergiche di un paziente può richiedere la consultazione simultanea di cartelle cliniche, sistemi farmaceutici e archivi nutrizionali. Se vengono recuperate soltanto le informazioni relative ai farmaci e alla dieta, il Sufficient Context Agent individua l’assenza di dati sulle allergie e genera autonomamente nuove query per esplorare ulteriori documenti clinici fino al completamento del quadro informativo.
Secondo Google, questa capacità di effettuare ricerche iterative riduce significativamente il rischio di risposte incomplete o speculative, poiché il sistema è in grado di riconoscere quando il contesto disponibile non è ancora sufficiente per formulare una conclusione affidabile. La caratteristica viene definita come una forma di persistenza operativa, nella quale l’intelligenza artificiale continua a cercare informazioni fino al raggiungimento di una soglia di completezza adeguata.
I risultati condivisi da Google mostrano miglioramenti misurabili nelle attività che richiedono ragionamento multi-step e correlazione di informazioni provenienti da fonti differenti. Nelle valutazioni effettuate sul benchmark FramesQA, progettato per misurare capacità di ricerca e inferenza su più livelli, Agentic RAG ha raggiunto livelli di accuratezza superiori rispetto alle implementazioni RAG tradizionali. Nei test condotti in ambienti cross-corpus, dove il sistema deve individuare informazioni rilevanti all’interno di repository multipli contenenti anche dati non correlati, l’architettura ha mantenuto un’elevata precisione senza incrementi significativi della latenza di risposta.
Con Agentic RAG, Google propone quindi un’evoluzione dell’approccio RAG tradizionale, trasformando il recupero delle informazioni da un singolo passaggio documentale a un processo iterativo guidato da agenti specializzati. L’obiettivo è consentire ai sistemi AI aziendali di collegare dati distribuiti, identificare autonomamente informazioni mancanti e costruire risposte fondate su un contesto più completo rispetto a quello disponibile attraverso una singola ricerca.