Immagine AI

Google ha recentemente introdotto un nuovo framework per agenti di ricerca AI chiamato Test-Time Diffusion Deep Researcher (TTD-DR), progettato per migliorare la qualità e l’efficacia della ricerca aziendale. I ricercatori di Google hanno sviluppato questo agente ispirandosi al processo umano di scrittura, che comprende la stesura di bozze, la ricerca di informazioni e la revisione iterativa. Utilizzando meccanismi di diffusione e algoritmi evolutivi, TTD-DR è in grado di produrre ricerche più complete e accurate su argomenti complessi. Questo approccio mira a superare le limitazioni dei tradizionali sistemi di generazione aumentata da recupero (RAG), che spesso faticano con compiti ad alto valore, come l’analisi competitiva o la redazione di report per l’ingresso in nuovi mercati.

Gli agenti di ricerca profonda (DR) sono progettati per affrontare query complesse che vanno oltre una semplice ricerca. Questi agenti utilizzano modelli linguistici di grandi dimensioni (LLM) per pianificare, impiegare strumenti come la ricerca sul web per raccogliere informazioni e poi sintetizzare i risultati in un report dettagliato, spesso con l’aiuto di tecniche di scaling al momento del test come il chain-of-thought (CoT), il best-of-N sampling e il Monte-Carlo Tree Search. Tuttavia, molti di questi sistemi presentano limitazioni fondamentali nel design. La maggior parte degli agenti DR disponibili pubblicamente applica algoritmi e strumenti senza una struttura che rifletta il comportamento cognitivo umano. Gli agenti open-source spesso seguono un processo rigido e lineare o parallelo di pianificazione, ricerca e generazione di contenuti, rendendo difficile per le diverse fasi della ricerca interagire e correggersi a vicenda. Ciò può causare la perdita del contesto globale della ricerca e la mancanza di connessioni critiche tra diverse informazioni.

A differenza del processo lineare della maggior parte degli agenti AI, i ricercatori umani lavorano in modo iterativo. Tipicamente, iniziano con un piano generale, creano una bozza iniziale e poi intraprendono più cicli di revisione. Durante queste revisioni, cercano nuove informazioni per rafforzare i loro argomenti e colmare le lacune. I ricercatori di Google hanno osservato che questo processo umano potrebbe essere emulato utilizzando un modello di diffusione integrato con una componente di recupero. Nei modelli di diffusione, spesso utilizzati nella generazione di immagini, si parte da un’immagine rumorosa e si affina gradualmente fino a ottenere un’immagine dettagliata. Analogamente, in TTD-DR, un modello di diffusione addestrato inizialmente genera una bozza rumorosa, e il modulo di denoising, supportato da strumenti di recupero, rivede questa bozza in output di qualità superiore.

TTD-DR si basa su questo schema. Il framework tratta la creazione di un report di ricerca come un processo di diffusione, in cui una bozza iniziale e “rumorosa” viene progressivamente affinata fino a diventare un report finale rifinito. Questo viene realizzato attraverso due meccanismi principali.

Il primo, denominato “Denoising with Retrieval”, inizia con una bozza preliminare e la migliora iterativamente. In ogni fase, l’agente utilizza la bozza attuale per formulare nuove query di ricerca, recupera informazioni esterne e le integra per “denoising” il report, correggendo imprecisioni e aggiungendo dettagli.

Il secondo meccanismo, “Self-Evolution”, garantisce che ogni componente dell’agente (il pianificatore, il generatore di domande e il sintetizzatore di risposte) ottimizzi autonomamente le proprie prestazioni. Ogni componente utilizza algoritmi evolutivi per campionare e affinare più risposte in parallelo e infine combinarle per creare una risposta finale.

Per le aziende, questo framework potrebbe alimentare una nuova generazione di assistenti di ricerca su misura per compiti ad alto valore che i tradizionali sistemi RAG faticano a gestire, come la generazione di un’analisi competitiva o un report per l’ingresso in nuovi mercati. Secondo gli autori del documento, questi casi d’uso reali sono stati l’obiettivo principale del sistema.

La capacità di TTD-DR di emulare il processo umano di scrittura e ricerca potrebbe rappresentare un passo significativo verso l’automazione di compiti complessi e la produzione di contenuti di alta qualità in ambito aziendale. Tuttavia, come per tutte le tecnologie emergenti, sarà fondamentale monitorare l’efficacia e l’affidabilità di questi sistemi prima di un’adozione su larga scala.

Di Fantasy