Microsoft ha lanciato GraphRAG, un nuovo strumento basato su grafici per la generazione aumentata (RAG) che consente di rispondere a domande su set di dati privati o precedentemente invisibili. GraphRAG è ora disponibile su GitHub.
GraphRAG offre un recupero di informazioni più strutturato e una generazione di risposte più completa rispetto agli approcci RAG tradizionali. Accompagnato da un acceleratore di soluzioni, fornisce un’esperienza API facile da usare ospitata su Azure, implementabile senza codifica.
Utilizzando un grande modello linguistico (LLM), GraphRAG automatizza l’estrazione di un grafico della conoscenza da qualsiasi raccolta di documenti di testo. Questo indice di dati basato su grafico può analizzare la struttura semantica dei dati prima delle query degli utenti, identificando “comunità” di nodi densamente collegati in modo gerarchico.
Ogni riepilogo di comunità descrive le sue entità e le loro relazioni, offrendo una panoramica di un set di dati senza dover conoscere domande specifiche in anticipo. Nelle recenti valutazioni, GraphRAG ha dimostrato la sua capacità di rispondere a domande globali complesse, un compito in cui gli approcci RAG tradizionali spesso falliscono.
GraphRAG fornisce risposte più complete e diverse grazie ai suoi riassunti di comunità, che vengono poi ridotti in una risposta globale finale. Studi comparativi con GPT-4 hanno dimostrato che GraphRAG supera gli approcci RAG tradizionali in termini di completezza e diversità, con un tasso di successo del 70-80%. Inoltre, offre migliori prestazioni rispetto alla sommarizzazione gerarchica del testo sorgente a costi di token inferiori.
Le applicazioni potenziali di GraphRAG si estendono a vari campi che richiedono approfondimenti sui dati. Rendendo sia GraphRAG che il suo acceleratore di soluzioni disponibili al pubblico, Microsoft mira a rendere accessibili gli approcci RAG basati su grafici per gli utenti che necessitano di comprendere i dati a livello globale.