Diffbot, azienda californiana specializzata in intelligenza artificiale, ha recentemente annunciato un modello AI innovativo che promette di affrontare una delle sfide più significative nel campo dell’intelligenza artificiale: l’accuratezza fattuale.
Questo nuovo modello, una versione perfezionata del LLama 3.3 di Meta, rappresenta la prima implementazione open-source di un sistema noto come “graph retrieval-augmented generation” (GraphRAG).
A differenza dei modelli AI tradizionali, che si basano esclusivamente su vasti insiemi di dati pre-caricati, il modello di Diffbot attinge informazioni in tempo reale dal proprio Knowledge Graph, un database costantemente aggiornato che contiene oltre un trilione di fatti interconnessi.
Il Knowledge Graph di Diffbot è un’enorme base di dati automatizzata che analizza il web pubblico dal 2016. Classifica le pagine web in entità come persone, aziende, prodotti e articoli, estraendo informazioni strutturate utilizzando una combinazione di tecniche di visione artificiale e elaborazione del linguaggio naturale. Ogni quattro o cinque giorni, il Knowledge Graph viene aggiornato con milioni di nuovi fatti, garantendo un costante allineamento con le informazioni più recenti.
Il modello AI di Diffbot sfrutta questa risorsa interrogando il grafo in tempo reale per recuperare informazioni, anziché affidarsi a conoscenze statiche codificate nei dati di addestramento. Ad esempio, se interrogato su un evento di cronaca recente, il modello può cercare sul web gli aggiornamenti più recenti, estrarre i fatti pertinenti e citare le fonti originali.
Questo processo è progettato per rendere il sistema più accurato e trasparente rispetto agli LLM tradizionali.