Databricks presenta KARL, agente RAG progettato per gestire tutti i tipi di ricerca nei sistemi aziendali

Negli ultimi anni l’intelligenza artificiale generativa è diventata una componente sempre più centrale nelle infrastrutture dati aziendali. Tra le architetture più diffuse per collegare i modelli linguistici ai dati interni delle organizzazioni si trova la Retrieval-Augmented Generation (RAG), un approccio che combina modelli linguistici con sistemi di recupero delle informazioni per produrre risposte basate su dati aziendali aggiornati e specifici. In questo contesto, la società tecnologica Databricks ha recentemente presentato un nuovo agente RAG denominato KARL, progettato con l’obiettivo dichiarato di affrontare in modo efficace tutte le principali modalità di ricerca e interrogazione dei dati tipiche degli ambienti enterprise.

Il problema che KARL tenta di risolvere riguarda una limitazione strutturale dei sistemi RAG attualmente utilizzati nelle imprese. Nella maggior parte dei casi questi sistemi vengono ottimizzati per un singolo tipo di comportamento di ricerca, ad esempio il recupero rapido di informazioni puntuali, la sintesi di documenti o l’analisi di dati distribuiti. Quando però gli utenti pongono domande che richiedono una modalità di interrogazione diversa da quella per cui il sistema è stato progettato, la qualità delle risposte tende a degradare rapidamente. In molti casi il fallimento non è evidente: il sistema produce comunque una risposta plausibile, ma priva di accuratezza o incompletezza rispetto ai dati disponibili.

Per affrontare questo limite, Databricks ha sviluppato KARL, acronimo di Knowledge Agents via Reinforcement Learning. Si tratta di un agente progettato per apprendere simultaneamente diversi comportamenti di ricerca aziendale attraverso tecniche avanzate di apprendimento per rinforzo. In particolare, il sistema è stato addestrato su sei diverse tipologie di interrogazione dei dati enterprise, tra cui la ricerca di entità specifiche, la sintesi di informazioni provenienti da più documenti, l’analisi di cronologie di attività aziendali e il ragionamento multi-step su dati frammentati in archivi diversi. L’idea alla base è che un modello allenato su molte modalità di interrogazione sia più robusto e generalizzabile rispetto ai sistemi costruiti per un singolo caso d’uso.

Dal punto di vista tecnico, il progetto introduce anche una nuova metodologia di addestramento basata su reinforcement learning distribuito. Secondo le informazioni diffuse da Databricks, l’agente è stato addestrato utilizzando dati sintetici generati autonomamente dal sistema stesso, senza la necessità di dataset annotati manualmente. Questo approccio consente di ridurre i costi di training e di scalare rapidamente il numero di esempi utilizzati per l’apprendimento. L’uso di dati sintetici è particolarmente rilevante nel contesto enterprise, dove i dati reali spesso contengono informazioni sensibili o riservate che non possono essere facilmente utilizzate per addestrare modelli esterni.

Secondo i benchmark interni pubblicati dall’azienda, il sistema KARL raggiungerebbe prestazioni comparabili a modelli di riferimento di fascia alta su specifici test dedicati alla ricerca aziendale, con un costo per interrogazione inferiore del 33% e una latenza ridotta del 47%. Questi risultati derivano da un benchmark sviluppato internamente, denominato KARLBench, progettato per simulare scenari realistici di interrogazione dei dati all’interno delle organizzazioni. Il benchmark include attività come la ricostruzione di informazioni provenienti da appunti di riunioni, l’analisi di dati commerciali distribuiti su più archivi e la generazione di sintesi strategiche basate su documenti interni.

Uno degli aspetti più complessi di questi scenari riguarda il fatto che molte domande aziendali non hanno una risposta univoca verificabile. A differenza dei problemi matematici o di alcune attività di programmazione, le richieste tipiche delle imprese richiedono spesso la sintesi di informazioni incomplete o distribuite su più sistemi. Ad esempio, una domanda su un accordo commerciale può richiedere l’analisi di email, note di riunioni, documenti di vendita e registrazioni CRM. In questi casi il sistema deve combinare più fonti e costruire una risposta plausibile anche in assenza di un singolo documento che contenga tutte le informazioni necessarie.

Dal punto di vista dell’architettura dei dati, la proposta di Databricks suggerisce anche una revisione del modo in cui vengono costruite le pipeline RAG all’interno delle aziende. Tradizionalmente queste pipeline sono progettate come sistemi specializzati per un singolo flusso di interrogazione. I risultati ottenuti da KARL indicano invece che l’addestramento multi-task, basato su diversi comportamenti di ricerca, può produrre modelli più adattabili e meno soggetti a errori quando vengono utilizzati in scenari reali e imprevedibili.

Il nuovo agente si inserisce all’interno dell’ecosistema di strumenti di intelligenza artificiale sviluppati da Databricks per la costruzione di applicazioni enterprise basate sui dati. L’azienda, fondata dai creatori di Apache Spark, offre una piattaforma cloud per l’analisi dei dati e lo sviluppo di modelli di machine learning, basata sull’architettura “lakehouse” che unisce caratteristiche dei data lake e dei data warehouse tradizionali. Negli ultimi anni la piattaforma si è evoluta includendo strumenti per la creazione e la gestione di agenti AI integrati con i dati aziendali.

Nel contesto più ampio dell’evoluzione dell’intelligenza artificiale aziendale, progetti come KARL riflettono una tendenza crescente verso sistemi sempre più autonomi e adattivi nella gestione della conoscenza interna delle organizzazioni. L’obiettivo non è solo migliorare la qualità delle risposte generate dai modelli linguistici, ma anche costruire infrastrutture di ricerca e analisi capaci di comprendere e sintetizzare grandi quantità di informazioni distribuite. Se queste architetture riusciranno effettivamente a superare le limitazioni delle pipeline RAG tradizionali, potrebbero diventare una componente fondamentale delle piattaforme dati di nuova generazione utilizzate dalle imprese.

Databricks presenta KARL, agente RAG progettato per gestire tutti i tipi di ricerca nei sistemi aziendali

DiFantasy

Di Fantasy

Articoli correlati

Anthropic introduce J-Lens per analizzare il workspace interno dei modelli Claude

Claude Cowork arriva su web e mobile per gestire attività non legate al coding

Google separa la cronologia di ricerca e salva immagini e audio usati nei servizi AI

Ultimi Post

Anthropic introduce J-Lens per analizzare il workspace interno dei modelli Claude

Claude Cowork arriva su web e mobile per gestire attività non legate al coding

Google separa la cronologia di ricerca e salva immagini e audio usati nei servizi AI

Apple attiva in iOS 27 i controlli vocali avanzati per Siri