Sempre più aziende stanno cercando di includere sistemi di Recupero Aumentato Generativo (RAG) nella loro tecnologia, e stanno emergendo nuovi metodi per migliorarlo.
La società di database vettoriali Qdrant ha sviluppato un nuovo algoritmo di ricerca, BM42, che promette di rendere il RAG più efficiente e conveniente.
Fondata nel 2021, Qdrant ha creato BM42 per aiutare le aziende a migliorare la loro ricerca combinando la ricerca semantica e quella per parole chiave. Il co-fondatore e direttore tecnico di Qdrant, Andrey Vasnetsov, ha spiegato a VentureBeat che BM42 è un aggiornamento dell’algoritmo BM25, utilizzato nelle piattaforme di ricerca tradizionali per classificare la pertinenza dei documenti.
Secondo Vasnetsov, BM42 utilizza un modello linguistico che estrae informazioni dai documenti, trasformandole in token. Questi token vengono poi valutati per determinare la pertinenza rispetto alla query di ricerca, consentendo a Qdrant di trovare esattamente le informazioni necessarie.
BM42 non è l’unico metodo che cerca di superare BM25 per migliorare la ricerca ibrida e il RAG. Un’altra opzione è Splade, un modello linguistico pre-addestrato che identifica relazioni tra parole e include termini correlati nelle ricerche. Tuttavia, Splade può essere costoso e richiede molti calcoli, mentre BM42 offre una soluzione più conveniente.
Il RAG sta diventando un tema caldo nell’intelligenza artificiale aziendale, poiché le aziende cercano modi per utilizzare modelli di IA generativa applicandoli ai propri dati. Questo potrebbe fornire informazioni più accurate e in tempo reale ai dipendenti e agli utenti.
Grandi aziende come Microsoft e Amazon offrono ora infrastrutture per creare applicazioni RAG. A giugno, OpenAI ha acquisito Rockset per potenziare le sue capacità RAG.
Tuttavia, anche se il RAG permette di basare le informazioni sui dati aziendali, resta comunque un modello linguistico che può essere soggetto a errori e allucinazioni.