L’intelligenza artificiale ha rivoluzionato il modo in cui lavoriamo con i dati. In passato, era necessario scrivere query SQL per estrarre informazioni dai database. Oggi, è possibile ottenere risposte semplicemente digitando una domanda in linguaggio naturale. Tuttavia, anche se i moderni sistemi di query in linguaggio naturale sono avanzati, incontrano ancora delle difficoltà con query particolarmente complesse.
I ricercatori dell’UC Berkeley e di Stanford stanno affrontando questo problema con un nuovo approccio chiamato Generazione Aumentata da Tabella (TAG). Questo metodo promette di superare le limitazioni dei tradizionali sistemi di conversione da testo a SQL.
Attualmente, ci sono due principali metodi per rispondere a domande sui dati: la conversione da testo a SQL e la generazione aumentata dal recupero (RAG). Entrambi i metodi hanno i loro limiti, specialmente con query complesse che richiedono una comprensione profonda del contesto.
- Conversione da Testo a SQL: Questo metodo traduce una domanda in linguaggio naturale in una query SQL. Tuttavia, è limitato a domande che possono essere espressi tramite algebra relazionale.
- Generazione Aumentata dal Recupero (RAG): Questo approccio esegue ricerche sui dati e restituisce risposte basate sui record trovati. Non è ideale per query che richiedono un ragionamento complesso.
TAG utilizza un modello in tre fasi per migliorare l’interrogazione dei database:
- Identificazione dei Dati Rilevanti: Un modello linguistico (LM) determina quali dati sono necessari per rispondere alla domanda e traduce l’input in una query eseguibile per il database.
- Esecuzione della Query: Il sistema esegue la query sul database e ottiene la tabella di dati più rilevante.
- Generazione della Risposta: Un LM utilizza i dati estratti per formulare una risposta in linguaggio naturale.
Questo approccio integra le capacità di ragionamento dei modelli linguistici sia nella creazione delle query che nella generazione delle risposte. Risolve problemi come il conteggio e la matematica, che sono complessi per RAG, e gestisce domande che richiedono una combinazione di conoscenza del dominio e ragionamento semantico.
Per esempio, TAG può rispondere a domande complesse come: “Riassumi le recensioni del film romantico con il maggior incasso considerato un ‘classico’.” Questo richiede di trovare il film con il maggior incasso e di determinare se è un classico, cosa che i metodi tradizionali faticherebbero a fare.
I ricercatori hanno testato TAG su un set di dati chiamato BIRD, noto per la sua difficoltà nella conversione da testo a SQL. I risultati hanno mostrato che TAG ha ottenuto una precisione superiore al 40%, con un miglioramento del 20% al 65% rispetto ai metodi tradizionali. Inoltre, TAG ha dimostrato di essere tre volte più veloce nell’esecuzione delle query rispetto agli altri metodi.