I modelli linguistici di grandi dimensioni (LLM) hanno rivoluzionato la capacità delle macchine di comprendere e generare linguaggio naturale. Tuttavia, quando si tratta di compiti predittivi ad alto valore, come prevedere il tasso di abbandono dei clienti o rilevare frodi a partire da dati strutturati, molte aziende rimangono ancorate alle tecniche di machine learning tradizionali. Kumo, una startup fondata dal professore di Stanford Jure Leskovec, sta cercando di colmare questa lacuna con un approccio innovativo: il modello fondazionale relazionale (RFM). Questo modello promette di portare le capacità predittive avanzate nel dominio dei dati strutturati, offrendo previsioni “zero-shot” su database complessi senza la necessità di un addestramento specifico.
Mentre gli LLM eccellono nell’elaborazione di testi non strutturati, come articoli o conversazioni, i dati aziendali spesso risiedono in tabelle relazionali, come quelle contenute in database SQL. Per applicare il machine learning a questi dati, le aziende devono affrontare il processo laborioso e costoso di “feature engineering”, che implica la creazione manuale di segnali predittivi unendo informazioni provenienti da diverse tabelle, come cronologie degli acquisti e clic su siti web. Questo processo è non solo dispendioso in termini di tempo, ma anche soggetto a errori e difficoltà nel mantenere la qualità dei dati nel tempo.
Kumo affronta questa sfida con due innovazioni principali. Innanzitutto, rappresenta automaticamente qualsiasi database relazionale come un grafo interconnesso, dove ogni riga di una tabella diventa un nodo e le relazioni tra le tabelle, come le chiavi esterne, definiscono le connessioni tra questi nodi. Successivamente, applica un’architettura di deep learning, ispirata ai transformer utilizzati negli LLM, per apprendere direttamente da questa rappresentazione grafica. Questo approccio consente al modello di identificare pattern complessi e relazioni tra i dati senza la necessità di intervento umano.
Una delle caratteristiche distintive del RFM è la sua capacità di effettuare previsioni “zero-shot”. Ciò significa che, una volta addestrato su una vasta gamma di dati, il modello può essere applicato a nuovi database senza necessità di riaddestramento. Ad esempio, un utente può inserire una semplice query per prevedere la probabilità che un cliente effettui un ordine nei prossimi 30 giorni. Il sistema restituisce rapidamente una valutazione, insieme a una spiegazione basata sui dati disponibili, come l’attività recente del cliente. Questa capacità riduce significativamente il tempo necessario per ottenere previsioni accurate, potenzialmente equivalenti a settimane di lavoro di un team di data scientist.
L’introduzione del RFM ha implicazioni significative per l’evoluzione dell’AI nelle imprese. Tradizionalmente, l’AI aziendale si è concentrata sull’elaborazione di dati non strutturati, come documenti e comunicazioni, utilizzando LLM. Tuttavia, con la crescente disponibilità di dati strutturati, è essenziale sviluppare modelli in grado di analizzare e prevedere tendenze basate su questi dati. Il RFM rappresenta un passo verso un’AI più completa, che integra la comprensione del linguaggio naturale con la capacità di analizzare e prevedere dati strutturati.
Il modello fondazionale relazionale di Kumo offre una soluzione innovativa per le aziende che desiderano sfruttare appieno il potenziale dei loro dati strutturati. Eliminando la necessità di processi manuali complessi e fornendo previsioni rapide e accurate, il RFM ha il potenziale di trasformare il modo in cui le imprese affrontano compiti predittivi complessi. Con l’evoluzione continua dell’AI, l’integrazione di modelli come il RFM potrebbe diventare fondamentale per ottenere un vantaggio competitivo nel panorama aziendale moderno.