Nel settore dell’intelligenza artificiale, l’attenzione si è spesso concentrata su dati non strutturati come testi e immagini, lasciando in secondo piano i dati relazionali che costituiscono il cuore operativo delle aziende. Kumo, startup fondata da esperti provenienti da Stanford, Airbnb e Pinterest, ha colmato questa lacuna presentando KumoRFM, il primo Relational Foundation Model (RFM) progettato per fornire previsioni immediate sui dati aziendali strutturati senza necessità di addestramento specifico per ogni compito.
KumoRFM rappresenta un cambiamento radicale nell’approccio all’analisi predittiva dei dati relazionali. Tradizionalmente, l’analisi di questi dati richiedeva processi complessi di ingegneria delle caratteristiche e la costruzione di modelli su misura per ogni compito. Con KumoRFM, è possibile ottenere previsioni accurate direttamente dai database relazionali, eliminando la necessità di tali processi laboriosi.
Il modello utilizza una combinazione di tecniche avanzate, tra cui:
- Relational Graph Transformer: trasforma i dati tabellari in grafi eterogenei, permettendo al modello di comprendere le relazioni complesse tra le entità.
- In-context learning: consente al modello di adattarsi a nuovi compiti utilizzando esempi contestuali, senza necessità di riaddestramento.
- Predictive Query Language (PQL): un linguaggio simile a SQL che permette agli utenti di formulare domande predittive in modo intuitivo.
I test condotti su benchmark come RelBench hanno dimostrato che KumoRFM supera le tecniche tradizionali di ingegneria delle caratteristiche e i modelli di deep learning supervisionati, con miglioramenti delle prestazioni dal 2% all’8% in media. Quando fine-tuned su compiti specifici, le prestazioni migliorano ulteriormente del 10%-30%. Inoltre, il modello offre previsioni in tempo reale, riducendo significativamente il tempo necessario per ottenere risultati utili.
Le applicazioni di KumoRFM sono molteplici e includono la rilevazione di frodi, la previsione del churn dei clienti, la raccomandazione di prodotti e l’ottimizzazione delle operazioni aziendali. Aziende come DoorDash, Reddit e Snowflake stanno già sfruttando le potenzialità di questo modello per migliorare le loro decisioni strategiche.