L’intelligenza artificiale sta vivendo una rapida espansione delle sue applicazioni, ma affinché queste applicazioni funzionino senza intoppi, è essenziale garantire che i dati utilizzati siano di alta qualità, cioè affidabili, completi e precisi.
È questo il problema che la startup di Seattle, Gable.ai, mira a risolvere con successo, annunciando oggi il suo lancio segreto e vantando un finanziamento iniziale di 7 milioni di dollari. Essi definiscono la loro offerta come la prima piattaforma di collaborazione dati, che consente agli sviluppatori di software e agli esperti di dati/machine learning di creare e gestire risorse dati di alta qualità in modo iterativo. Alcuni investitori l’hanno già soprannominata “GitHub per i dati”, una definizione che richiama altre aziende nel campo dei dati come Kaggle e Hex.
Chad Sanderson, CEO e co-fondatore di Gable.ai, ha dichiarato: “GitHub sta effettivamente influenzando la cultura: aiuta gli ingegneri del software di tutta l’azienda a comunicare tra loro in modo molto più efficace, ma questo non esiste affatto per i dati.”
La piattaforma di Gable.ai permette ai fornitori e ai consumatori di dati di collaborare efficacemente, fornendo ai sviluppatori di software e ai professionisti dei dati gli strumenti per evitare modifiche sostanziali nei flussi di lavoro critici all’interno delle loro infrastrutture dati esistenti. Questa piattaforma comprende il riconoscimento delle risorse dati, la creazione di contratti dati per determinare i proprietari delle risorse e stabilire vincoli significativi, e l’applicazione dei contratti dati tramite integrazione continua/distribuzione continua all’interno di un ambiente simile a GitHub.
Prima di fondare Gable.ai, Sanderson insieme ai suoi co-fondatori, Adrian Kreuziger e Daniel Dicker, guidava il reparto dati di Convoy, una rete di trasporto digitale valutata 4 miliardi di dollari che gestisce migliaia di camion in tutto il paese attraverso una rete di trasportatori ottimizzata e connessa. Nonostante utilizzassero tecnologie all’avanguardia, la fiducia nei dati era scarsa: si verificavano problemi costanti di qualità dei dati e i modelli di analisi non potevano sfruttare miliardi di righe di dati.
Sanderson ha spiegato: “La complessità rendeva quasi impossibile rispondere anche a domande semplici come ‘Quante spedizioni abbiamo effettuato negli ultimi 30 giorni?’ per il nostro team di data science e analisi. Lo stesso problema si ripercuoteva sull’apprendimento automatico: i modelli erano estremamente sensibili e richiedevano dati accurati. Quando la qualità dei dati vacillava, i modelli collassavano e le previsioni si rivelavano errate.”
In definitiva, il problema era una mancanza di comunicazione tra ingegneri del software e sviluppatori di machine learning. Sanderson ha affermato: “Abbiamo notato un miglioramento esponenziale della qualità dei dati una volta colmato questo divario.”
Per promuovere l’espansione dell’intelligenza artificiale, è fondamentale risolvere i problemi di comunicazione legati alle modifiche dei dati, ha sottolineato Sanderson. Ha spiegato che senza un sistema di gestione dei cambiamenti dei dati, l’escalation dell’intelligenza artificiale diventa un compito arduo, evidenziando come aziende come Google, Meta e Amazon affrontino il problema con un notevole investimento di risorse. Tuttavia, in realtà, molte aziende non dispongono delle risorse necessarie per adottare questo approccio.
I contratti dati proposti da Gable.ai rappresentano una categoria completamente nuova che l’azienda ha introdotto come elemento fondamentale nel settore dei dati emergenti. Sanderson ha recentemente creato la “Data Quality Camp”, una comunità Slack che conta oltre 8.000 professionisti dei dati impegnati in queste nuove idee.
Questi concetti rappresentano un passo significativo nella ridefinizione del panorama dei dati, integrandosi come parte essenziale dello stack dati aziendale, secondo Apoorva Pandhi, CEO di Zetta Venture Partners, che ha guidato il round di finanziamento. Ha sottolineato come i fondatori di aziende di successo nel campo dei dati abbiano investito in Gable.ai, riconoscendo l’importanza di questa nuova categoria.