L’ingegneria delle funzionalità, o il processo di utilizzo della conoscenza del dominio per estrarre le funzionalità dai dati, è essenziale per ottimizzare le prestazioni di intelligenza artificiale e apprendimento automatico. È anche in genere arduo e comporta la riscrittura delle funzionalità prima che vengano distribuite. Spesso, un pezzo mancante è l’infrastruttura che colma il divario tra i modelli di formazione e il servizio dei risultati dell’IA negli ambienti di produzione.
Ecco perché nel 2018 Ben Chambers e Davor Bonaci hanno co-fondato Kaskada , che utilizza tecniche di mining per calcolare e servire le funzionalità AI in tempo reale. Oggi, a seguito della chiusura di un round di finanziamento da 8 milioni di dollari , la startup di Seattle, Washington, ha annunciato la disponibilità generale della sua piattaforma di ingegneria delle funzionalità per i singoli data scientist e le aziende, dopo un periodo di beta test con i primi utenti.
La piattaforma Kaskada non richiede configurazione e acquisisce dati storici da data warehouse e data lake, consumando messaggi da fonti di streaming come Apache Kafka e Amazon Kinesis. Trasforma questi dati basati su eventi in un formato utilizzabile per aggregazioni e altri calcoli e consente ai data scientist di scrivere calcoli utilizzando dati da fonti connesse, visualizzando le distribuzioni e analizzando valori anomali.
Secondo la società di ricerche di mercato Tractica, si prevede che il mercato globale del software AI subirà una crescita “massiccia” nei prossimi anni, con un aumento dei ricavi da $ 9,5 miliardi nel 2018 a $ 118,6 miliardi previsti entro il 2025. Diverse startup stanno tentando di incassare sulla tendenza – o l’hanno già fatto – tra cui Determined AI , che ha recentemente raccolto $ 11 milioni per sviluppare ulteriormente i suoi strumenti di sviluppo del modello di deep learning per data scientist e ingegneri di IA. Nel frattempo, Iguazio ha raccolto $ 24 milioni per la sua suite di strumenti di sviluppo e gestione dell’IA e Clusterone ha incassato 2 milioni di dollari per la sua piattaforma DevOps per AI che opera sia con server locali che con piattaforme di cloud computing pubblico come AWS, Azure e Google Cloud Platform.
Gli operatori storici stanno anche cercando di conquistare una fetta del crescente mercato della preparazione dei dati di intelligenza artificiale e apprendimento automatico. Lo scorso dicembre, Amazon ha introdotto SageMaker Data Wrangler , che semplifica apparentemente il processo di ingegnerizzazione delle funzionalità consentendo agli sviluppatori di scegliere e importare i dati desiderati da vari negozi con un solo clic.
Ma Kaskada afferma che la sua piattaforma è la prima a concentrarsi esclusivamente sull’ingegneria delle funzionalità e sull’esperienza di servizio. A tal fine, include un’interfaccia collaborativa per i data scientist ed è alimentato da un’infrastruttura di dati proprietaria per l’elaborazione di dati basati su eventi e funzioni di servizio in produzione. Con Kaskada, i data scientist possono ridimensionare, trasformare e codificare le funzionalità e visualizzare tutte le funzionalità per un modello all’interno di una dashboard. Sono anche in grado di identificare quali funzionalità esportare per la formazione, la promozione alla produzione e il test, nonché misurare le prestazioni delle funzionalità nel tempo e aggiornare le versioni delle funzionalità di produzione chiamando un’API del feature store.
“La piattaforma di ingegnerizzazione delle funzionalità di Kaskada è progettata per semplificare i problemi relativi ai dati reali nell’apprendimento automatico”, ha affermato Bonaci. “I team di data science possono ora collaborare meglio, creare funzionalità migliori e fornire risultati a un livello completamente nuovo. Non vedo l’ora di vedere che tipo di impatto avranno nei mesi e negli anni a venire “.
La piattaforma Kaskada è gratuita e i data scientist hanno la possibilità di pagare per aggiungere ulteriori utenti, gestire più dati e accedere a funzionalità premium.