Iterative.ai, una società MLOps che sviluppa flussi di lavoro di data science e ingegneria AI, ha annunciato oggi di aver raccolto 20 milioni di dollari. La società afferma che supporterà il lancio del suo primo prodotto commerciale, Data Version Control (DVC) DVC Studio, un dashboard volto a semplificare lo sviluppo del modello di apprendimento automatico basato su dati e metriche.

MLOps, un composto di “apprendimento automatico” e “operazioni informatiche”, è una disciplina più recente che coinvolge la collaborazione tra scienziati dei dati e professionisti IT con l’obiettivo di produrre algoritmi di apprendimento automatico. Il mercato di tali soluzioni potrebbe crescere da un nascente $ 350 milioni a $ 4 miliardi entro il 2025, secondo  Cognilytica. Ma alcune sfumature possono rendere difficile l’implementazione di MLOps. Un  sondaggio  di NewVantage Partners ha rilevato che solo il 15% delle aziende leader ha implementato funzionalità di intelligenza artificiale in produzione su qualsiasi scala.

 
Iterative, fondata dall’ex scienziato di dati Microsoft Dmitry Petrov e dall’imprenditore Ivan Shcheklein, mantiene una serie di prodotti progettati per risolvere le sfide MLOps tra cui Continuous Machine Learning (CML), DVC e il già citato Studio.


CML consente ai data scientist di gestire esperimenti di machine learning e tenere traccia di chi ha addestrato i modelli o ha modificato i dati e quando. Possono codificare dati e modelli invece di inviarli a un repository Git e impostare CML per generare automaticamente report con metriche e grafici, creando flussi di lavoro di apprendimento automatico utilizzando servizi come Amazon Web Services (AWS), Microsoft Azure e Google Cloud Platform.

DVC è un sistema di controllo della versione open source per progetti di apprendimento automatico progettato per rendere i modelli condivisibili e riproducibili gestendo file, set di dati, modelli e metriche di grandi dimensioni, nonché codice. DVC collega questi componenti tramite pipeline indipendenti dalla lingua e sfrutta l’archiviazione cloud, l’archiviazione collegata alla rete o i dischi per archiviare i contenuti dei file. Il codice completo e la provenienza dei dati aiutano a tenere traccia delle metriche di ogni modello, mentre i comandi push-pull spostano bundle di modelli, dati e codice in macchine di produzione o remote.

Per quanto riguarda Studio, che combina DVC e CML in una suite completamente gestita, consente ai data scientist di organizzare e navigare attraverso più progetti di machine learning durante la creazione di team, l’aggiunta di membri del team e l’invito a sperimentare. Studio aiuta a visualizzare dati e metriche tramite grafici, grafici di tendenza e presentazioni tabulari e confrontare gli esperimenti. Studio mantiene anche il codice, i dati e gli esperimenti collegati, in modo che ogni modifica generi informazioni su come migliorare i modelli.

Mercato MLOps in crescita
Secondo il CEO di Iterative Petrov, il vantaggio di MLOps è che mette i team operativi in ​​prima linea nelle migliori pratiche all’interno di un’organizzazione. Il collo di bottiglia che deriva dagli algoritmi di apprendimento automatico si allevia con una divisione più intelligente delle competenze e della collaborazione da parte dei team operativi e di dati e MLOps stringe questo anello.

“Le piattaforme e le soluzioni AI sono costruite al di fuori dello stack tecnologico di sviluppo software. Crea un muro tra i ricercatori ML e gli ingegneri del software. Impedisce alle persone di apprendimento automatico di utilizzare le migliori pratiche e gli strumenti dello sviluppo software. Il nostro obiettivo è rompere questo muro e creare il miglior ambiente di collaborazione sia per gli utenti di machine learning che per gli ingegneri del software”, ha detto Petrov a VentureBeat via e-mail. “[Come risultato della pandemia,] le aziende prestano maggiore attenzione all’automazione. MLOps sta diventando un’area più matura e sta attirando più interesse da parte delle aziende”.

Iterative compete con Molecula , che sta sviluppando un feature store basato su cloud per carichi di lavoro di intelligenza artificiale e machine learning. Un altro principale rivale è Domino Data Lab , una startup che sviluppa una piattaforma focalizzata sulle imprese con grandi team di data science.

 

Ma Florian Leibert, un socio accomandatario dell’investitore 468 Capital di Iterative, che ha anche investito nella società, ha fiducia nell’approccio go-to-market di Iterative. Leibert è il fondatore di Mesosphere, una startup infrastrutturale basata sul software open source Apache Mesos, che astrae risorse di calcolo come le CPU dalle macchine.

Iterative afferma che oltre 1.000 aziende stanno utilizzando i suoi strumenti e che i suoi progetti open source hanno un totale combinato di oltre 200 contributori e 4.000 membri della comunità.

“I dati, l’apprendimento automatico e l’intelligenza artificiale stanno diventando una parte essenziale del settore e dell’infrastruttura IT. Le aziende con una grande adozione dell’open source e una strategia di mercato dal basso verso l’alto, come Iterative, definiranno gli standard per gli strumenti e i processi di intelligenza artificiale attorno alla creazione di modelli di apprendimento automatico”, ha affermato Leibert in un comunicato stampa.

468 Capital e Leibert hanno guidato l’ultimo round di finanziamento di Iterative con sede a San Francisco, in California, di 15 dipendenti, una serie A, con la partecipazione degli investitori True Ventures e Afore Capital. Porta il finanziamento totale dell’azienda a più di $ 25 milioni fino ad oggi.

 

 

Di ihal