C’è una richiesta per l’implementazione e l’automazione dell’integrazione continua, della consegna continua (CD) e della formazione continua per i sistemi ML. Conosciuto anche come MLOps, è una tendenza ingegneristica ML che mira a consolidare e automatizzare le tubazioni del sistema ML.
I leader dell’innovazione tecnologica desiderano applicare i principi DevOps per i progetti AI e ML. L’implementazione di MLOps suggerisce l’automazione e il monitoraggio in tutte le fasi della costruzione del sistema ML. Gli analisti affermano che la vera sfida non è la costruzione di un modello ML, la sfida è creare un sistema ML integrato e lanciarlo continuamente in produzione.
Ma perché ci saranno nuove pipeline ML in primo luogo?
“Una delle cose importanti che dobbiamo capire è che esiste una differenziazione tra le attuali pipeline di cui siamo a conoscenza e come sono leggermente più diverse da quelle che saranno le pipeline nel futuro della scienza dei dati. Le attuali condotte di machine learning non saranno sostenibili e dovrai metterti alla prova in futuro per diventare più capace di gestire il tipo di problemi che avremo tra qualche anno “, ha detto Lavi Nigam , presso AIM conferenza virtuale plugin.
Secondo lui, c’è una differenza tra fare scienza dei dati su scala locale e su scala cloud. La maggior parte della scienza dei dati che accade oggi si trova nei tuoi sistemi o laptop o all’interno di un server locale. Mentre andiamo avanti, l’intera idea di un machine learning scalabile o AI si sposterà localmente sul cloud, secondo gli analisti. Ciò significa che anche i componenti della pipeline cambieranno quando si tratta di piattaforme cloud diverse .
“In questo momento, con il tipo di condotte che abbiamo, ci sono molti componenti sciolti, che non parlano tra loro e siedono in silos. Ma MLOps è diverso dall’attuale scienza dei dati che facciamo oggi e può facilitare quelle comunicazioni tra i diversi componenti della pipeline ML ”, ha affermato Lavi.
Necessità di processi ML manuali o automatizzati
Oggi, l’analisi dei dati, la preparazione dei dati, la formazione dei modelli e la validazione richiedono uno sforzo manuale in ogni fase e il passaggio manuale da una fase all’altra. L’intero processo ML è fondamentalmente eseguito con codice iterativo che viene scritto ed eseguito nei notebook dai data scientist fino a quando non viene prodotto un modello prototipo funzionale.
Molti data scientist e ricercatori ML possono creare modelli all’avanguardia, ma il loro processo di costruzione e distribuzione di modelli ML è completamente manuale e non tiene conto dei continui cambiamenti nei dati futuri. L’attuale processo presuppone che il team di data science gestisca alcuni modelli che non cambiano frequentemente con nuovi dati. Una nuova versione del modello viene distribuita solo poche volte all’anno. L’attuale scenario ML sarà ulteriormente interrotto da strumenti automatizzati come AutoML.
Inoltre, manca il monitoraggio delle prestazioni del modello e i processi ML non tengono traccia o registrano le previsioni e le azioni del modello, necessarie per rilevare il degrado delle prestazioni del modello e altre derive comportamentali del modello.
“L’attuale processo procede in modo molto semplificato, in cui hai una comprensione del business. Quindi esegui l’acquisizione dei dati, l’approvvigionamento dei dati, la pipeline, il wrangling e l’esplorazione. Fatto ciò, vai alla modellazione. Quindi esegui le tue operazioni standard come ingegneria delle funzionalità, formazione dei modelli e valutazione moderna. Alla fine, il modello viene distribuito. L’output finale ha la forma di un’API pronta per l’azienda. Ma ti basta creare un’API e tutto funziona bene? “
È qui che sorgerà MLOps , afferma Lavi. L’obiettivo di MLOps è di eseguire l’addestramento continuo del modello consolidando e automatizzando la pipeline ML. Il processo automatizza anche il processo di utilizzo di nuovi dati per riqualificare i modelli in produzione, introducendo nella pipeline dati e sforzi di validazione dei modelli in modo automatizzato.