IBM ha introdotto CodeFlare al Ray Summit nel giugno del 2021. La piattaforma è stata introdotta per ridurre drasticamente il tempo necessario per impostare, eseguire e scalare i test di machine learning. Ad esempio, CodeFlare ha ridotto il tempo di esecuzione di ogni pipeline da 4 ore a 15 minuti quando un utente ha utilizzato il framework per esaminare e migliorare circa 100.000 pipeline per l’addestramento della modalità di apprendimento automatico. Di recente, IBM ha annunciato che CodeFlare riduce significativamente il tempo necessario per automatizzare le attività di apprendimento del trasferimento per i modelli di base .
Cos’è CodeFlare?
CodeFlare è una piattaforma multi-cloud ibrida che semplifica l’integrazione, la scalabilità e l’accelerazione di analisi complesse in più fasi e pipeline di machine learning. È un framework open source che semplifica l’integrazione e la scalabilità dei big data e delle operazioni di intelligenza artificiale nel cloud ibrido . CodeFlare è sviluppato su Ray, un framework di calcolo distribuito open source per applicazioni di machine learning. Le capacità di Ray sono ampliate da CodeFlare, che aggiunge aspetti specializzati che semplificano le operazioni di ridimensionamento.
CodeFlare utilizza Python e viene eseguito sulla nuova piattaforma serverless di IBM, IBM Cloud Code Engine e Red Hat OpenShift. Gli utenti possono distribuire la piattaforma praticamente da qualsiasi luogo, consentendo ai ricercatori di sfruttare i vantaggi dell’elaborazione serverless. La piattaforma fornisce anche API e strumenti avanzati, consentendo ai ricercatori di concentrarsi maggiormente sulla loro ricerca e meno sulle complessità di configurazione.
In che modo CodeFlare accelera l’automazione delle attività di apprendimento del trasferimento per i modelli di base?
Il CodeFlare, recentemente migliorato e aggiornato, lo trasforma efficacemente da strumento esplorativo per la scienza dei dati a una piattaforma in grado di automatizzare i flussi di lavoro di intelligenza artificiale e machine learning sul cloud ibrido di IBM. Le aziende utilizzano modelli di base per una varietà di funzioni. Un’azienda di servizi finanziari, ad esempio, può creare un modello di base specifico per la ricerca sul sentiment. Attualmente, la raccolta e l’addestramento di un modello di intelligenza artificiale su un corpo di dati rilevante e varie attività a monte ea valle richiedono un’incredibile quantità di tempo. CodeFlare accelera il processo utilizzando un’interfaccia basata su Python o pipeline di modelli fondamentali, semplificando l’integrazione, la duplicazione e la condivisione dei dati. Inoltre, su una piattaforma cloud ibrida, queste attività di pre-elaborazione, convalida e adattamento dei modelli di base per i casi d’uso commerciali sono ora completamente automatizzate.
Ad esempio, prendi l’istanza dell’analisi del sentiment. CodeFlare inizia ripulendo i dati di input, che include la deduplicazione e la rimozione di contenuti potenzialmente dannosi o di parte. Quindi, mette a punto un modello di base per tutte le attività specifiche necessarie per l’analisi del sentiment dell’azienda. Un data scientist può rendere operative centinaia di tali pipeline con solo poche righe di codice e automatizzare queste operazioni ogni volta che è necessario apportare modifiche. CodeFlare consente ai data scientist di utilizzare i propri dati senza lasciare la piattaforma ibrida.
Il cloud ibrido è una parte essenziale della strategia di crescita di IBM. Le entrate totali del cloud di IBM sono aumentate del 20% nell’anno fiscale 2020, grazie in parte ai programmi di cloud ibrido forniti da Red Hat di proprietà di IBM.