Dataiku 11: le principali funzionalità che accelereranno i progetti di intelligenza artificiale aziendale
Dataiku , con sede a New York , che fornisce una soluzione centralizzata per la progettazione, l’implementazione e la gestione di applicazioni di intelligenza artificiale (AI) aziendale, ha rilasciato la versione 11 della sua piattaforma AI e dati unificati. L’aggiornamento, che sarà generalmente disponibile a luglio, si concentra sul mantenimento della promessa di “IA quotidiana” e fornisce nuove funzionalità non solo per aiutare gli esperti di dati a gestire progetti di IA più ampi, ma anche per consentire agli utenti aziendali non tecnici di interagire facilmente con l’IA per flussi di lavoro migliorati, tra gli altri vantaggi.
“Data scientist esperti, ingegneri di dati e ingegneri di ML [machine learning] sono alcuni dei lavori più preziosi e ricercati oggi. Eppure, troppo spesso, data scientist di talento trascorrono la maggior parte del loro tempo in una logistica di basso valore, come la creazione e la manutenzione degli ambienti, la preparazione dei dati e la messa in produzione dei progetti. Con l’ampia automazione integrata in Dataiku 11, stiamo aiutando le aziende a eliminare il frustrante lavoro frenetico in modo che le aziende possano sfruttare maggiormente i loro investimenti nell’IA e, in definitiva, creare una cultura dell’IA per trasformare le industrie”, ha affermato Clément Stenac, CTO e cofondatore di Dataiku.
Di seguito è riportato un riepilogo delle funzionalità chiave.
Code Studios con monitoraggio degli esperimenti
Code Studios in Dataiku 11 offre agli sviluppatori di intelligenza artificiale un ambiente di codifica completamente gestito e isolato nel loro progetto Dataiku, in cui possono lavorare utilizzando il proprio IDE preferito o stack di app Web. La soluzione offre agli sviluppatori di intelligenza artificiale un modo per codificare il modo in cui si sentono a proprio agio nel rispetto delle politiche aziendali per la centralizzazione e la governance dell’analisi (se presenti). In precedenza, qualsiasi cosa del genere avrebbe significato optare per una configurazione personalizzata, con costi e complessità maggiori.
La soluzione include anche una funzione di monitoraggio degli esperimenti, che fornisce agli sviluppatori un’interfaccia centrale per archiviare e confrontare tutte le esecuzioni di modelli su misura realizzate a livello di codice utilizzando il framework MLFlow.
Sviluppo della visione artificiale senza interruzioni
Per semplificare il compito ad alta intensità di risorse dello sviluppo di modelli di visione artificiale, Dataiku 11 offre un framework di etichettatura dei dati integrato e un’interfaccia ML visiva.
Il primo, come spiega l’azienda, annota automaticamente i dati in grandi quantità, un’attività spesso gestita tramite piattaforme di terze parti come Tasq.ai . Nel frattempo, quest’ultimo fornisce un percorso visivo end-to-end per le comuni attività di visione artificiale, consentendo a data scientist esperti e principianti di affrontare casi d’uso complessi di rilevamento di oggetti e classificazione delle immagini, dalla preparazione dei dati allo sviluppo e alla distribuzione dei modelli.
Previsione di serie temporali
Gli utenti aziendali, in particolare quelli con competenze tecniche limitate, spesso hanno difficoltà ad analizzare i dati storici e creare solidi modelli di previsione aziendale per il processo decisionale. Per affrontare questo problema, Dataiku 11 offre strumenti integrati che forniscono interfacce visive senza codice e aiutano i team ad analizzare i dati temporali e sviluppare, valutare e distribuire modelli di previsione di serie temporali .
Negozio di funzionalità
L’ultima versione offre anche un Feature Store con nuovi flussi di condivisione degli oggetti per migliorare la collaborazione a livello di organizzazione e accelerare l’intero processo di sviluppo del modello. Secondo la società, la capacità offrirà ai data team un’area dedicata per accedere o condividere set di dati di riferimento contenenti funzionalità AI curate. Ciò impedirà agli sviluppatori di riprogettare le stesse funzionalità o di utilizzare risorse di dati ridondanti per progetti ML e prevenire inefficienze e incoerenze.
Ottimizzazione dei risultati
I team utilizzano spesso un metodo manuale per tentativi ed errori (what if) per fornire agli stakeholder aziendali informazioni fruibili che potrebbero aiutarli a ottenere i migliori risultati possibili.
Con l’ottimizzazione dei risultati, che fa parte di Dataiku 11, l’intero processo sarà automatizzato. In sostanza, considererà automaticamente i vincoli definiti dall’utente e troverà l’insieme ottimale di valori di input che darà i risultati desiderati. Ad esempio, potrebbe prescrivere quali modifiche un produttore potrebbe apportare alle condizioni di fabbrica per ottenere il massimo rendimento della produzione o quali adeguamenti al profilo finanziario di un consumatore bancario porterebbero alla minor probabilità di insolvenza dei prestiti.
Altre capacità
Tra le altre cose, l’azienda ha introdotto strumenti per migliorare la supervisione e il controllo sullo sviluppo e l’implementazione del modello. Ciò include uno strumento automatizzato per generare documenti di flusso e un registro centrale che acquisisce snapshot di tutte le pipeline di dati e gli artefatti del progetto, per la revisione e l’approvazione prima della produzione. L’azienda fornirà anche test di stress del modello, che esamineranno il comportamento del modello in situazioni di implementazione nel mondo reale prima dell’implementazione effettiva.