Libreria ML Low Code PyCaret lancia la versione 2.0
PyCaret: la libreria di apprendimento automatico a low code open source in Python ha creato la nuova versione PyCaret 2.0. L’ultima versione ha lo scopo di ridurre l’ipotesi di approfondire i tempi di ciclo in un esperimento di ML, e consente ai data scientist di eseguire esperimenti end-to-end in modo rapido ed efficiente. Alcuni aggiornamenti importanti nella nuova versione di PyCaret includono:
Back-end di registrazione: integra il back-end MLFlow per tenere traccia degli esperimenti (metriche, parametri del modello, artefatti, elementi visivi ecc.)
Automazione modulare: PyCaret 2.0 è uno strumento di automazione del flusso di lavoro end-to-end. Puoi usarlo per creare flussi di lavoro di machine learning automatizzati o anche un software ML front-end.
Command Line Interface (CLI): ottimizza per funzionare in ambienti non Notebook come Spyder, PyCharm, VS Code.
Formazione abilitata per GPU: ora puoi addestrare xgboost e catboost model usando GPU.
Elaborazione parallela: supporta l’elaborazione parallela per quasi tutti gli algoritmi.
Utilità: molte nuove funzioni di utilità introdotte per aiutare gli sviluppatori a sfruttare al meglio PyCaret.
Che cos’è PyCaret?
Rispetto alle altre librerie di machine learning open source , PyCaret è una libreria di codici bassi alternativa che può essere utilizzata per eseguire complesse attività di machine learning con solo poche righe di codice. PyCaret è essenzialmente un wrapper Python attorno a diverse librerie e framework di machine learning come scikit-learn, XGBoost, Microsoft LightGBM, spaCy e molti altri.
Il design e la semplicità di PyCaret sono ispirati al ruolo emergente di citizen data scientist, un termine usato per la prima volta da Gartner. Citizen Data Scientists sono utenti esperti che possono svolgere compiti analitici sia semplici che moderatamente sofisticati che in precedenza avrebbero richiesto maggiori competenze. I data scientist esperti sono spesso difficili da trovare e costosi da assumere, ma i data scientist possono essere un modo efficace per mitigare questo divario e affrontare le sfide relative ai dati in ambito aziendale.
Utilità
PyCaret è semplice, facile da usare e pronto per la distribuzione. Tutti i passaggi eseguiti in un esperimento ML possono essere riprodotti utilizzando una pipeline che viene sviluppata e orchestrata automaticamente in PyCaret mentre avanzi nell’esperimento. Una pipeline può essere salvata in un formato di file binario trasferibile tra ambienti.
Il target di riferimento ideale di PyCaret è:
Data Scientist esperti che vogliono aumentare la produttività.
Citizen Data Scienziati che preferiscono una soluzione di apprendimento automatico a basso codice.
Studenti di Data Science.
Professionisti e consulenti della scienza dei dati coinvolti nella costruzione di progetti Proof of Concept.
Ora che PyCaret 2.0 è disponibile, il modo più semplice per installare pycaret è usare pip. Supporta solo Python a 64 bit.
Per ulteriori informazioni sulle nuove funzionalità, consultare le note di rilascio