Vuoi diventare un data scientist nel 2023? Ecco cosa devi sapere 

Vuoi diventare un data scientist nel 2023? Se è così, non sei solo. Ma le condizioni economiche in rapido cambiamento e i recenti massicci licenziamenti in aziende come Meta potrebbero avere molti dei quasi 106.000 data scientist negli Stati Uniti e coloro che cercano di entrare nel campo – uno in cui lo stipendio medio è di $ 100.274 all’anno – chiedendosi cosa accadrà anno porterà. Quali saranno le competenze più richieste? Com’è davvero la giornata tipo di un data scientist? Quali sono le principali tendenze del settore? 

Daliana Liu , data scientist senior presso la società di machine learning Predibase e conduttrice di podcast di The Data Scientist Show , ama porre e rispondere proprio a queste domande. Infatti, ha iniziato il suo podcast – che ora vanta 55 episodi con interviste a data scientist di aziende come Meta, AirBnB, Nvidia e Google – perché sentiva che la scienza dei dati aveva bisogno di più dialogo sulle tendenze, le competenze e le lezioni apprese, direttamente dalle voci di veri professionisti che operano nel settore.  
Dopo aver lavorato in precedenza come data scientist senior e istruttore senior di machine learning per Amazon Web Services (AWS), Liu ha affermato di sapere cosa vuol dire davvero essere un professionista del settore.

“Posso condividere alcuni consigli che non conoscevo quando ho iniziato”, ha detto, aggiungendo che a volte si sentiva sola nel suo percorso professionale. La scienza dei dati, ha spiegato, a volte può sembrare isolata, specialmente con il lavoro a distanza.

“Sentivo che c’era un divario tra ciò che imparavo a scuola e ciò che effettivamente faccio, ea volte mi sento anche molto insicura”, ha detto. “Non conoscevo molti altri data scientist che lavoravano nel settore, quindi avrei voluto avere una comunità e parlare con loro”. 

Nessuno stampo per un ruolo di scienza dei dati
 
In sostanza, ha detto Liu, uno scienziato di dati prende qualcosa di grezzo e lo traduce in qualcosa di significativo. Il potere della scienza dei dati, ha spiegato, sta dando un senso al passato per formulare una raccomandazione per il futuro. 

“Un data scientist è fondamentalmente qualcuno che risolve un problema aziendale con i dati”, ha spiegato. “Ho creato un meme con Sherlock Holmes che esamina diverse prove, tranne per il fatto che abbiamo centinaia, migliaia, milioni di [pezzi di] prove in più rispetto a Sherlock Holmes – e devi trovare un quadro statistico o una soluzione di apprendimento automatico per rispondere a una domanda .” 

 
Scienziato dei dati: Fondamentalmente Sherlock Holmes, solo con 10.000 volte più informazioni da indagare.
Meme creato da Daliana Liu.
Ciò che a volte complica la visione esterna della scienza dei dati sono i numerosi percorsi che i professionisti intraprendono per accedervi e le competenze di nicchia che sviluppano lungo il percorso. Ad esempio, il rapporto sullo stato della scienza dei dati del 2022 di Anaconda ha rilevato che il 20% degli studenti che sperano di entrare nella professione di scienza dei dati afferma che uno dei maggiori ostacoli all’ingresso è la mancanza di chiarezza su quale esperienza sia effettivamente richiesta. Inoltre, coloro che già lavorano sul campo riferiscono che le loro responsabilità sono ovunque: amministrazione del sistema, data science o ingegneria effettiva, ingegneria del cloud, ricerca o persino istruzione.

Liu dice che questa è stata anche la sua esperienza, e molti scienziati di dati che ha intervistato e con cui ha lavorato hanno detto la stessa cosa: semplicemente non esiste uno stampo per inserirsi in un ruolo di scienza dei dati e non è necessario disporre necessariamente di una tecnologia sfondo. 

“Molte persone che ho intervistato provenivano da un background non tecnologico”, ha detto. “Sono solo molto interessati a ottenere informazioni dai dati.” 

E ci sono diversi tipi di data scientist, ha sottolineato Liu. Ci sono i generalisti, che hanno una cassetta degli attrezzi fondamentale su statistiche, modelli di apprendimento automatico e previsioni. E ci sono data scientist più specializzati, che lavorano con i team di prodotto e aiutano l’azienda a condurre esperimenti o prendere decisioni. 

 
3 principali idee sbagliate sui data scientist
Nel corso della sua carriera e dai suoi discorsi sui podcast, Liu ha osservato tre principali idee sbagliate sulla professione:

1. Tutti pensano che tu sia un genio della matematica. 
“La gente pensa che tu debba conoscere molta matematica o avere un dottorato di ricerca, ha detto Liu. Ma in realtà, ha spiegato, grazie a strumenti come Python o diversi pacchetti di data science, non è necessario calcolare tutto. Detto questo, “devi capire le basi e credo che tutti possano impararlo”. 

Liu ha aggiunto che non pensa di essere un “genio” della matematica. In effetti, “ho lottato molto durante la mia laurea”, ha detto. Nel complesso, ha aggiunto, nessuno è “tagliato” per essere un data scientist. “Non credo di essere stata ‘tagliata’ per essere una scienziata dei dati, ho fallito”, ha detto. “Tutti hanno lottato e stanno ancora cercando di capire le cose. Stiamo ancora cercando di andare su Google o StackOverflow per trovare risposte”. 

 
2. La scienza dei dati è come per magia. 
“La gente dice che quello che facciamo è una specie di magia, ma in realtà quello che facciamo un sacco di volte è semplicemente passare del tempo con i dati”, ha spiegato Liu. “Alcune persone lo chiamano ‘diventa tutt’uno con i dati’: vuoi iniziare con qualcosa di semplice e costruire sopra i dati in modo da poter capire come funzionano le tue soluzioni.”

E, ha aggiunto, a volte mantenere le cose semplici e senza complicazioni è il modo migliore per fare scienza dei dati. “La soluzione semplice a volte funziona meglio”, ha detto. “Preferirei assumere qualcuno con buone capacità di base, quindi avere qualcuno che parli sempre di quelle abilità avanzate ma non sappia davvero di cosa stia parlando.” 

3. L’intenso problem solving tecnico è l’unico modo per comunicare.
 
La scienza dei dati non riguarda solo le competenze tecniche, ha ribadito Liu. Spesso si tratta di competenze trasversali come l’empatia e la comprensione.

“Oltre a esaminare e comprendere veramente i dati e costruire modelli, parliamo anche con i product manager del settore”, ha affermato Liu. “Devi provare empatia per i tuoi stakeholder perché alla fine la tua scienza dei dati o le tue intuizioni stanno cambiando il comportamento delle persone o cambiando gli aspetti aziendali. Devi educare le persone e spiegare le cose.

Come saranno i lavori di data science nel 2023? 
Con le incertezze su una recessione imminente e più licenziamenti, ci sono molte domande sul futuro della professione di data science. Ma Liu afferma che ci sono abilità tecniche e tratti personali fondamentali che rimarranno saldi anche in tempi turbolenti. 

 
Questi includono un focus sulla fornitura di ROI per risolvere i problemi aziendali; la capacità di interpretare i modelli e le loro conclusioni in modo chiaro per le parti interessate; e dare priorità all’empatia per gli utenti finali durante la risoluzione dei problemi. 

“Devi pensare come un imprenditore, anche per l’apprendimento automatico”, ha affermato Liu. “Potresti avere molte competenze molto tecniche [e] comprendere i modelli, ma devi anche solo pensare perché vuoi risolvere un problema aziendale”. 

Si aspetta anche che la diversità di genere e razza continui ad aumentare sul campo e afferma di aver già notato che sta accadendo. 

Anche se le statistiche possono essere scoraggianti – il rapporto di Anaconda rileva che nel 2022 la professione di data science è ancora per il 76% maschile, il 23% femminile e il 2% non binario – Liu sa che questo cambierà.

“Non aspettare [per vedere più] persone che ti assomigliano per fare ciò che deve essere fatto”, ha detto. “Forse non vedi molte persone che ti somigliano, ma forse questa è una motivazione in più per diventarne uno e poi essere la rappresentazione, così altre persone possono vederti e sentirsi ispirate.”

Il più grande consiglio di Liu non ha davvero nulla a che fare con la scienza dei dati: “Trova un equilibrio tra trovare valore per il business e anche avere una vita soddisfatta ed equilibrata per te stesso”.

Di ihal