L’Intelligenza Artificiale Generativa ha avuto un impatto rivoluzionario in diversi ambiti, ma come ha influenzato l’ingegneria dei dati?
Prasenjit Ghosh, vicepresidente di Genpact, ha sottolineato il ruolo fondamentale dell’ingegneria dei dati nella trasformazione aziendale attraverso l’efficace utilizzo delle risorse di dati. Ghosh ha discusso di ciò al Data Engineering Summit 2024, sottolineando che l’ingegneria dei dati è spesso sottovalutata nonostante svolga un ruolo cruciale.
Durante la sua presentazione, Ghosh ha delineato le tre fasi principali del ciclo di vita dell’ingegneria dei dati: l’input dei dati, l’elaborazione dei dati e l’output dei dati. Ha evidenziato le sfide che sorgono in queste fasi, come la gestione delle relazioni tra i dati e la codifica dei dati.
Secondo Ghosh, i Modelli Linguistici di Grandi Dimensioni (LLM) stanno diventando strumenti essenziali per gli ingegneri dei dati nel superare tali sfide. Grazie a questi modelli, i data engineer di Genpact stanno automatizzando e migliorando varie attività, portando a una maggiore efficienza e innovazione.
Un’applicazione chiave della GenAI nell’ingegneria dei dati è la trasformazione di dati non strutturati in dati strutturati. Gli LLM possono analizzare autonomamente dati non strutturati come documenti di testo e immagini, organizzandoli efficacemente per facilitare l’analisi.
Inoltre, Ghosh ha sottolineato che la GenAI avrà un impatto trasformativo man mano che la tecnologia maturerà. Ha espresso fiducia nel rapido sviluppo della GenAI, citando una discussione avuta con Vishal Sikka, ex CEO di Infosys, che ha contribuito a finanziare OpenAI.