Google BigQuery emerge come leader indiscusso, vantando una base clienti cinque volte superiore a quella dei suoi principali concorrenti, Snowflake e Databricks. Questa posizione di rilievo è il risultato di anni di innovazione e di un impegno costante nell’integrare l’intelligenza artificiale nei flussi di lavoro aziendali.
Lanciato nel 2011, BigQuery si è evoluto da semplice strumento di archiviazione a una piattaforma completa per l’analisi dei dati. Recentemente, Google ha introdotto il “BigQuery Unified Governance”, una soluzione che integra la governance dei dati direttamente nella piattaforma, superando la necessità di strumenti esterni. Questa innovazione affronta le sfide comuni nell’adozione dell’AI aziendale, come la qualità dei dati, la loro accessibilità e la fiducia nelle informazioni.
Il nuovo catalogo universale di BigQuery raccoglie tre tipi distinti di metadati:
- Metadati fisici/tecnici: definizioni di schema, tipi di dati e statistiche di profilazione.
- Metadati aziendali: termini del glossario aziendale, descrizioni e contesto semantico.
- Metadati di runtime: modelli di query, statistiche di utilizzo e informazioni specifiche per tecnologie come Apache Iceberg.
Questa integrazione consente a BigQuery di mantenere una comprensione completa degli asset di dati all’interno dell’azienda. Inoltre, l’integrazione del modello AI Gemini di Google nella governance tramite il “knowledge engine” migliora la scoperta delle relazioni tra i dataset, arricchendo i metadati con contesto aziendale e monitorando automaticamente la qualità dei dati.
Le aziende stanno già beneficiando di queste innovazioni. Ad esempio, Levi Strauss ha costruito una piattaforma dati su Google Cloud che organizza i prodotti dati per dominio aziendale, rendendoli scoperti tramite l’Analytics Hub di Google. Ogni prodotto dati è accompagnato da documentazione dettagliata, informazioni sulla provenienza e metriche di qualità. I risultati sono notevoli: “Siamo 50 volte più veloci rispetto alla nostra piattaforma dati precedente, e questo è il minimo. Un numero significativo di visualizzazioni è 100 volte più veloce”, ha dichiarato Vinay Narayana, responsabile dell’ingegneria della piattaforma dati e AI di Levi’s. “Abbiamo oltre 700 utenti che utilizzano la piattaforma quotidianamente”.