Astronomer, la società dietro la piattaforma di orchestrazione dei dati basata su Apache Airflow chiamata Astro, ha recentemente ottenuto 93 milioni di dollari in un round di finanziamento di Serie D. Questo investimento sottolinea una realtà emergente nel panorama tecnologico: l’orchestrazione dei dati è diventata un elemento cruciale per il successo delle iniziative di intelligenza artificiale (AI) nelle imprese moderne.
Con l’aumento delle applicazioni AI nelle aziende, è emerso un “gap di implementazione dell’AI”, un divario tecnico e organizzativo che ostacola la diffusione su larga scala dell’intelligenza artificiale. L’orchestrazione dei dati, ovvero il processo di automazione e coordinamento dei flussi di lavoro complessi attraverso sistemi eterogenei, è diventata essenziale per superare questo ostacolo. Secondo Enrique Salem di Bain Capital Ventures, le aziende operano in ecosistemi di dati frammentati, utilizzando una combinazione di strumenti e flussi di lavoro che spesso creano colli di bottiglia operativi e limitano l’agilità. L’orchestrazione funge da strato che coordina tutti questi elementi, garantendo flussi di dati affidabili e tempestivi.
La piattaforma Astro di Astronomer, costruita su Apache Airflow, ha visto una crescita significativa. Secondo il report “State of Airflow 2025”, Airflow è stato scaricato oltre 324 milioni di volte nel 2024, più di quanto avvenuto in tutti gli anni precedenti combinati. Questo evidenzia come Airflow sia diventato lo standard de facto per l’orchestrazione dei flussi di dati moderni.
La piattaforma Astro ha registrato una crescita del 150% delle entrate annuali ricorrenti e una retention netta del 130%, indicando una forte espansione tra i clienti. Inoltre, oltre il 69% dei clienti che utilizzano Astro da più di due anni impiega Airflow per applicazioni di AI e machine learning, suggerendo che il servizio gestito di Astronomer accelera l’adozione dell’AI nelle imprese.
Un esempio concreto dell’efficacia della piattaforma Astro è rappresentato da Ford Motor Company. Ford elabora oltre un petabyte di dati settimanali e gestisce più di 300 flussi di lavoro paralleli, bilanciando compiti intensivi di CPU e GPU per lo sviluppo di modelli AI. Questi flussi alimentano sistemi avanzati come l’Advanced Driver Assistance Systems (ADAS) e la piattaforma FordLLM per modelli linguistici di grandi dimensioni. Inizialmente, Ford aveva costruito la propria piattaforma MLOps utilizzando Kubeflow, ma ha incontrato sfide significative, tra cui una curva di apprendimento ripida e una stretta integrazione con Google Cloud, che limitava la flessibilità. Dopo aver migrato a Airflow per Mach1ML 2.0, Ford ha riportato flussi di lavoro notevolmente semplificati e un’integrazione fluida tra ambienti on-premises, cloud e ibridi.
Astronomer sta evolvendo oltre l’orchestrazione dei dati, mirando a creare un “DataOps unificato”, un approccio completo che integra osservabilità, gestione della qualità e governance in un’unica piattaforma. Secondo Salem, l’investimento in Astronomer si basa sulla convinzione che Airflow sarebbe diventato lo standard per l’orchestrazione dei dati. Oggi, Airflow è utilizzato da oltre 80.000 aziende e guida 30 milioni di download al mese. Astronomer sta costruendo il piano di controllo aziendale sopra di esso, posizionandosi come leader nel mercato dell’infrastruttura dei dati per l’AI.