Nel vasto e complesso mondo dell’osservazione terrestre, la capacità di integrare e interpretare dati di natura diversa è fondamentale per affrontare sfide globali come la sicurezza alimentare, la gestione delle catastrofi naturali e la protezione ambientale. A tal proposito, la NASA Harvest e l’Allen Institute for Artificial Intelligence (Ai2) hanno recentemente rilasciato Galileo, un modello di intelligenza artificiale multimodale open source che promette di rivoluzionare l’analisi dei dati satellitari combinando informazioni eterogenee in modo completo e innovativo.
Tradizionalmente, i dati satellitari vengono raccolti in molteplici forme — immagini ottiche, dati radar, mappe di altitudine, parametri climatici, e persino dati socio-demografici come la densità di popolazione e la luce notturna — ma la maggior parte dei modelli informatici era in grado di gestire soltanto uno di questi tipi per volta. Galileo supera questo limite, offrendo un’architettura in grado di processare simultaneamente diversi flussi di dati, ottenendo così una visione integrata e più accurata delle dinamiche terrestri.
Questo approccio permette di riconoscere eventi e cambiamenti sia su larga scala, come ad esempio il ritiro pluriennale dei ghiacciai, sia fenomeni temporanei e su scala ridotta, come la rapida comparsa di pescherecci nelle acque oceaniche. In tal modo, Galileo fornisce un quadro olistico degli eventi sulla Terra, supportando decisioni informate in molteplici ambiti applicativi.
Il cuore innovativo di Galileo risiede nel suo algoritmo di apprendimento autosupervisionato. Questo sistema permette al modello di apprendere autonomamente dai dati senza richiedere un intervento umano diretto per la classificazione o la labelling. Attraverso un processo sofisticato che alterna due modalità di apprendimento — globale e locale — il modello assimila sia i cambiamenti a lungo termine che i segnali di breve durata.
L’apprendimento globale aiuta Galileo a comprendere processi che si sviluppano su estese aree geografiche e in lunghi periodi, come lo scioglimento dei ghiacciai o la desertificazione. L’apprendimento locale, invece, si concentra sull’identificazione di piccoli oggetti o eventi rapidamente mutevoli, consentendo di catturare, ad esempio, l’apparizione temporanea di una barca da pesca in una zona specifica.
Questa doppia modalità di apprendimento è potenziata da tecniche di mascheramento dei dati e da un’elaborazione stratificata che varia in profondità, affinché il modello sia in grado di adattarsi dinamicamente alle caratteristiche del dato in ingresso.
Galileo ha dimostrato performance eccellenti su 11 benchmark e 15 attività downstream, affermandosi su dataset riconosciuti come EuroSat, BigEarthNet, Sen1Floods11, CropHarvest e MADOS. Per esempio, ha raggiunto un’accuratezza del 97,7% nel compito di classificazione del dataset EuroSat, superando altri modelli all’avanguardia come CROMA e SatMAE.
Inoltre, la flessibilità di Galileo si riflette nelle sue versioni più leggere, come ViT-Nano e ViT-Tiny, che mantengono un’elevata efficacia anche in contesti con risorse computazionali limitate. Questo lo rende accessibile a un più ampio spettro di utilizzatori e applicazioni.
Le potenzialità del modello sono già impiegate in iniziative concrete come la mappatura globale delle colture da parte di NASA Harvest, la risposta rapida a disastri naturali (inondazioni, incendi) e il monitoraggio dell’inquinamento marino, confermando l’importanza strategica di un sistema AI così avanzato e integrato.
Consapevoli dell’importanza della collaborazione scientifica, gli sviluppatori hanno reso disponibile su GitHub non solo il codice sorgente di Galileo, ma anche i modelli preaddestrati e i dataset utilizzati. Questo gesto aperto vuole favorire la diffusione e l’ulteriore sviluppo del modello all’interno della comunità internazionale di osservazione della Terra, promuovendo innovazioni condivise e applicazioni sempre più efficaci.