L’intelligenza artificiale prevede i punti critici degli incidenti dalle immagini satellitari e dai dati GPS
I ricercatori del MIT e del Qatar Center for Artificial Intelligence hanno sviluppato un sistema di apprendimento automatico che analizza immagini satellitari ad alta risoluzione, coordinate GPS e dati storici sugli incidenti al fine di mappare potenziali sezioni soggette a incidenti nelle reti stradali, prevedendo con successo i “punti caldi” degli incidenti dove nessun altro dato o metodo precedente li indicherebbe.
In mezzo a destra, i punti caldi degli incidenti predittivi emergono dalla raccolta di tre fonti di dati. Le aree evidenziate nei cerchi sono previsioni “ad alto rischio” che in realtà non hanno una storia storica di incidenti.
Il sistema offre previsioni audaci per le aree di una rete stradale che potrebbero diventare punti critici per gli incidenti, anche dove tali aree non hanno una storia di incidenti. Testando il sistema su dati che coprono quattro anni, i ricercatori hanno scoperto che le loro previsioni per queste potenziali zone a rischio di incidenti “senza storia” sono state confermate dagli eventi negli anni successivi.
Il nuovo documento si chiama Inferring mappe del rischio di incidenti stradali ad alta risoluzione basate su immagini satellitari e traiettorie GPS . Gli autori prevedono usi per la nuova architettura oltre la previsione degli incidenti, ipotizzando che potrebbe essere applicata alle mappe o ai sistemi di rischio di emergenza del 911 per prevedere la probabilità di domanda di taxi e fornitori di servizi di condivisione delle corse.
Sforzi simili precedenti hanno tentato di creare predittori di incidenti simili da mappe a bassa risoluzione con alta distorsione, oppure di sfruttare la frequenza degli incidenti come chiave, il che ha portato a previsioni imprecise e ad alta varianza. Invece, il nuovo progetto, che copre quattro grandi città degli Stati Uniti per un totale di 7.488 chilometri quadrati, supera questi schemi precedenti raccogliendo forme di dati più diverse.
Dati sparsi
Il problema che i ricercatori devono affrontare sono i dati sparsi: volumi molto elevati di incidenti saranno inevitabilmente notati e affrontati senza la necessità di analisi delle macchine, ma le correlazioni più sottilmente pericolose sono difficili da identificare.
I precedenti sistemi di previsione degli incidenti sono incentrati sulla stima Monte Carlo dei dati storici sugli incidenti e non possono fornire alcun meccanismo di previsione efficace laddove questi dati manchino. Pertanto la nuova ricerca studia sezioni di rete stradale con modelli di traffico simili, aspetto visivo simile e struttura simile, deducendo una disposizione agli incidenti basata su queste caratteristiche.
È un ‘colpo nel buio’ che sembra aver portato alla luce indicatori di incidenti fondamentali, che potrebbero essere utilizzati nella progettazione di nuove reti stradali.
La stima della densità del kernel ( KDE ) è stata utilizzata per evidenziare i punti caldi degli incidenti stradali storici, non riuscendo a prevedere le posizioni degli incidenti futuri. Nell’immagine in alto a sinistra vediamo dove KDE ha previsto incidenti nella regione del riquadro blu, rispetto a dove gli incidenti sono generalmente localizzati (adiacente). In basso a destra, un confronto tra la mancata previsione di KDE e la previsione accurata (riquadro blu) del sistema MIT.
Gli autori notano che i dati della traiettoria GPS offrono informazioni sul flusso, la velocità e la densità del traffico, mentre le immagini satellitari dell’area aggiungono informazioni sulla disposizione delle corsie e sul numero di corsie, nonché sull’esistenza di una corsia di emergenza e la presenza di pedoni.
L’autore Amin Sadeghi, del Qatar Computing Research Institute (QCRI), ha commentato: “Il nostro modello può essere generalizzato da una città all’altra combinando più indizi provenienti da fonti di dati apparentemente non correlate. Questo è un passo verso l’IA generale, perché il nostro modello è in grado di prevedere le mappe degli arresti anomali in territori inesplorati”. e ha continuato “Il modello può essere utilizzato per dedurre un’utile mappa degli incidenti anche in assenza di dati storici sugli incidenti, che potrebbero tradursi in un uso positivo per la pianificazione e la definizione delle politiche urbane confrontando scenari immaginari”.
L’architettura del sistema di previsione del traffico genera una mappa del rischio di incidenti con una risoluzione di 5 metri, che secondo gli autori è fondamentale per distinguere i diversi rischi tra l’autostrada e le strade residenziali adiacenti.
Il progetto è stato valutato su incidenti e dati laterali relativi a un periodo compreso tra il 2017-18. Sono state quindi fatte previsioni per il 2019 e il 2020, con l’emergere di diverse località “ad alto rischio” anche in assenza di dati storici che normalmente lo prevedessero.
Raggiungere una generalizzazione utile
Il sovradattamento è un rischio critico in un sistema alimentato da dati sparsi, anche dove, come in questo caso, esistono due ulteriori fonti di dati a supporto. Laddove un’incidenza è bassa, è possibile trarre presupposti eccessivi da un numero troppo limitato di esempi, portando a un algoritmo che si aspetta una fascia molto particolare e ristretta di possibili circostanze e che non riuscirà a identificare probabilità più ampie.
Pertanto, durante l’addestramento del modello, i ricercatori hanno “rimosso” casualmente ciascuna fonte di input con una probabilità del 20%, in modo che le aree con meno (o nessun) dati sugli incidenti possano essere considerate come il modello che si prepara alla generalizzazione e in modo che le fonti di dati parallele possano fungere da rappresentante rappresentativo delle informazioni mancanti per qualsiasi studio particolare di un incrocio o di un tratto di strada.
Valutazione
Il modello è stato testato su un set di dati che comprende quasi 7.500 km di area urbana a Boston, Los Angeles, Chicago e New York. Il set di dati è stato organizzato sotto forma di 1.872 tile di 2 km x 2 km, ciascuno contenente immagini satellitari di MapBox , con la segmentazione stradale mascherata tramite i dati di OpenStreetMap. Sia le immagini di base che le mappe di segmentazione hanno una risoluzione di 0,625 metri.
I dati GPS si presentano sotto forma di un set di dati proprietario raccolto tra il 2015-17 nelle quattro città, per un totale di 7,6 milioni di chilometri di traiettorie GPS con una frequenza di campionamento di 1 secondo.
Il progetto sfrutta anche 4,2 milioni di record relativi al periodo 2016-2020 nel dataset statunitense sugli incidenti . Ogni record include timestamp e altri metadati.
I primi due anni di dati storici sono stati inseriti nel modello e gli ultimi due anni sono stati utilizzati per la formazione e la valutazione, consentendo ai ricercatori di stabilire l’accuratezza del sistema su due anni in un breve lasso di tempo.
Il sistema è stato testato con e senza dati storici ed è stato scoperto che cattura con successo la distribuzione del rischio sottostante in tutti i casi, migliorando notevolmente i precedenti metodi basati su KDE (vedi sopra).
Strade in avanti
Gli autori sostengono che il loro sistema può essere applicato ad altri paesi con poche modifiche architettoniche, anche in luoghi in cui i dati sugli incidenti non sono disponibili. Inoltre, gli autori propongono la loro ricerca come possibile complemento alla progettazione urbanistica per nuovi sviluppi urbani.
L’autore principale Songtao He ha commentato il nuovo lavoro:
“Catturando la distribuzione del rischio sottostante che determina la probabilità di incidenti futuri in tutti i luoghi e senza dati storici, possiamo trovare percorsi più sicuri, consentire alle compagnie di assicurazione auto di fornire piani assicurativi personalizzati basati sulle traiettorie di guida dei clienti, aiutare gli urbanisti a progettare strade più sicure e persino prevedere incidenti futuri”.
Sebbene il documento indichi che il codice per il sistema è stato rilasciato su GitHub, il collegamento al codice non è attivo, non può essere attualmente trovato da una ricerca e presumibilmente sarà incluso in una revisione successiva.
Secondo Songtao He, la ricerca ha il potenziale per essere incorporata nelle popolari app per il traffico basate su GPS e pianificatori di percorsi di livello consumer:
“Se le persone possono utilizzare la mappa del rischio per identificare i segmenti stradali potenzialmente ad alto rischio, possono agire in anticipo per ridurre il rischio di viaggi che intraprendono. App come Waze e Apple Maps dispongono di strumenti per la funzionalità degli incidenti, ma stiamo cercando di anticipare gli arresti anomali, prima che si verifichino “