Sulla strada per una guida più pulita, più ecologica e più veloce
I ricercatori utilizzano l’intelligenza artificiale per aiutare i veicoli autonomi a evitare di rimanere al minimo al semaforo rosso.
A nessuno piace sedersi al semaforo rosso. Ma gli incroci segnalati non sono solo un piccolo fastidio per i conducenti; i veicoli consumano carburante ed emettono gas serra in attesa che la luce cambi.
E se gli automobilisti potessero programmare i loro viaggi in modo da arrivare all’incrocio quando il semaforo è verde? Anche se potrebbe essere solo una fortuna per un guidatore umano, potrebbe essere raggiunta in modo più coerente da un veicolo autonomo che utilizza l’intelligenza artificiale per controllare la sua velocità.
In un nuovo studio, i ricercatori del MIT dimostrano un approccio di apprendimento automatico in grado di imparare a controllare una flotta di veicoli autonomi mentre si avvicinano e viaggiano attraverso un incrocio segnalato in modo da mantenere il traffico fluido.
Utilizzando simulazioni, hanno scoperto che il loro approccio riduce il consumo di carburante e le emissioni migliorando al contempo la velocità media del veicolo. La tecnica ottiene i risultati migliori se tutte le auto su strada sono autonome, ma anche se solo il 25% utilizza il proprio algoritmo di controllo, porta comunque a sostanziali vantaggi in termini di carburante ed emissioni.
“Questo è un posto davvero interessante per intervenire. La vita di nessuno è migliore perché erano bloccati a un incrocio. Con molti altri interventi sui cambiamenti climatici, c’è una differenza nella qualità della vita prevista, quindi c’è una barriera all’ingresso lì. Qui, la barriera è molto più bassa”, afferma l’autrice senior Cathy Wu, assistente allo sviluppo professionale di Gilbert W. Winslow presso il Dipartimento di ingegneria civile e ambientale e membro dell’Istituto per i dati, i sistemi e la società (IDSS) e il Laboratorio per i Sistemi Informativi e Decisionali (LIDS).
L’autore principale dello studio è Vindula Jayawardana, una studentessa laureata in LIDS e del Dipartimento di Ingegneria Elettrica e Informatica. La ricerca sarà presentata alla Conferenza Europea di Controllo.
Complessità di intersezione
Mentre gli esseri umani possono superare un semaforo verde senza pensarci troppo, gli incroci possono presentare miliardi di scenari diversi a seconda del numero di corsie, di come funzionano i segnali, il numero di veicoli e la loro velocità, la presenza di pedoni e ciclisti, ecc.
Gli approcci tipici per affrontare i problemi di controllo delle intersezioni utilizzano modelli matematici per risolvere un’intersezione semplice e ideale. Sembra buono sulla carta, ma probabilmente non reggerà nel mondo reale, dove i modelli di traffico sono spesso disordinati come vengono.
Wu e Jayawardana hanno cambiato marcia e hanno affrontato il problema utilizzando una tecnica priva di modelli nota come apprendimento per rinforzo profondo. L’apprendimento per rinforzo è un metodo per tentativi ed errori in cui l’algoritmo di controllo impara a prendere una sequenza di decisioni. Viene premiato quando trova una buona sequenza. Con l’apprendimento per rinforzo profondo, l’algoritmo sfrutta le ipotesi apprese da una rete neurale per trovare scorciatoie a buone sequenze, anche se ci sono miliardi di possibilità.
Questo è utile per risolvere un problema di lungo orizzonte come questo; l’algoritmo di controllo deve emettere fino a 500 istruzioni di accelerazione a un veicolo per un periodo di tempo prolungato, spiega Wu.
“E dobbiamo ottenere la sequenza giusta prima di sapere che abbiamo fatto un buon lavoro di mitigazione delle emissioni e di raggiungere l’incrocio a una buona velocità”, aggiunge.
Ma c’è un’ulteriore ruga. I ricercatori vogliono che il sistema impari una strategia che riduca il consumo di carburante e limiti l’impatto sul tempo di viaggio. Questi obiettivi possono essere contrastanti.
“Per ridurre i tempi di viaggio, vogliamo che l’auto vada veloce, ma per ridurre le emissioni, vogliamo che l’auto rallenti o non si muova affatto. Quei premi in competizione possono creare molta confusione per l’agente di apprendimento”, afferma Wu.
Sebbene sia difficile risolvere questo problema nella sua piena generalità, i ricercatori hanno utilizzato una soluzione alternativa utilizzando una tecnica nota come modellatura della ricompensa. Con la modellatura della ricompensa, forniscono al sistema alcune conoscenze di dominio che non è in grado di apprendere da solo. In questo caso, penalizzavano il sistema ogni volta che il veicolo si fermava completamente, così imparava a evitare quell’azione.
Prove di traffico
Una volta sviluppato un efficace algoritmo di controllo, lo hanno valutato utilizzando una piattaforma di simulazione del traffico con un unico incrocio. L’algoritmo di controllo viene applicato a una flotta di veicoli autonomi connessi, in grado di comunicare con i semafori imminenti per ricevere informazioni sulla fase del segnale e sui tempi e osservare l’ambiente circostante. L’algoritmo di controllo indica a ciascun veicolo come accelerare e decelerare.
Il loro sistema non ha creato traffico stop-and-go mentre i veicoli si avvicinavano all’incrocio. (Il traffico stop-and-go si verifica quando le auto sono costrette a fermarsi completamente a causa dell’arresto del traffico davanti). Nelle simulazioni, più auto sono riuscite a superare un’unica fase verde, superando un modello che simula i conducenti umani. Rispetto ad altri metodi di ottimizzazione progettati anche per evitare il traffico stop-and-go, la loro tecnica ha portato a maggiori consumi di carburante e riduzioni delle emissioni. Se ogni veicolo su strada è autonomo, il loro sistema di controllo può ridurre il consumo di carburante del 18 percento e le emissioni di anidride carbonica del 25 percento, aumentando al contempo la velocità di marcia del 20 percento.
“Un singolo intervento con una riduzione del 20-25% del carburante o delle emissioni è davvero incredibile. Ma quello che trovo interessante, e speravo davvero di vedere, è questo ridimensionamento non lineare. Se controlliamo solo il 25 percento dei veicoli, ciò ci offre il 50 percento dei vantaggi in termini di riduzione del carburante e delle emissioni. Ciò significa che non dobbiamo aspettare di arrivare al 100% di veicoli autonomi per ottenere vantaggi da questo approccio”, afferma.
Lungo la strada, i ricercatori vogliono studiare gli effetti di interazione tra più incroci. Hanno anche in programma di esplorare in che modo le diverse configurazioni degli incroci (numero di corsie, segnali, orari, ecc.) Possono influenzare il tempo di viaggio, le emissioni e il consumo di carburante. Inoltre, intendono studiare in che modo il loro sistema di controllo potrebbe influire sulla sicurezza quando veicoli autonomi e conducenti umani condividono la strada. Ad esempio, anche se i veicoli autonomi possono guidare in modo diverso rispetto ai conducenti umani, strade più lente e strade con velocità più costanti potrebbero migliorare la sicurezza, afferma Wu.
Sebbene questo lavoro sia ancora nelle sue fasi iniziali, Wu vede questo approccio come uno che potrebbe essere implementato in modo più fattibile nel breve termine.
“L’obiettivo di questo lavoro è muovere l’ago nella mobilità sostenibile. Anche noi vogliamo sognare, ma questi sistemi sono grandi mostri di inerzia. Identificare i punti di intervento che sono piccole modifiche al sistema ma che hanno un impatto significativo è qualcosa che mi fa alzare la mattina”, dice.
Questo lavoro è stato supportato, in parte, dal MIT-IBM Watson AI Lab.