La tecnologia aiuta le auto a guida autonoma a imparare dai propri ricordi
ITHACA, NY – I ricercatori della Cornell University hanno sviluppato un modo per aiutare i veicoli autonomi a creare “ricordi” di esperienze precedenti e utilizzarli nella navigazione futura, specialmente in condizioni meteorologiche avverse quando l’auto non può fare affidamento in sicurezza sui suoi sensori.
Le auto che utilizzano reti neurali artificiali non hanno memoria del passato e sono in uno stato costante di vedere il mondo per la prima volta, non importa quante volte abbiano percorso una determinata strada prima.
I ricercatori hanno prodotto tre documenti simultanei con l’obiettivo di superare questa limitazione. Due saranno presentati agli Atti della IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2022), che si terrà dal 19 al 24 giugno a New Orleans.
“La domanda fondamentale è: possiamo imparare da ripetuti attraversamenti?” ha detto l’autore senior Kilian Weinberger , professore di informatica. “Ad esempio, un’auto può scambiare un albero dalla forma strana per un pedone la prima volta che il suo scanner laser lo percepisce da lontano, ma una volta che è abbastanza vicino, la categoria dell’oggetto diventerà chiara. Quindi, la seconda volta che guidi oltre lo stesso albero, anche nella nebbia o nella neve, speri che l’auto ora abbia imparato a riconoscerlo correttamente”.
Guidato dal dottorando Carlos Diaz-Ruiz, il gruppo ha compilato un set di dati guidando un’auto dotata di sensori LiDAR (Light Detection and Ranging) ripetutamente lungo un circuito di 15 chilometri dentro e intorno a Itaca, 40 volte in un periodo di 18 mesi. Le traversate catturano ambienti diversi (autostrada, città, campus), condizioni meteorologiche (soleggiato, piovoso, nevoso) e ore del giorno. Questo set di dati risultante ha più di 600.000 scene.
“Espone deliberatamente una delle sfide chiave nelle auto a guida autonoma: le cattive condizioni meteorologiche”, ha affermato Diaz-Ruiz. “Se la strada è coperta dalla neve, gli esseri umani possono fare affidamento sui ricordi, ma senza i ricordi una rete neurale è fortemente svantaggiata”.
HINDSIGHT è un approccio che utilizza le reti neurali per calcolare descrittori di oggetti mentre l’auto li supera. Quindi comprime queste descrizioni, che il gruppo ha soprannominato caratteristiche SQuaSH (Spatial-Quantized Sparse History), e le memorizza su una mappa virtuale, come una “memoria” immagazzinata in un cervello umano.
La prossima volta che l’auto a guida autonoma attraversa la stessa posizione, può interrogare il database SQuaSH locale di ogni punto LiDAR lungo il percorso e “ricordare” ciò che ha appreso l’ultima volta. Il database viene continuamente aggiornato e condiviso tra i veicoli, arricchendo così le informazioni disponibili per eseguire il riconoscimento.
“Queste informazioni possono essere aggiunte come funzionalità a qualsiasi rilevatore di oggetti 3D basato su LiDAR;” ha detto il dottorando Yurong You. “Sia il rilevatore che la rappresentazione SQuaSH possono essere addestrati congiuntamente senza alcuna supervisione aggiuntiva o annotazione umana, che richiede tempo e lavoro”.
HINDSIGHT è un precursore di una ricerca aggiuntiva che il team sta conducendo, MODEST (Mobile Object Detection with Ephemerality and Self-Training), che andrebbe ancora oltre, consentendo all’auto di apprendere da zero l’intera pipeline di percezione.
Mentre HIDSIGHT presume ancora che la rete neurale artificiale sia già addestrata per rilevare oggetti e la aumenti con la capacità di creare ricordi, MODEST presume che la rete neurale artificiale nel veicolo non sia mai stata esposta a nessun oggetto o strada. Attraverso più attraversamenti dello stesso percorso, può apprendere quali parti dell’ambiente sono fisse e quali oggetti in movimento. Lentamente si impara cosa costituisce gli altri partecipanti al traffico e cosa è sicuro ignorare.
L’algoritmo può quindi rilevare questi oggetti in modo affidabile, anche su strade che non facevano parte degli attraversamenti ripetuti iniziali.
I ricercatori sperano che gli approcci possano ridurre drasticamente i costi di sviluppo dei veicoli autonomi (che attualmente fanno ancora molto affidamento su costosi dati annotati dall’uomo) e rendere tali veicoli più efficienti imparando a navigare nei luoghi in cui vengono utilizzati di più.