I ricercatori del MIT sviluppano un’unica rete neurale profonda per veicoli autonomi
Il rapido sviluppo della tecnologia dei sensori e dell’elaborazione del software ha consentito l’autonomia dei camion, migliorando le operazioni della flotta diminuendo i tempi di fermo, riducendo i costi del personale, gli incidenti e le vittime. Secondo Fortune Business Insights , il mercato globale dei veicoli autonomi dovrebbe raggiungere 2.013,34 milioni di dollari, crescendo a un CAGR del 12,6% entro il 2027.
Basandosi su questo business in forte espansione, NVIDIA ha creato soluzioni end-to-end per veicoli autonomi definiti da software (AV) per il settore dei trasporti, consentendo il miglioramento e l’implementazione continui tramite aggiornamenti via etere. Inoltre, fornisce tutto il necessario per sviluppare AV su larga scala.
Migliorando la tecnologia di NVIDIA, i ricercatori del MIT hanno recentemente sviluppato una singola rete neurale profonda (DNN) per veicoli a motore autonomo. Hanno utilizzato NVIDIA DRIVE AGX Pegasus per aiutare a gestire la rete del veicolo, che ha aiutato a elaborare grandi quantità di dati LiDAR in tempo reale.
Di solito, un sensore AV genera fino a 1,6 petabyte di dati del sensore da una flotta di 50 veicoli in sole sei ore. Per una navigazione sicura, le auto a guida autonoma devono interpretare questi dati in tempo reale. Tuttavia, a causa della difficoltà di elaborare questo enorme volume di dati utilizzando un singolo DNN, la maggior parte delle tecniche impiega diverse reti e mappe ad alta definizione. Questa combinazione consente a un AV di determinare rapidamente la sua posizione nello spazio e riconoscere altri utenti della strada e segnali stradali. Sebbene questa strategia garantisca la ridondanza e la diversità necessarie per una guida autonoma sicura, è difficile da implementare in luoghi non mappati. Inoltre, i sistemi AV che si basano sul rilevamento lidar devono elaborare oltre due milioni di punti nel loro ambiente ogni secondo. A differenza dei dati di immagine bidimensionali, i punti lidar sono estremamente sparsi in tre dimensioni,
Efficienza tramite singolo DNN
Nel loro articolo , pubblicato su COMPUTEX , il team del MIT ha descritto come sta perseguendo una nuova tecnica di guida autonoma utilizzando un singolo DNN, iniziando con il compito di elaborare i dati del sensore lidar in tempo reale. Oltre alle architetture fondamentali, i ricercatori hanno creato nuovi miglioramenti per aumentare notevolmente la velocità e l’efficienza energetica. Il DNN ha lo scopo di eseguire tutte le operazioni del sistema di guida autonoma. Questa capacità completa viene fornita attraverso un’ampia formazione su enormi quantità di dati sulla guida umana che insegna alla rete ad affrontare la guida in modo olistico, come farebbe un guidatore umano, piuttosto che suddividerla in funzioni specifiche.
Sebbene l’approccio sia ancora agli inizi, ha il potenziale per produrre notevoli vantaggi. Un singolo DNN è significativamente più efficiente di numerose reti dedicate nel veicolo, liberando spazio di elaborazione per funzionalità aggiuntive. Inoltre, è più adattabile, poiché il DNN percorre strade sconosciute usando il suo addestramento piuttosto che una mappa. Infine, il guadagno di efficienza consente l’elaborazione in tempo reale di grandi quantità di dati percettivi ricchi.
Prestazioni migliorate con NVIDIA DRIVE
I ricercatori del MIT hanno utilizzato NVIDIA DRIVE AGX Pegasus per aumentare le prestazioni di elaborazione e ottenere la piena automazione. Il supercomputer integrato con intelligenza artificiale è costruito per sistemi autonomi di livello 4 e livello 5 per evitare il coinvolgimento umano. Un totale di 320 trilioni di operazioni al secondo si ottengono accoppiando due SoC Xavier e due GPU Turing, consentendo un’elaborazione rapida dei dati LiDAR. Per creare il DNN, i ricercatori del MIT hanno iniziato a lavorare su una macchina che non era solo potente, ma utilizzata anche in molti altri sistemi AV. Innanzitutto, durante l’analisi dei modelli solo LiDAR, il team di ricerca ha esaminato come si sono comportati nel test lane-stable. Quindi, nell’analisi dei modelli abilitati alla navigazione, il team di ricerca ha confrontato le prestazioni complessive dei modelli.
Inoltre, quando i ricercatori hanno permesso la fusione probatoria, i risultati del modello erano alla pari con i test solo LiDAR. Ha seguito le indicazioni della mappa e ha allineato la sua traiettoria a quella di un guidatore umano. Nel loro articolo i ricercatori hanno proposto un quadro di navigazione end-to-end efficiente e resiliente basato su LiDAR . Per ottenere un’elaborazione LiDAR più rapida, hanno costruito una nuova architettura neurale 3D e migliorato il kernel a convoluzione sparsa.
Non molto tempo fa, NuPort Robotics , una startup di autotrasporti a guida autonoma, ha utilizzato NVIDIA DRIVE per creare sistemi di guida autonoma per percorsi a corto raggio di medio miglio. La sua attività, con sede in Canada, collabora con il governo dell’Ontario e Canadian Tire su un progetto di prova di due anni per accelerare la commercializzazione della tecnologia NVIDIA DRIVE. Sarà interessante vedere come le startup e NVIDIA si uniranno per sviluppare e implementare i risultati di questa nuova singola ricerca DNN del MIT.