Wayve e Microsoft collaborano per scalare i veicoli autonomi
Intorno al 2017, c’era molto clamore sulla guida autonoma . Se uno dovesse prenderlo alla lettera, significherebbe che ormai la guida autonoma sarebbe già stata una realtà. Apparentemente, non è così e Alex Kendall afferma di averlo sempre saputo. Tuttavia, questo non gli ha impedito di partire allora e ci sta ancora lavorando oggi.
Kendall è il cofondatore e CEO di Wayve , una società fondata nel 2017 per affrontare la sfida della guida autonoma basata su un approccio di deep learning. Oggi, Wayve ha annunciato una partnership con Microsoft per sfruttare l’infrastruttura di supercomputing necessaria per supportare lo sviluppo di modelli basati sull’intelligenza artificiale per veicoli autonomi su scala globale.
Veicoli autonomi 2.0
Wayve è stata fondata a seguito di una ricerca di livello mondiale sull’apprendimento profondo dell’Università di Cambridge, costruendo il loro primo robot in un garage di un ufficio. Lo stesso Kendall ha una formazione in AI, con un dottorato di ricerca. nell’apprendimento profondo.
Kendall si descrive come appassionato di costruzione di macchine intelligenti che possono davvero aggiungere molto valore alle nostre vite. Per lui, ha aggiunto, ciò implica la costruzione dell’intelligenza incarnata. Non è proprio così che la maggior parte delle persone pensa ai veicoli autonomi. Kendall ha qualificato la sua dichiarazione come segue:
“Co-progettazione dell’hardware e del software per costruire sistemi che hanno la capacità di ragionare in ambienti complessi, e penso che non ci sia posto migliore per iniziare che la guida autonoma. La guida autonoma sarà il primo esempio diffuso di macchine intelligenti che trasformano davvero le città in cui viviamo”, ha affermato.
Questo serve come una delicata introduzione all’approccio di Wayve, che l’azienda chiama AV2.0 (Autonomous Vehicles 2.0) in contrapposizione ad AV1.0, il termine che Wayve usa per riferirsi ai “classici guidatori autonomi”.
Come sostenuto dal team di Wayve in una pubblicazione Arxiv , gli AV oggi sono progettati attorno alla stessa architettura di robotica deliberativa, che è un’espansione del paradigma senso-piano-atto. Il problema è suddiviso in alcune aree chiave: rilevamento, rappresentazione della scena, pianificazione e controllo.
Il team di Wayve ritiene che la maggior parte di questi sia sufficientemente matura per guidare in base al successo dei rispettivi benchmark. Sebbene si possano ottenere ulteriori guadagni, nessuna di queste aree offrirà un cambio di passo per sbloccare la guida scalabile. Ciò che è necessario per raggiungere un futuro autonomo secondo Wayve è la scomposizione: risolvere la guida con i dati.
Il team ha tratto ispirazione da esempi come l’elaborazione del linguaggio naturale con GPT-3 e giochi con MuZero e AlphaStar. In questi esempi, la soluzione al compito era così sufficientemente complessa che i livelli e le caratteristiche di astrazione realizzati a mano non erano in grado di modellare adeguatamente il problema. La guida è altrettanto complessa, quindi perché Wayve sostiene che richiede una soluzione simile.
La soluzione che Wayve sta perseguendo è un driver appreso in modo olistico. In altre parole, un approccio end-to-end basato sul deep learning alla guida autonoma. Quando gli è stato chiesto di fare un confronto punto a punto tra le architetture AV2.0 e AV1.0, Kendall ha risposto che AV2.0 ha un solo componente, e quindi un confronto non è plausibile.
Guida autonoma: cosa è possibile in cinque anni
Va tutto bene, ma come funziona nel mondo reale e dove entra in gioco Microsoft? Secondo Kendall, nel 2017 ha potuto vedere che questa era la strada da percorrere, anche se sapeva che non erano ancora arrivati. Avanti veloce al 2022 e la configurazione è ora lì perché tutto vada a posto.
“Devi costruire per ciò che è possibile in cinque anni, per ciò che è possibile in futuro per essere in grado di essere davvero un pioniere”, ha affermato Kendall.
Wayve ha raccolto una serie B di $ 200 milioni sostenuta da un importante gruppo di investitori finanziari e strategici globali, tra cui Microsoft, nel gennaio 2022. Ciò ha portato il finanziamento totale dell’azienda a $ 260 milioni. La società ha sede a Londra, con un piccolo ufficio anche nella Bay Area di San Francisco. Il team di Wayve comprende attualmente poco più di 150 persone.
L’apprendimento automatico su larga scala è per il 90% una sfida ingegneristica e per il 10% armeggiare con algoritmi, ha aggiunto Kendall. Oltre a svolgere ricerche interne, molte delle quali pubblicate nelle migliori sedi scientifiche, gran parte dello sforzo va in cose come benchmark, infrastruttura di dati, sistemi di visualizzazione, simulazioni e calcolo.
Quando si tratta di dati, Wayve si concentra sullo sfruttamento dei video raccolti tramite telecamere in tempo reale, con i dati radar che svolgono un ruolo complementare. Per addestrare i suoi modelli di deep learning, Wayve raccoglie più di un terabyte di dati al minuto, ha affermato Kendall. L’azienda collabora con Microsoft e il suo cloud Azure dal 2020.
Da allora, il team ha assistito a un’accelerazione assoluta delle prestazioni su una scala di formazione più elevata, ha affermato Kendall: più dati, più calcolo, più parametri nei modelli di apprendimento automatico. Questo, ha aggiunto, sta davvero iniziando a spingere i confini di ciò che è possibile per qualsiasi offerta di cloud commerciale oggi.
“Se si pensa a molte delle tecnologie di supercalcolo sviluppate oggi, molte riguardano testo su larga scala o elaborazione del linguaggio naturale. Ma passare da kilobyte di dati di testo a petabyte o exabyte di dati video è davvero ciò che è necessario per far funzionare la robotica mobile o la guida autonoma su larga scala con l’apprendimento automatico”, ha spiegato Kendall. “questo è ciò che Wayve e Microsoft si prefiggono di costruire.”
La partnership tra le due società va oltre lo scenario tipico in cui i fornitori di applicazioni commerciali collaborano con i fornitori di cloud, secondo Kendall. In tale scenario, i fornitori di servizi cloud di solito forniscono ai partner l’accesso gratuito o scontato alla propria infrastruttura. Quello che accadrà qui, ha detto Kendall, è che Wayve lavorerà con Microsoft per spingere i confini di ciò che è possibile in Azure.
Sembra un vantaggio per tutti, poiché Wayve aiuterà a sviluppare l’infrastruttura di cui ha bisogno e Microsoft lavorerà a stretto contatto su un caso d’uso che aiuta a testare e portare avanti Azure. Ciò si adatta bene alla strategia di Microsoft di coprire le sue scommesse quando si tratta di veicoli autonomi e anche altre applicazioni di fascia alta potrebbero trarne vantaggio.
Colpire la strada
Per quanto riguarda la distribuzione nel mondo reale, Wayve ha un piano e alcuni successi da dimostrare. Il piano si concentra sulle flotte commerciali. Come ha spiegato Kendall, le flotte commerciali hanno una copertura estremamente ampia del mondo. Wayve ha in essere partnership con il Gruppo Ocado , Asda e DPD , tre delle più grandi flotte commerciali del Regno Unito.
Attualmente, i partner di Wayve aiutano l’azienda ad accedere a grandi quantità di dati di formazione, tramite i dispositivi di raccolta dati di cui sono dotate le flotte a guida manuale. Wayve sfrutta anche i dati sintetici prodotti internamente per essere in grado di gestire meglio i casi limite, situazioni non facilmente riscontrabili in natura.
In futuro, le flotte dei partner saranno le prime su cui verrà implementata commercialmente la tecnologia AV di Wayve. Ciò consente a ogni partner di concentrarsi su ciò che sa fare bene, ha detto Kendall. Rispecchia anche il modo in cui vengono introdotte le innovazioni tecnologiche: prima implementate su scala aziendale, poi arrivate ai consumatori.
L’ambizioso obiettivo di Wayve è di essere il primo a portare AV in 100 città. Di recente, un primo passo verso tale obiettivo è stato compiuto dall’azienda. Wayve ha deciso di testare se il loro modello AV2.0 addestrato a Londra potesse generalizzare la sua intelligence di guida alle nuove città, senza una precedente raccolta di dati per influenzare le prestazioni del modello nelle nuove città.
Il modello è stato testato in cinque città del Regno Unito (Cambridge, Coventry, Leeds, Liverpool e Manchester) per un periodo di tre settimane nel settembre 2021. L’azienda afferma che il suo sistema di guida autonoma ha percorso oltre 610 km in città mai viste prima senza alcuna città precedente. -adattamenti specifici, dimostrando tutte le abilità apprese a Londra.
Prevedibilità, interpretabilità e fiducia
La generalizzazione è una delle grandi sfide dell’apprendimento profondo in generale e una che Wayve ha identificato tra le sette grandi sfide anche per la guida appresa. Gli altri sei riguardano l’adattabilità dei veicoli, la modellazione della complessità del mondo reale, l’apprendimento da dati accessibili al di fuori delle politiche, la sicurezza nell’incertezza, l’interpretazione dei guasti e i premi di guida.
Anche se nessuno di questi è una piccola impresa, secondo Kendall tutto si riduce a prestazioni e prevedibilità.
“Dobbiamo costruire macchine intelligenti che siano prima di tutto performanti, sicure, che forniscano valore, che forniscano un impatto nelle nostre vite. Macchine che sono prevedibili, non fanno cose irregolari, sono accurate con ciò che possono e non possono fare e soddisfano o superano le aspettative. Questo è davvero ciò a cui dobbiamo pensare “, ha detto Kendall. “L’interpretazione [ad esempio] è davvero importante da una prospettiva di sviluppo, da una prospettiva di convalida, da questo tipo di prospettive. Non credo che sia strettamente necessario risolvere la causalità e il ragionamento causale nel deep learning per portare questa tecnologia sul mercato”.
Ha continuato spiegando che il ragionamento causale non è qualcosa che il cervello umano né l’AV1.0 possono fornire.
“Penso che la cosa fondamentale di cui abbiamo bisogno sia un sistema, mentre i team di ingegneri, noi, possiamo capire e valutare i guasti e infine migliorare il sistema in modo da non commettere lo stesso errore due volte. Questo è incredibilmente importante. Ma la ricerca mostra che non è strettamente importante per creare fiducia. Se pensi che se oggi vai su un aereo, in una compagnia aerea, non ottieni una comprensione interpretabile di come funziona l’aereo, ma ti fidi perché è performante e prevedibile. E principalmente, queste sono le cose di cui abbiamo bisogno per assicurarci di essere su larga scala per vedere questa tecnologia affidabile e adottata”, ha concluso.