Immagine AI

Nel dibattito sulla guida autonoma, una delle domande più difficili da risolvere riguarda sempre la stessa tensione: come addestrare sistemi di intelligenza artificiale a gestire eventi rari, pericolosi o eccezionali quando, per loro natura, questi eventi accadono pochissime volte nel mondo reale. È proprio su questo punto che Waymo, la sussidiaria di Google specializzata nella guida autonoma, sta costruendo una parte decisiva del suo vantaggio competitivo, spostando il cuore dell’addestramento in un mondo virtuale sempre più realistico.

All’inizio di febbraio, Waymo ha presentato il cosiddetto Waymo World Model, un modello di intelligenza artificiale generativa di nuova generazione progettato per simulare la guida autonoma in modo iperrealistico. Alla base di questo sistema c’è Google DeepMind e, in particolare, il suo modello mondiale Genie 3, che funge da motore centrale della simulazione. L’idea è tanto ambiziosa quanto pragmatica: far “guidare” i veicoli autonomi per miliardi di chilometri virtuali prima che mettano realmente le ruote sull’asfalto, in modo da esporli a una varietà di situazioni che il mondo reale, da solo, non può offrire in tempi ragionevoli.

I numeri reali di Waymo sono già impressionanti. L’azienda dichiara circa 200 milioni di miglia di guida completamente autonoma effettuate in diverse grandi città degli Stati Uniti. Eppure, secondo la stessa Waymo, il vero punto di forza non è ciò che avviene sulle strade visibili, ma ciò che succede nel mondo virtuale, invisibile agli utenti. È lì che i “conducenti” artificiali imparano davvero, affrontando scenari estremi o rarissimi decine di volte superiori a quanto sarebbe possibile con la sola raccolta di dati reali.

A differenza dei simulatori tradizionali, spesso limitati a ricostruzioni grafiche o a regole predefinite, il Waymo World Model genera ambienti dinamici e coerenti nel tempo. Le simulazioni non producono soltanto video, ma combinano in modo sincronizzato immagini da telecamere virtuali e nuvole di punti Lidar, creando dati multisensore che si comportano come quelli raccolti dai veicoli reali. Questo permette al software di guida autonoma di addestrarsi e validarsi in condizioni praticamente indistinguibili dalla realtà, mantenendo la stessa struttura informativa che troverà poi su strada.

Il ruolo di Genie 3 è centrale in questo processo. Si tratta di un modello globale di uso generale, pre-addestrato su enormi quantità di dati visivi, capace di generare ambienti tridimensionali in tempo reale partendo anche da semplici descrizioni testuali. Waymo ha poi specializzato questo modello per il dominio della guida autonoma, riuscendo a trasformare informazioni bidimensionali derivate da immagini generiche in rappresentazioni Lidar tridimensionali. Il risultato è la capacità di creare scene estremamente complesse e credibili, come il Golden Gate Bridge sotto una bufera di neve, strade invase da incendi o allagamenti, tempeste improvvise e persino situazioni surreali come elefanti o grandi detriti che attraversano la carreggiata.

Un aspetto interessante è che queste scene non vengono costruite inserendo manualmente regole o casi limite. Nascono invece in modo naturale dalla comprensione spaziotemporale che il modello ha appreso dai dati. In pratica, il sistema non “recita” uno scenario, ma lo genera come conseguenza plausibile di ciò che conosce del mondo. Questo approccio consente a Waymo di testare in modo sistematico situazioni estreme che, nel mondo reale, sarebbero difficili, costose o addirittura pericolose da osservare direttamente.

La simulazione non è però solo realistica, ma anche altamente controllabile. Gli ingegneri possono modificare il comportamento di guida per esplorare scenari controfattuali, alterare la disposizione delle strade, la segnaletica o la posizione di veicoli e pedoni, e persino cambiare contesto geografico, condizioni meteo o periodo dell’anno tramite semplici istruzioni in linguaggio naturale. Questo livello di controllo rende il sistema uno strumento potentissimo non solo per l’addestramento, ma anche per la validazione e l’analisi degli errori.

Un altro elemento rilevante è la possibilità di usare video provenienti da fonti non specializzate, come smartphone o dashcam, per generare simulazioni multimodali utili alla guida autonoma. Questo significa che anche filmati raccolti in aree prive di infrastrutture Lidar, come regioni remote della Norvegia, parchi nazionali o zone desertiche, possono diventare materiale di addestramento. In prospettiva, ciò riduce drasticamente le barriere all’espansione geografica dei sistemi di guida autonoma.

Waymo ha anche affrontato uno dei problemi classici delle simulazioni avanzate: il costo computazionale. Le situazioni di guida complesse e prolungate, come vicoli stretti o quartieri residenziali molto affollati, richiedono molta potenza di calcolo per mantenere un alto livello di realismo. L’azienda sostiene di aver ottimizzato il modello per migliorare significativamente l’efficienza computazionale, rendendo possibili simulazioni di lunga durata a costi più contenuti.

Questo sviluppo tecnologico arriva però in un momento delicato. Waymo è sotto osservazione da parte delle autorità dei trasporti statunitensi per alcuni episodi legati alla sicurezza, come presunte violazioni delle fermate degli scuolabus o blocchi improvvisi dei veicoli agli incroci. L’azienda non ha specificato se questi casi siano stati replicati nel mondo virtuale, limitandosi a dichiarare che, in linea di principio, il suo sistema è in grado di simulare praticamente qualsiasi scenario.

Dal punto di vista industriale, la traiettoria di crescita resta comunque molto forte. Waymo ha recentemente raccolto nuovi investimenti per circa 16 miliardi di dollari, raggiungendo una valutazione di 126 miliardi, e prevede di superare i 15 milioni di corse annuali entro il 2025. È prevista inoltre l’espansione del servizio in mercati complessi come Tokyo e Londra, quest’ultima particolarmente significativa perché caratterizzata dalla guida a sinistra, un contesto per il quale i dati reali sono storicamente più scarsi per un’azienda nata negli Stati Uniti.

La corsa ai cosiddetti “modelli mondiali” non riguarda però solo Waymo. Attori come NVIDIA, Tesla e Wayve stanno investendo sempre più in dati sintetici e simulazioni come risorse strategiche. In questo contesto competitivo, Waymo continua a ribadire un punto chiave della sua filosofia: nessuna simulazione, per quanto sofisticata, può sostituire completamente la guida reale. Il futuro della guida autonoma, secondo l’azienda, passa dall’integrazione intelligente tra mondo virtuale e mondo fisico.

Di Fantasy