Waymo, la divisione di veicoli autonomi di Alphabet, sta sviluppando un nuovo modello di addestramento per i suoi robotaxi, denominato EMMA (End-to-End Multimodal Model), basato sul Large Multimodal Model (LMM) ‘Gemini’ di Google. Questo modello è progettato per elaborare dati provenienti da vari sensori e generare traiettorie di guida future, migliorando la capacità dei veicoli autonomi di pianificare percorsi e evitare ostacoli.
L’integrazione di LMM come ‘Gemini’ rappresenta una novità nel settore dei veicoli autonomi, tradizionalmente basato su moduli separati per compiti specifici come percezione, mappatura, previsione e pianificazione. Questo approccio modulare può portare a errori accumulati e difficoltà di integrazione. Al contrario, l’utilizzo di un modello LMM offre una comprensione più completa e integrata dell’ambiente stradale, grazie alla sua formazione su vasti set di dati e alla capacità di ragionamento avanzato.
Waymo ha evidenziato che EMMA ha mostrato prestazioni superiori in compiti come la previsione dei percorsi, il rilevamento degli oggetti e la comprensione delle mappe stradali. Tuttavia, l’azienda riconosce che sono necessarie ulteriori ricerche per affrontare limitazioni attuali, come l’integrazione di dati da sensori 3D e la gestione di flussi video più estesi.
Questo sviluppo segna un passo significativo nell’evoluzione dei sistemi di guida autonoma, suggerendo che l’adozione di modelli LMM potrebbe migliorare la sicurezza e l’efficienza dei veicoli autonomi. Waymo continua a investire in ricerca e sviluppo per affrontare le sfide rimanenti e promuovere l’adozione di tecnologie di guida autonoma avanzate.