L’Innovazione nell’Autonomia dei Veicoli con LMM da Ghost
L’utilizzo dei modelli linguistici multimodali (LMM) sta emergendo come un’innovativa frontiera nel settore della guida autonoma. In particolare, si sta esplorando l’impiego di LMM, capaci di elaborare testi e immagini, per interpretare fotografie di strade catturate dalle telecamere dei veicoli, al fine di comprendere le condizioni del traffico e gestire la guida. Questo approccio rappresenta un significativo passo avanti rispetto ai metodi tradizionali.
Ghost Autonomy: Pionieri dell’Integrazione LMM nella Guida Autonoma
Ghost Autonomy, una startup nel campo della guida autonoma, si sta concentrando sull’integrazione degli LMM nella tecnologia di guida autonoma. La società, lanciata con un investimento di 5 milioni di dollari tramite il fondo di OpenAI, utilizza il sistema di OpenAI basato sul cloud di Azure di Microsoft. Versioni avanzate come “GPT-4V” e “GPT-4 Turbo”, dotate di funzionalità multimodali, sono in fase di sviluppo per migliorare il software di guida autonoma.
John Hayes, CEO di Ghost, evidenzia il valore degli LMM nel comprendere scenari complessi, superando i limiti dei modelli tradizionali. Secondo Hayes, gli LMM offrono prestazioni superiori e una maggiore velocità nell’elaborazione di scene complesse, un vantaggio cruciale per la guida autonoma.
La Sfida dei Dati a Coda Lunga
Un aspetto fondamentale nell’uso degli LMM nella guida autonoma è la loro capacità di gestire la “coda lunga” dei dati. Questo termine, derivato dalla statistica, si riferisce a eventi rari e imprevedibili, spesso non inclusi nei set di dati tradizionali utilizzati per addestrare i sistemi di IA. Gli attuali sistemi di IA, vulnerabili a questi dati, richiedono enormi quantità di informazioni per funzionare efficacemente.
Ghost sta sperimentando l’uso degli LMM per interpretare scene stradali complesse e generare comandi di guida, come “spostarsi sulla corsia di destra”, basandosi su immagini provenienti da telecamere montate sui veicoli.
Il Potenziale e i Limiti degli LMM nella Guida Autonoma
Nonostante l’entusiasmo, vi è scetticismo nella comunità accademica riguardo all’efficacia degli LMM nella guida autonoma. Esperti come Os Kayes dell’Università di Washington e Mike Cook del King’s College di Londra mettono in dubbio l’idoneità degli LMM per questa applicazione, sottolineando le loro limitazioni e la tendenza a commettere errori fondamentali.
Brad Lightcap, COO di OpenAI, rimane però ottimista sulle possibilità offerte dagli LMM, sottolineando la loro capacità di integrare e analizzare diversi tipi di dati. Anche Hayes riconosce che, nonostante il potenziale, gli attuali modelli LMM non sono ancora pronti per un impiego commerciale nei veicoli, richiedendo ulteriori sviluppi per garantire affidabilità e prestazioni.
In conclusione, mentre gli LMM rappresentano un’avanzata frontiera tecnologica, il loro percorso verso l’impiego effettivo nella guida autonoma rimane ancora in fase di esplorazione e sviluppo.