Immagine AI

Google DeepMind ha annunciato una nuova versione del suo modello Gemini Robotics, progettata per eseguire compiti complessi direttamente sui robot, senza necessità di connessione a Internet. Questo modello, chiamato “Gemini Robotics On-Device”, rappresenta un passo significativo verso robot più autonomi, adattabili e sicuri, ideali per ambienti con scarsa connettività o elevati requisiti di privacy.

Basato sul modello Gemini Robotics presentato a marzo, Gemini Robotics On-Device è un modello “Vision-Language-Action” (VLA) ottimizzato per l’esecuzione locale. Ciò significa che i robot possono comprendere istruzioni in linguaggio naturale, elaborare informazioni visive e compiere azioni precise senza dover comunicare costantemente con server remoti. Questa autonomia consente loro di operare in modo più rapido e affidabile, riducendo la latenza e migliorando la sicurezza.

Il modello è stato progettato per essere efficiente anche su hardware con risorse limitate, come i robot a due bracci, e può adattarsi rapidamente a nuovi compiti con l’aggiunta di 50-100 esempi pratici. Ad esempio, è stato dimostrato che Gemini Robotics On-Device è in grado di svolgere attività come aprire una cerniera, piegare vestiti o assemblare componenti industriali, anche in scenari non previsti durante l’addestramento.

Una delle caratteristiche distintive di questo modello è la possibilità per gli sviluppatori di personalizzarlo facilmente per ambienti specifici, grazie a un kit di sviluppo software (SDK) dedicato. Questo SDK consente di testare e perfezionare il modello in simulazioni fisiche, accelerando l’adozione e l’innovazione nel campo della robotica.

Gemini Robotics On-Device è stato inizialmente addestrato sul robot ALOHA di Google, ma è stato successivamente adattato con successo ad altre piattaforme, come il robot umanoide Apollo di Apptronik e il robot a doppio braccio Franka FR3. Questa versatilità dimostra la capacità del modello di generalizzare le sue competenze a diverse configurazioni robotiche.

Per garantire un’implementazione sicura, Google ha sviluppato un approccio multilivello che include controlli di sicurezza fisica e semantica. Tuttavia, l’azienda sottolinea che, rispetto alla versione ibrida basata su cloud, Gemini Robotics On-Device non include funzionalità di ragionamento semantico avanzato, richiedendo agli sviluppatori di integrare autonomamente tali misure di sicurezza.

Questa iniziativa segna un importante passo avanti nella realizzazione di robot intelligenti e autonomi, capaci di interagire con l’ambiente e adattarsi a compiti complessi senza dipendere da connessioni esterne. Con Gemini Robotics On-Device, Google DeepMind offre una soluzione potente e flessibile per il futuro della robotica.

Di Fantasy