Gemini Robotics è un modello che integra visione, linguaggio e azione, consentendo ai robot di comprendere nuove situazioni e di eseguire azioni fisiche senza necessità di addestramento specifico per ogni compito. Questo modello permette ai robot di affrontare attività che richiedono finezza motoria e manipolazione precisa, come piegare la carta o svitare tappi di bottiglia.
Gemini Robotics-ER è stato sviluppato per offrire una comprensione spaziale avanzata, permettendo ai robot di eseguire compiti complessi come afferrare oggetti in modo sicuro e pianificare traiettorie appropriate. Questo modello migliora le capacità di rilevamento 2D e 3D degli oggetti e consente ai robot di adattarsi a diverse forme e dimensioni, rendendoli più versatili nell’affrontare una vasta gamma di applicazioni nel mondo reale.
Google DeepMind ha avviato una collaborazione con Apptronik, azienda statunitense specializzata in robotica, per sviluppare la prossima generazione di robot umanoidi utilizzando questi modelli. Inoltre, Gemini Robotics-ER è stato reso disponibile a tester selezionati, tra cui Agile Robots, Agility Robotics, Boston Dynamics ed Enchanted Tools, con l’obiettivo di esplorare ulteriormente le capacità dei modelli e sviluppare robot più intelligenti, reattivi e robusti, adattabili a diversi ambienti e applicazioni.
Consapevole delle potenziali implicazioni dell’integrazione dell’AI nella robotica, Google DeepMind ha adottato un approccio olistico alla sicurezza, collaborando con esperti, responsabili politici e il proprio Consiglio per la Responsabilità e la Sicurezza. Questo impegno mira a garantire che lo sviluppo e l’implementazione dei modelli Gemini Robotics avvengano in modo sicuro e allineato ai valori umani, affrontando le preoccupazioni riguardanti i rischi e la sicurezza dei robot alimentati dall’AI.