Impilare un oggetto sopra un altro oggetto è un compito semplice per la maggior parte delle persone. Ma anche i robot più complessi fanno fatica a gestire più di un compito di questo tipo alla volta. L’impilamento richiede una serie di diverse abilità motorie, percettive e analitiche, inclusa la capacità di interagire con diversi tipi di oggetti. Il livello di sofisticatezza coinvolto ha elevato questo semplice compito umano a una “grande sfida” nella robotica e ha generato un’industria artigianale dedicata allo sviluppo di nuove tecniche e approcci.
Un team di ricercatori di DeepMind ritiene che il progresso dello stato dell’arte nell’impilamento robotico richiederà un nuovo punto di riferimento. In un documento da presentare alla Conference on Robot Learning (CoRL 2021), introducono RGB-Stacking, che incarica un robot di imparare come afferrare oggetti diversi e bilanciarli uno sopra l’altro. Sebbene i benchmark per le attività di impilamento esistano già in letteratura, i ricercatori affermano che ciò che distingue la loro ricerca è la diversità degli oggetti utilizzati e le valutazioni eseguite per convalidare i loro risultati. I risultati dimostrano che una combinazione di simulazione e dati del mondo reale può essere utilizzata per apprendere la “manipolazione multi-oggetto”, suggerendo una solida base per il problema della generalizzazione a nuovi oggetti, hanno scritto i ricercatori nel documento.
“Per supportare altri ricercatori, stiamo rendendo open-source una versione del nostro ambiente simulato e rilasciando i progetti per costruire il nostro ambiente di impilamento RGB di robot reali, insieme ai modelli di oggetti RGB e alle informazioni per la loro stampa 3D”, il ricercatori hanno detto. “Stiamo anche rendendo open-source una raccolta di librerie e strumenti utilizzati nella nostra ricerca sulla robotica in modo più ampio”.
Impilamento RGB
Con RGB-Stacking, l’obiettivo è addestrare un braccio robotico tramite rinforzo, imparando a impilare oggetti di forme diverse. L’apprendimento per rinforzo è un tipo di tecnica di apprendimento automatico che consente a un sistema, in questo caso un robot, di apprendere per tentativi ed errori utilizzando il feedback delle sue azioni ed esperienze.
RGB-Stacking posiziona una pinza attaccata a un braccio robotico sopra un cestello e tre oggetti nel cestello: uno rosso, uno verde e uno blu (da cui il nome RGB). Un robot deve impilare l’oggetto rosso sopra l’oggetto blu entro 20 secondi, mentre l’oggetto verde funge da ostacolo e distrazione.
Secondo i ricercatori di DeepMind, il processo di apprendimento assicura che un robot acquisisca abilità generalizzate attraverso l’addestramento su più set di oggetti. RGB-Stacking varia intenzionalmente le qualità di presa e impilamento che definiscono il modo in cui un robot può afferrare e impilare ogni oggetto, il che costringe il robot a esibire comportamenti che vanno oltre una semplice strategia di prelievo e posizionamento.
“Il nostro benchmark RGB-Stacking include due versioni di attività con diversi livelli di difficoltà”, spiegano i ricercatori. “In ‘Skill Mastery’, il nostro obiettivo è addestrare un singolo agente in grado di impilare un set predefinito di cinque triplette. In “Generalizzazione delle abilità”, usiamo le stesse triplette per la valutazione, ma addestriamo l’agente su una vasta serie di oggetti di addestramento, per un totale di oltre un milione di possibili triplette. Per verificare la generalizzazione, questi oggetti di addestramento escludono la famiglia di oggetti da cui sono state scelte le terzine di test. In entrambe le versioni, separiamo la nostra pipeline di apprendimento in tre fasi”.
I ricercatori affermano che i loro metodi in RGB-Stacking si traducono in strategie di impilamento “sorprendenti” e “padronanza” nell’impilare un sottoinsieme di oggetti. Tuttavia, ammettono di graffiare solo la superficie di ciò che è possibile e che la sfida della generalizzazione rimane irrisolta.
“Mentre i ricercatori continuano a lavorare per risolvere la sfida aperta della vera generalizzazione nella robotica, speriamo che questo nuovo punto di riferimento, insieme all’ambiente, ai progetti e agli strumenti che abbiamo rilasciato, contribuisca a nuove idee e metodi che possano rendere la manipolazione ancora più semplice e i robot più capace”, hanno aggiunto i ricercatori.
Man mano che i robot diventano più abili nell’impilare e afferrare oggetti, alcuni esperti ritengono che questo tipo di automazione potrebbe guidare il prossimo boom manifatturiero negli Stati Uniti . In un recente studio di Google Cloud e The Harris Poll, i due terzi dei produttori hanno affermato che l’uso dell’intelligenza artificiale nelle loro operazioni quotidiane è in aumento, con il 74% che afferma di essere in linea con il mutevole panorama lavorativo. Le aziende manifatturiere si aspettano guadagni di efficienza nei prossimi cinque anni attribuibili alle trasformazioni digitali . La ricerca di McKinsey con il World Economic Forum mette il potenziale di creazione di valore dei produttori che implementano “Industria 4.0” – l’automazione delle pratiche industriali tradizionali – a 3,7 trilioni di dollari entro il 2025.