Un team di ricercatori ha presentato AnyPlace, una nuova metodologia robotica in due fasi che promette di rivoluzionare il posizionamento degli oggetti. Questo approccio affronta le sfide legate alla varietà delle forme degli oggetti e alle diverse modalità di posizionamento, come l’impilamento, l’aggancio e l’inserimento.

Il posizionamento preciso degli oggetti rappresenta una delle sfide più complesse nella robotica. La variabilità nelle forme e nelle modalità di posizionamento richiede soluzioni altamente adattabili. Animesh Garg, uno dei ricercatori coinvolti, ha sottolineato l’importanza di sviluppare metodi che possano generalizzare in diversi contesti reali, piuttosto che soluzioni specifiche per domini limitati.

AnyPlace si basa su una pipeline in due fasi:​

  • Predizione della Posizione Generale: Utilizzando un Modello Visivo-Linguistico (VLM) denominato Molmo e un ampio modello di segmentazione chiamato SAM 2, il sistema segmenta gli oggetti e propone potenziali posizioni di posizionamento.
  • Predizione della Posa Dettagliata: La regione attorno alla posizione proposta viene analizzata da un modello che utilizza nuvole di punti degli oggetti da posizionare e delle aree di destinazione, determinando la posa esatta.

Questa strategia consente al sistema di concentrarsi solo sulle regioni rilevanti per il posizionamento locale, migliorando l’efficienza e l’accuratezza.

Per addestrare AnyPlace, i ricercatori hanno creato un dataset completamente sintetico composto da 1.489 oggetti generati casualmente, coprendo diverse configurazioni di posizionamento come inserimento, impilamento e aggancio. In totale, sono state generate 5.370 pose di posizionamento in 13 categorie.

Questa metodologia supera le limitazioni della raccolta di dati nel mondo reale, permettendo al modello di generalizzare attraverso vari oggetti e scenari. Garg ha osservato che, per il posizionamento degli oggetti, è possibile generare dati sintetici altamente efficaci, consentendo la creazione di un predittore di presa utilizzando esclusivamente dati sintetici.

AnyPlace ha raggiunto un tasso di successo dell’80% nel compito di inserimento di fiale, dimostrando robustezza e capacità di generalizzazione. I risultati delle simulazioni hanno superato i benchmark esistenti in termini di tassi di successo, copertura delle modalità di posizionamento e precisione nel posizionamento fine.

L’uso di dati di profondità riduce il divario tra simulazione e realtà, rendendo il modello applicabile in scenari reali con una raccolta limitata di dati reali. La generazione di dati sintetici con variabilità nelle forme e dimensioni degli oggetti migliora la robustezza del modello.

Di Fantasy