Il metodo di apprendimento consente ai robot di apprendere osservando gli esseri umani
Immagine: CMUUn nuovo metodo di apprendimento sviluppato dai ricercatori della Carnegie Mellon University (CMU) consente ai robot di apprendere direttamente dai video di interazione umana e di generalizzare le informazioni a nuovi compiti, aiutandoli a imparare a svolgere le faccende domestiche. Il metodo di apprendimento si chiama WHIRL, che sta per In-the-wild Human Imitating Robot Learning, e aiuta il robot a osservare i compiti e raccogliere i dati video per imparare a completare il lavoro stesso.
La ricerca è stata presentata alla conferenza Robotics: Science and Systems a New York.
L’imitazione come metodo di apprendimento
Shikhar Bahl ha un dottorato di ricerca. studente presso il Robotics Institute (RI) presso la School of Computer Science della Carnegie Mellon University.
“L’imitazione è un ottimo modo per imparare”, ha detto Bahl. “Il fatto che i robot imparino effettivamente osservando direttamente gli esseri umani rimane un problema irrisolto sul campo, ma questo lavoro compie un passo significativo per abilitare tale capacità”.
Bahl ha lavorato al fianco di Deepak Pathak e Abhinav Gupta, entrambi docenti del RI. Il team ha aggiunto una fotocamera e il relativo software a un robot standard che ha imparato a completare oltre 20 attività. Queste attività includevano tutto, dall’apertura e chiusura degli elettrodomestici all’estrazione di un sacco della spazzatura dal cestino. Ogni volta che il robot ha osservato un essere umano completare i compiti prima di tentare lui stesso.
Pathak è un assistente professore al RI.
“Questo lavoro presenta un modo per portare i robot in casa”, ha detto Pathak. “Invece di aspettare che i robot siano programmati o addestrati per completare con successo diverse attività prima di distribuirli nelle case delle persone, questa tecnologia ci consente di distribuire i robot e far loro imparare a completare le attività, adattandosi al loro ambiente e migliorando esclusivamente guardando”.
La maggior parte dei metodi attuali per insegnare un compito a un robot si basano sull’imitazione o sull’apprendimento per rinforzo . Con l’apprendimento per imitazione, gli esseri umani azionano manualmente un robot e gli insegnano come completare un’attività, che richiede di essere eseguita più volte prima che il robot apprenda. Con l’apprendimento per rinforzo, il robot viene solitamente addestrato su milioni di esempi in simulazione prima di adattare l’addestramento al mondo reale.
Sebbene entrambi questi modelli siano efficienti nell’insegnare a un robot una singola attività in un ambiente strutturato, si rivelano difficili da scalare e implementare. Ma con WHIRL, un robot può imparare da qualsiasi video di un essere umano che completa un’attività. È anche facilmente scalabile, non limitato a un’attività specifica e può funzionare in ambienti domestici.
WHIRL consente ai robot di svolgere compiti nei loro ambienti naturali. E mentre i primi tentativi di solito si concludevano con un fallimento, poteva imparare molto rapidamente dopo pochi successi. Il robot non sempre esegue il compito con gli stessi movimenti di un essere umano, ma è perché ha parti diverse che si muovono in modo diverso. Detto questo, il risultato finale dell’esecuzione dei compiti è sempre lo stesso.
“Per scalare la robotica in natura, i dati devono essere affidabili e stabili e i robot dovrebbero migliorare nel loro ambiente esercitandosi da soli”, ha affermato Pathak.