RaiBo – un versatile robo-cane corre attraverso la spiaggia sabbiosa a 3 metri/sec 

 
Apprendimento della locomozione quadrupede su terreno deformabile

KAIST (Presidente Kwang Hyung Lee) ha annunciato il 25 che un gruppo di ricerca guidato dal professor Jemin Hwangbo del Dipartimento di ingegneria meccanica ha sviluppato una tecnologia di controllo robotico quadrupede in grado di camminare in modo robusto con agilità anche su terreni deformabili come una spiaggia sabbiosa.

 Il gruppo di ricerca del professor Hwangbo ha sviluppato una tecnologia per modellare la forza ricevuta da un robot che cammina sul terreno fatto di materiali granulari come la sabbia e simularla tramite un robot quadrupede. Inoltre, il team ha lavorato su una struttura di rete neurale artificiale adatta a prendere decisioni in tempo reale necessarie per adattarsi a vari tipi di terreno senza informazioni preliminari mentre si cammina allo stesso tempo e l’ha applicata all’apprendimento per rinforzo. Si prevede che il controller di rete neurale addestrato amplierà l’ambito di applicazione dei robot ambulanti quadrupedi dimostrando la sua robustezza nel cambiamento del terreno, come la capacità di muoversi ad alta velocità anche su una spiaggia sabbiosa e camminare e girare su terreni morbidi come un aereo materasso senza perdere l’equilibrio.

 

Questa ricerca, con Ph.D. Lo studente Soo-Young Choi del Dipartimento di Ingegneria Meccanica KAIST come primo autore, è stato pubblicato a gennaio su Science Robotics . (Titolo dell’articolo: Apprendimento della locomozione quadrupede su terreno deformabile).

 

L’apprendimento per rinforzo è un metodo di apprendimento basato sull’intelligenza artificiale utilizzato per creare una macchina che raccolga dati sui risultati di varie azioni in una situazione arbitraria e utilizzi tale insieme di dati per eseguire un’attività. Poiché la quantità di dati richiesti per l’apprendimento per rinforzo è così vasta, è ampiamente utilizzato un metodo di raccolta dei dati attraverso simulazioni che approssimano i fenomeni fisici nell’ambiente reale.

 

In particolare, i controllori basati sull’apprendimento nel campo dei robot ambulanti sono stati applicati ad ambienti reali dopo aver appreso attraverso i dati raccolti nelle simulazioni per eseguire con successo controlli ambulanti su vari terreni.

 

Tuttavia, poiché le prestazioni del controller basato sull’apprendimento diminuiscono rapidamente quando l’ambiente effettivo presenta discrepanze rispetto all’ambiente di simulazione appreso, è importante implementare un ambiente simile a quello reale nella fase di raccolta dei dati. Pertanto, al fine di creare un controller basato sull’apprendimento in grado di mantenere l’equilibrio in un terreno deformabile, il simulatore deve fornire un’esperienza di contatto simile.

 

Il team di ricerca ha definito un modello di contatto che prevedeva la forza generata al contatto dalla dinamica del movimento di un corpo che cammina sulla base di un modello di forza di reazione al suolo che considerava l’effetto di massa aggiuntivo dei mezzi granulari definito in studi precedenti.

 

Inoltre, calcolando la forza generata da uno o più contatti in ogni fase temporale, è stato simulato in modo efficiente il terreno deformante.

 

Il team di ricerca ha anche introdotto una struttura di rete neurale artificiale che prevede implicitamente le caratteristiche del terreno utilizzando una rete neurale ricorrente che analizza i dati delle serie temporali dai sensori del robot.

 

Il controller appreso è stato montato sul robot “RaiBo”, che è stato costruito dal team di ricerca per mostrare la camminata ad alta velocità fino a 3,03 m/s su una spiaggia sabbiosa dove i piedi del robot erano completamente immersi nella sabbia. Anche se applicato a terreni più duri, come campi erbosi e una pista da corsa, è stato in grado di funzionare in modo stabile adattandosi alle caratteristiche del terreno senza alcuna programmazione aggiuntiva o revisione dell’algoritmo di controllo.

 

Inoltre, ruotava con stabilità a 1,54 rad/s (circa 90° al secondo) su un materasso ad aria e dimostrava la sua rapida adattabilità anche nella situazione in cui il terreno diventava improvvisamente soffice.

 

Il gruppo di ricerca ha dimostrato l’importanza di fornire un’esperienza di contatto adeguata durante il processo di apprendimento rispetto a un controllore che assumeva che il terreno fosse rigido e ha dimostrato che la rete neurale ricorrente proposta modifica il metodo di camminata del controllore in base alle proprietà del terreno.

 

Si prevede che la metodologia di simulazione e apprendimento sviluppata dal team di ricerca contribuirà a consentire ai robot di svolgere compiti pratici in quanto espande la gamma di terreni su cui possono operare vari robot che camminano.

 

Il primo autore, Suyoung Choi, ha dichiarato: “È stato dimostrato che fornire a un controller basato sull’apprendimento un’esperienza di contatto ravvicinato con un terreno deformabile reale è essenziale per l’applicazione al terreno deformante”. Ha continuato aggiungendo che “Il controller proposto può essere utilizzato senza informazioni preliminari sul terreno, quindi può essere applicato a vari studi di camminata del robot”.

 

Questa ricerca è stata condotta con il supporto del Samsung Research Funding & Incubation Center di Samsung Electronics.

 

< Figura 1. Adattabilità del controller proposto a vari ambienti terrestri. Il controller ha appreso da un’ampia gamma di simulazioni di media granulari randomizzati, ha mostrato l’adattabilità a vari terreni naturali e artificiali e ha dimostrato la capacità di camminare ad alta velocità e l’efficienza energetica. >

 

< Figura 2. Definizione del modello di contatto per la simulazione di substrati granulari. Il team di ricerca ha utilizzato un modello che considerava l’effetto di massa aggiuntivo per la forza verticale e un modello di attrito di Coulomb per la direzione orizzontale mentre approssimava il contatto con il mezzo granulare come se si verificasse in un punto. Inoltre, è stato introdotto e utilizzato per la simulazione un modello che simula la resistenza del suolo che può verificarsi sul lato del piede. >



 

RAI Lab Team con il professor Hwangbo al centro dell’ultima fila.
CREDITO
Laboratorio di robotica e intelligenza artificiale KAIST.

Di ihal