Home / AI tecnologia / OpenAI sta insegnando ai robot movimenti più eleganti

OpenAI sta insegnando ai robot movimenti più eleganti

OpenAI definisce un nuovo punto di riferimento per la destrezza del robot

L’IA sta insegnando ai robot movimenti più eleganti, ma non possono ancora eguagliare gli umani nel potere di apprendimento

Niente in questo mondo – animale o robot – si avvicina abbastanza alla flessibilità e alla destrezza della mano umana. Per gli ingegneri dell’OpenAI senza scopo di lucro fondato da Elon Musk, questo ha rappresentato sia una sfida che un’opportunità. Come potevano i loro ricercatori usare l’intelligenza artificiale per insegnare a un robot a manipolare gli oggetti con la stessa abilità di un umano ?

Di solito, quando si insegna ad un AI per controllare un robot fisico, gli scienziati tendono a confrontarsi con gli stessi problemi. La formazione viene spesso eseguita utilizzando l’apprendimento di rinforzo; un metodo in cui l’intelligenza artificiale impara attraverso un processo di tentativi ed errori. Ma questo richiede molto tempo, di solito pari a anni di esperienza. Va bene se vuoi che un’IA riesca a battere, ad esempio, un videogioco: lascia che giochi a ritmo accelerato. Ma se vuoi insegnargli un compito nella vita reale , sei nei guai. Non puoi aspettare che le braccia dei robot si confondano in anni di pratica, ed è difficile ottenere una simulazione del mondo che sia sufficientemente accurata per scopi di allenamento.

Per OpenAI, l’attività che si erano prefissati era insegnare a una mano robotica a manipolare un cubo a sei facce; spostandolo da una posizione all’altra in modo che un lato specifico fosse rivolto verso l’alto. Come con le ricerche precedenti, hanno iniziato simulando questo ambiente nel modo più accurato possibile, ma il passo successivo è stato ciò che ha fatto la differenza: hanno iniziato a fare scherzi con la simulazione.

In primo luogo, hanno aggiunto il rumore visivo casuale. Quindi, hanno cambiato i colori della mano virtuale e del cubo. Hanno randomizzato la dimensione del cubo; quanto erano sdrucciolevoli le sue superfici; e quanto era pesante. Hanno anche incasinato la gravità della simulazione. L’effetto di tutto ciò era di dare all’IA una migliore comprensione di come sarebbe stato manipolare il cubo nel mondo reale. Sebbene la simulazione non sia stata del tutto fedele alla vita, ha avuto abbastanza varianti da consentire al sistema di imparare a gestire l’imprevisto.

 

Matthias Plappert di OpenAI, che ha lavorato al progetto, spiega che cambiare la gravità della simulazione è stato un trucco particolarmente divertente. Il team sapeva che quando il sistema AI, noto come Dactyl, stava controllando una vera mano robot, la base della mano potrebbe non essere posizionata sempre allo stesso angolo. Un angolo più basso significherebbe che il cubo cadrebbe dalla mano più facilmente. Per insegnare a Dactyl come gestire questa variante, hanno deciso che avrebbero randomizzato l’angolo di gravità nella simulazione. “Senza questa randomizzazione, abbandonerebbe sempre l’oggetto perché non era abituato”, afferma Plappert.

Passare attraverso tutte queste randomizzazioni ha richiesto molto tempo. Un tempo molto lungo. In effetti, Dactyl ha accumulato circa 100 anni di esperienza per raggiungere il massimo delle prestazioni. Questo, a sua volta, significava che il team doveva usare molta potenza di calcolo: circa 6.144 CPU e otto potenti potenti GPU Nvidia V100. Questo è il tipo di hardware accessibile solo a pochissime istituzioni di ricerca.

Ma i risultati finali sono valsi la pena, dice Plappert. Una volta completamente addestrato, Dactyl è stato in grado di spostare il cubo da una posizione all’altra fino a 50 volte di seguito senza rilasciarlo. (Anche se il numero medio di volte che lo ha fatto era molto più piccolo, appena 13). E imparando a muovere il cubo in mano, Dactyl ha anche sviluppato comportamenti simili a quelli umani. Tutto ciò è stato appreso senza alcuna istruzione umana – solo prove ed errori, per decenni alla volta.

“Questo dimostra che ciò che noi umani facciamo con la manipolazione è molto ottimizzato”, afferma Plappert. “È un momento molto interessante quando guardi un robot che cerca di risolvere un problema e pensi ‘Oh, hey, è così che farei anche io.'”

 

Lascia un commento

Top

Utilizzando il sito, accetti l'utilizzo dei cookie da parte nostra. maggiori informazioni

Questo sito utilizza i cookie per fornire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o cliccando su "Accetta" permetti il loro utilizzo.

Chiudi