Nella futura era delle case intelligenti, l’acquisizione di un robot per semplificare le attività domestiche non sarà una rarità. Tuttavia, la frustrazione potrebbe insorgere quando questi aiutanti automatici non riescono a svolgere compiti semplici. Ma c’è speranza, grazie all’innovativo lavoro di Andi Peng e del suo team presso il dipartimento di ingegneria elettrica e informatica del MIT, che stanno cercando di migliorare la curva di apprendimento dei robot.
Peng e il suo team interdisciplinare di ricercatori hanno sviluppato una struttura interattiva uomo-robot. Il fulcro di questo sistema è la sua capacità di generare narrazioni controfattuali che individuano i cambiamenti necessari affinché il robot esegua con successo un compito.
Per essere più chiari, se un robot fatica a riconoscere una tazza dipinta in modo particolare, il sistema offre situazioni alternative in cui il robot avrebbe avuto successo, magari se la tazza fosse di un colore più comune. Queste spiegazioni controfattuali, unite al feedback umano, semplificano il processo di generazione di nuovi dati per l’addestramento del robot.
Peng spiega: “La messa a punto è il processo di ottimizzazione di un modello di apprendimento automatico esistente che è già competente in un compito, consentendogli di svolgere un secondo compito analogo”.
Quando il sistema è stato testato, ha mostrato risultati impressionanti. I robot addestrati con questo metodo hanno dimostrato una capacità di apprendimento rapido, riducendo al contempo l’impegno di tempo da parte dei loro insegnanti umani. Se implementato con successo su scala più ampia, questo framework innovativo potrebbe aiutare i robot ad adattarsi rapidamente a nuovi ambienti, riducendo al minimo la necessità per gli utenti di possedere conoscenze tecniche avanzate. Questa tecnologia potrebbe essere la chiave per sbloccare robot generici in grado di assistere in modo efficiente persone anziane o disabili.
Peng crede: “L’obiettivo finale è consentire a un robot di apprendere e funzionare a un livello astratto simile a quello umano”.
L’ostacolo principale nell’apprendimento robotico è il “cambio di distribuzione”, un termine usato per spiegare una situazione in cui un robot incontra oggetti o spazi a cui non è stato esposto durante il suo periodo di addestramento. I ricercatori hanno affrontato questo problema implementando un metodo noto come “apprendimento per imitazione”. Ma questa soluzione aveva i suoi limiti.
“Immagina di dover dimostrare con 30.000 tazze affinché un robot possa riconoscere qualsiasi tazza. Invece, preferisco dimostrare con una sola tazza e insegnare al robot a capire che può prendere una tazza di qualsiasi colore”, dice Peng.
In risposta a ciò, il sistema del team identifica quali attributi dell’oggetto sono essenziali per il compito (come la forma di una tazza) e quali no (come il colore della tazza). Armato di queste informazioni, il sistema genera dati sintetici, alterando gli elementi visivi “non essenziali”, ottimizzando così il processo di apprendimento del robot.
Per valutare l’efficacia di questo framework, i ricercatori hanno condotto un test coinvolgendo utenti umani. A questi partecipanti è stato chiesto se le spiegazioni controfattuali del sistema migliorassero la loro comprensione delle prestazioni del robot.
Peng dice: “Abbiamo scoperto che gli esseri umani sono intrinsecamente abili in questa forma di ragionamento controfattuale. È questo elemento controfattuale che ci consente di tradurre senza soluzione di continuità il ragionamento umano in logica robotica”.
In più simulazioni, il robot ha costantemente imparato più velocemente con il loro approccio, superando le altre tecniche e richiedendo meno dimostrazioni da parte degli utenti.
Guardando al futuro, il team prevede di implementare questo framework su robot reali e di lavorare per ridurre i tempi di generazione dei dati tramite modelli di machine learning generativi. Questo approccio rivoluzionario ha il potenziale per trasformare la traiettoria di apprendimento dei robot, aprendo la strada a un futuro in cui i robot coesistono armoniosamente nella nostra vita quotidiana.