Il robot basato sull’intelligenza artificiale che ha imparato il curling utilizzando l’apprendimento adattivo del rinforzo profondo
Nel curling, uno sport che è stato definito “scacchi sul ghiaccio” a causa della strategia e della precisione coinvolte, un robot chiamato Curly ha battuto le squadre nazionali coreane in tre partite ufficiali su quattro. I robot hanno certamente fatto molta strada, ma sono ancora abbastanza goffi e la maggior parte non ha la destrezza del corpo umano. Quindi Curly , il robot che ha imparato il curling, è piuttosto impressionante.
Per apprezzare appieno questa prodezza della tecnologia, è importante comprendere lo sport del curling . Il curling richiede la fisicità del bowling mentre i giocatori spingono una pietra da 40 libbre lungo una lastra di ghiaccio da un confine chiamato hogline verso un bersaglio che si trova a 100 piedi di distanza. Il bersaglio per la pietra è chiamato la casa che ha cerchi concentrici: più ti avvicini al bersaglio, più punti ottieni.
Nel curling, gareggi contro una squadra i cui giocatori tentano anche di lanciare il loro disco di granito più vicino al bersaglio o di mettere fuori combattimento il tuo per guadagnare il maggior numero di punti. La strategia di curling consiste nel capire come tenere la pietra del tuo avversario lontana dalla casa sbattendola fuori posizione mentre lo fai con sufficiente finezza che la tua pietra si allinei nella casa in una posizione ottimale. Il trucco è che l’attrito della pietra e del ghiaccio fa sì che gli elementi affrontati dai concorrenti cambino sempre durante la partita. Il curling non è un’impresa facile per l’uomo e un risultato incredibile per una macchina.
Curly e i suoi creatori
Klaus-Robert Müller del Berlin Institute of Technology in Germania ei suoi colleghi sono dietro la creazione di Curly. Curly è alimentato dall’intelligenza artificiale, in particolare da un framework di apprendimento di rinforzo profondo adattivo. Il robot ha due ruote nella parte anteriore e una ruota orientabile nella parte posteriore. Ha una telecamera telescopica che raggiunge i 7 piedi in aria per aiutare il robot a vedere la casa e un’altra proprio sopra le ruote anteriori per individuare la hogline. Insieme a quattro ruote più piccole a forma di U e azionate da un nastro trasportatore, il robot afferra la pietra con la sua ruota anteriore. Sono le ruote a forma di U che consentono al robot di far girare la pietra, il ricciolo che fa girare la pietra a destra oa sinistra, una tecnica fondamentale nello sport.
Per aiutare Curly ad apprendere la strategia del curling, il team di sviluppo ha creato una simulazione di un gioco di curling con cui Curly poteva competere e da cui imparare. La cosa difficile da simulare erano le condizioni mutevoli che si verificano in ogni partita: le condizioni del ghiaccio, la lucidatura della pietra e altri aspetti fisici dello sport. I concorrenti umani devono adattarsi continuamente alle mutevoli condizioni. Di conseguenza, c’era un divario tra la simulazione e la realtà.
Prima dell’inizio di una partita, ai concorrenti sono consentiti lanci di prova per saperne di più sulle condizioni attuali. Curly ha anche eseguito i lanci di prova e quindi ha dovuto allineare l’esperienza del mondo reale con i modelli matematici da cui ha imparato. È stato programmato per confrontare le condizioni attuali sperimentate nei lanci di prova con il modello di addestramento e regolarlo secondo necessità.
Inoltre, durante la partita, Curly ha dovuto imparare le mosse migliori per il tiro successivo, a seconda della posizione delle pietre del concorrente. Nella simulazione, a Curly sono stati dati vari scenari e ha considerato lanci diversi, valutando in definitiva il rischio di ciascun tipo. Utilizzando le conoscenze acquisite durante l’allenamento e quindi adattandosi alle condizioni del mondo reale e alla progressione della partita, il robot ha adattato il suo piano di conseguenza per raggiungere il successo.
È importante notare che queste partite tra Curly e i coreani non erano una replica esatta dello sport poiché non c’era lo spazzamento: il processo in cui i compagni di squadra spazzano una scopa davanti alla pietra per strofinare il ghiaccio per ridurre l’attrito e rendere la pietra percorrere un percorso più rettilineo, fatto da Curly o dai concorrenti coreani in queste partite.
Alla fine, la formazione e lo sviluppo di Curly hanno portato al successo dimostrando che l’intelligenza artificiale può adattarsi alle condizioni del mondo reale. I concorrenti di curling a livello olimpico imparano le sfumature del loro sport da 15 a 20 anni. È stato davvero straordinario che un robot alimentato dall’intelligenza artificiale abbia ottenuto così tanto in così poco tempo e si sia adattato con successo alle molte variabili che fanno parte di una competizione di curling. Curly ha dimostrato che anche se esiste un divario tra i simulatori basati sulla fisica e le condizioni del mondo reale, l’intelligenza artificiale può superarlo. Ciò sarà importante man mano che verranno sviluppati altri sistemi di intelligenza artificiale.