L’era dell’intelligenza artificiale (AI) che controlla i robot in base ai comandi dell’utente si sta avvicinando rapidamente. L’intelligenza artificiale “Jarvis” che appare nel film “Iron Man” non è lontana.
La ricerca per questo è già in pieno svolgimento. Microsoft (MS) ha recentemente annunciato i risultati della ricerca sul controllo dei robot utilizzando “ChatGPT” sul suo blog. È uno studio che ha sperimentato un metodo per controllare un robot nel mezzo, come quando una persona dà un comando verbale a un robot, ChatGPT lo codifica nel linguaggio del robot e lo consegna.
Fino ad ora, la robotica è stata al livello di attività ripetute in cui gli ingegneri codificano nel linguaggio del robot, immettono comandi e osservano e correggono il feedback del robot.
D’altra parte, in questo studio MS, quando un ingegnere impartisce un comando in linguaggio umano, ChatGPT lo converte in codice robotico, trasmette il comando al robot e assume tutti i ruoli di osservazione e feedback.
Le attuali pipeline di robotica richiedono ingegneri specializzati nel ciclo per scrivere codice per migliorare i processi. L’obiettivo di ChatGPT è consentire agli utenti non tecnici di rimanere aggiornati, interagire con i modelli linguistici tramite comandi linguistici di alto livello e distribuire senza problemi attività con varie piattaforme.
Le attuali pipeline di robotica richiedono ingegneri specializzati nel ciclo per scrivere codice per migliorare i processi. L’obiettivo di ChatGPT è consentire agli utenti non tecnici di rimanere aggiornati, interagire con i modelli linguistici tramite comandi linguistici di alto livello e distribuire senza problemi attività con varie piattaforme.
A tale scopo, MS ha insegnato API specifiche per robot chatGPT. ChatGPT scrive un codice speciale per controllare i movimenti del robot utilizzando comandi in linguaggio naturale e API del robot. Ad esempio, quando gli viene chiesto di “raccogliere la palla”, ChatGPT genera un codice di controllo del robot, come scrivere una poesia o completare un saggio, quindi ispeziona e corregge il codice finché il robot non ha successo.
Questo studio mostra un robot controllato da un codice scritto da ChatGPT sotto istruzioni umane, come l’utilizzo di un braccio robotico per disporre i blocchi sul logo MS, far volare un drone per ispezionare il contenuto di uno scaffale o utilizzare un robot per trovare un oggetto con il suo funzione della visione.
Attraverso tentativi ed errori, Microsoft ha stabilito una metodologia e una serie di principi di progettazione per la creazione di prompt per le attività dei robot.
Innanzitutto, definisci un set di API robot di alto livello o librerie di funzioni. Questa libreria può essere specifica per un particolare robot e deve essere mappata a un’implementazione di basso livello esistente dello stack di controllo o della libreria di percezione del robot. È molto importante utilizzare nomi descrittivi per le API di alto livello in modo che ChatGPT possa dedurre il loro comportamento.
Successivamente, scrivi un prompt di testo per ChatGPT che spieghi l’obiettivo dell’attività, spiegando esplicitamente quali funzionalità sono disponibili nella libreria di livello superiore. I prompt possono anche contenere informazioni sui limiti delle attività o su come ChatGPT costruisce una risposta.
Gli utenti valutano l’output del codice di ChatGPT mediante ispezione diretta o utilizzando un simulatore. Quando necessario, gli utenti forniscono a ChatGPT un feedback sulla qualità e sulla sicurezza delle loro risposte utilizzando il linguaggio naturale. Infine, quando l’utente è soddisfatto della soluzione, il codice finale può essere distribuito al robot.
Sulla base di questa ricerca, Microsoft ha lanciato “PromptCraft”, una piattaforma collaborativa open source che consente agli utenti di condividere strategie di suggerimento per varie categorie di robot. Ciò includeva tutti i prompt e le finestre di dialogo che Microsoft ha utilizzato nella sua ricerca.
Microsoft prevede di aggiungere in futuro simulatori e interfacce di robot per testare gli algoritmi creati da ChatGPT.