WiMi Hologram Cloud Inc., un leader globale nella tecnologia di realtà aumentata (AR) con ologrammi, ha recentemente annunciato lo sviluppo di un sistema di Interazione Uomo-Robot (HRI) basato su algoritmi di apprendimento automatico. Questo sistema HRI multimodale combina voce e gesti, consentendo la conversione delle parole e dei movimenti dell’utente in comandi eseguibili dal robot. L’utilizzo dei gesti per l’HRI si rivela particolarmente efficace, poiché i gesti stessi esprimono una vasta gamma di significati ed è facile riconoscerli. D’altro canto, l’interazione vocale basata sulla comprensione del linguaggio naturale rappresenta un metodo diretto e conveniente.
Il sistema HRI, basato su algoritmi di apprendimento automatico, sfrutta una combinazione di gesti e voce per il controllo del robot. La voce viene utilizzata come modalità di interazione naturale per comandare il robot, mentre i gesti sono utilizzati come complemento alla voce, migliorandone la precisione. Questa combinazione di gesti e parole riduce gli svantaggi derivanti dall’uso esclusivo di gesti o parole, rendendo la comunicazione tra umani e robot più naturale, efficiente ed accurata.
Attraverso l’interazione vocale, il robot è in grado di comprendere ciò che le persone dicono e può comunicare con gli esseri umani in modo emotivo. Il sistema di dialogo uomo-robot presenta caratteristiche di interazione umanizzate e intelligenti. Il riconoscimento dei gesti si basa sul tracciamento dei movimenti delle mani umane, generando immagini o sillabe che corrispondono ai gesti eseguiti. Ciò permette di attribuire significati specifici alle parole o ai gesti, esprimendo i pensieri in modo vivido e consentendo al robot di comprendere e interagire con il linguaggio umano.
Con lo sviluppo progressivo dell’HRI e l’applicazione del riconoscimento delle emozioni vocali nella vita di tutti i giorni, la necessità per l’intelligenza artificiale di comprendere le emozioni umane è diventata sempre più urgente.
Il sistema HRI di WiMi offre un’esperienza di interazione più rapida, efficiente e diversificata, unendo informazioni percettive multimodali. Grazie all’utilizzo parallelo di gesti e voce in tempo reale, la comunicazione visiva e le informazioni vocali vengono integrate e condivise durante l’interazione. Diverse modalità di interazione si completano a vicenda, creando un sistema di interazione completo. Questo sistema guida lo sviluppo progressivo dell’HRI verso l’intelligenza e l’umanizzazione, contribuendo a creare un ambiente armonioso e naturale tra umani e robot.