I ricercatori di Intel Labs, in collaborazione con esperti accademici e del settore, hanno introdotto una nuova tecnica per generare movimenti umani realistici e direzionabili a partire da input incompleti e multimodali. Questo approccio è stato presentato alla European Conference on Computer Vision (ECCV 2024) ed è parte degli sforzi di Intel Labs per far progredire la computer vision e l’apprendimento automatico.
Il Masked Humanoid Controller (MHC) di Intel è un sistema innovativo progettato per generare movimenti simili a quelli umani in ambienti di fisica simulata. A differenza dei metodi tradizionali che si basano su dati di motion capture completi, l’MHC può lavorare con dati di input sparsi e incompleti, provenienti da fonti come controller VR, joystick, tracciamento video o persino direttive astratte da prompt di testo.
La vera innovazione dell’MHC sta nella sua capacità di colmare le lacune nei dati mancanti attraverso il concetto di “Catch-up, Combine, and Complete” (CCC):
Catch-up: permette all’MHC di recuperare e ripristinare il movimento quando si verificano interruzioni, ad esempio quando un personaggio umanoide cade. Il sistema corregge rapidamente il movimento senza bisogno di riaddestramento.
Combine: l’MHC è in grado di fondere diverse sequenze di movimento, come combinare i movimenti della parte superiore del corpo (es. salutare) con quelli della parte inferiore (es. camminare), per creare comportamenti nuovi e realistici.
Complete: quando gli input sono parziali, l’MHC è in grado di dedurre e generare le parti mancanti del movimento. Ad esempio, se vengono specificati solo i movimenti del braccio, il sistema genererà i movimenti delle gambe per mantenere l’equilibrio e il realismo.
Questo approccio permette all’MHC di creare movimenti fluidi e fisicamente accurati anche in presenza di input incompleti, rendendolo ideale per applicazioni in settori come gaming, robotica e realtà virtuale.
Intel Labs ha presentato anche altre ricerche all’avanguardia all’ECCV 2024, come nuove tecniche di difesa per i modelli text-to-image e soluzioni per migliorare la coerenza spaziale nella generazione di immagini. Questi contributi evidenziano l’impegno di Intel nel promuovere un’intelligenza artificiale responsabile e sicura.
Il Masked Humanoid Controller rappresenta un importante passo avanti nella generazione di movimenti umani realistici da input multimodali, aprendo nuove possibilità per applicazioni avanzate in vari settori, sempre con un occhio di riguardo verso la sicurezza e la responsabilità nello sviluppo tecnologico.