La tecnica di visione artificiale prevede il comportamento umano dai video
Una nuova tecnica di visione artificiale sviluppata dai ricercatori della Columbia Engineering può prevedere il comportamento umano dai video. La nuova tecnica offre alle macchine un senso intuitivo che consente loro di prevedere cosa accadrà dopo utilizzando associazioni di livello superiore tra persone, animali e oggetti.
Carl Vondrick è assistente professore di informatica alla Columbia. Vondrick ha diretto lo studio , che è stato presentato il 24 giugno alla Conferenza internazionale sulla visione artificiale e il riconoscimento dei modelli.
“Il nostro algoritmo è un passo verso la capacità delle macchine di fare previsioni migliori sul comportamento umano, e quindi di coordinare meglio le loro azioni con le nostre”, ha affermato Vondrick. “I nostri risultati aprono una serie di possibilità per la collaborazione uomo-robot, veicoli autonomi e tecnologie assistive”.
Il nuovo metodo è il più accurato del suo genere fino ad oggi per la previsione di eventi di azione video diversi minuti nel futuro. Il sistema ha prima analizzato migliaia di ore di film, giochi sportivi e spettacoli prima di prevedere centinaia di attività, come la stretta di mano e il pugno.
Se il sistema non può prevedere un’azione specifica, trova un concetto di livello superiore che li collega, come la parola “saluto”.
Tentativi Passati
I tentativi passati di apprendimento automatico predittivo di solito si concentravano sulla previsione di un’azione alla volta, con gli algoritmi che decidevano di classificare l’azione, ad esempio, come un abbraccio, una stretta di mano, un cinque o una non azione. Tuttavia, un’elevata incertezza significa che la maggior parte dei modelli di apprendimento automatico non è in grado di trovare punti in comune tra le possibili opzioni.
Il team comprendeva gli studenti di dottorato in ingegneria della Columbia Didac Suris e Ruoshi Liu, e la coppia ha esaminato il problema della previsione a lungo termine in modo leggermente diverso.
Suris è co-autore principale del documento.
“Non tutto in futuro è prevedibile”, ha detto Suris. “Quando una persona non può prevedere esattamente cosa accadrà, gioca sul sicuro e prevede a un livello di astrazione più elevato. Il nostro algoritmo è il primo ad apprendere questa capacità di ragionare in modo astratto su eventi futuri”.
Sviluppo del nuovo sistema
Suris e Liu hanno fatto affidamento su geometrie insolite per sviluppare modelli di intelligenza artificiale che organizzano concetti di alto livello e prevedono il comportamento umano in futuro.
Aude Oliva, che non è stata coinvolta nello studio, è ricercatrice senior presso il Massachusetts Institute of Technology e co-direttrice del Watson AI Lab del MIT-IBM.
“La previsione è la base dell’intelligenza umana”, ha detto Oliva. “Le macchine commettono errori che gli umani non farebbero mai perché mancano della nostra capacità di ragionare in modo astratto. Questo lavoro è un passo fondamentale per colmare questo divario tecnologico”.
I ricercatori hanno sviluppato un quadro matematico che consente alle macchine di organizzare eventi in base alla loro prevedibilità in futuro. Ad esempio, il nuovo sistema impara a classificare attività come il nuoto e la corsa come proprie, anziché limitarsi all’esercizio. Il sistema è anche in grado di tenere conto dell’incertezza, che porta ad azioni più specifiche.
Secondo Liu, co-autore principale dell’articolo, la tecnica appena sviluppata potrebbe aiutare i computer a prendere decisioni sfumate piuttosto che azioni pre-programmate, ed è fondamentale per creare fiducia tra umani e computer.
“La fiducia deriva dalla sensazione che il robot capisca davvero le persone”, spiega. “Se le macchine possono comprendere e anticipare i nostri comportamenti, i computer saranno in grado di assistere senza problemi le persone nelle attività quotidiane”.
Il team ora cercherà di verificare che la tecnica funzioni nel mondo reale e potrebbe essere implementata per la sicurezza, la salute e la sicurezza.
“Il comportamento umano è spesso sorprendente”, afferma Vondrick. “I nostri algoritmi consentono alle macchine di anticipare meglio cosa faranno dopo”.