Il futuro è virtuale: Facebook lancia nuovi strumenti per l’IA incorporata

Negli ultimi sei mesi, il mondo ha assistito a una frettolosa adozione di alternative virtuali per schivare il blues pandemico. Riunioni virtuali, conferenze , digital twin sono diventati quasi una norma. Con AR / VR pronti a cavalcare la prossima grande ondata di innovazioni, è essenziale rivisitare il loro attuale stato di funzionalità nei regni del mondo fisico. Perché ciò accada, dobbiamo innovare pesantemente in un campo chiamato AI incorporata.

Gli assistenti AI del futuro devono navigare in modo efficace, guardarsi intorno nel loro ambiente fisico, ascoltare e costruire ricordi del loro spazio 3D. Il campo della Embodied AI si occupa dello studio di sistemi intelligenti con una incarnazione fisica o virtuale (robot e assistenti personali egocentrici). L’idea qui è che l’intelligenza emerge nell’interazione di un agente con l’ambiente e come risultato dell’attività sensomotoria.

Per consentire agli agenti di intelligenza artificiale di navigare in modo intelligente, i ricercatori di Facebook AI hanno rilasciato una manciata di framework:

Per un’acustica super realistica
Il team ha rilasciato una piattaforma audiovisiva, che i ricercatori possono utilizzare per addestrare agenti di intelligenza artificiale in ambienti 3D con un’acustica altamente realistica. Il team ritiene che questa piattaforma possa essere sfruttata per avviare attività di intelligenza artificiale più incarnate per la navigazione verso un obiettivo che emette suoni, per imparare dall’ecolocalizzazione o persino per esplorare con sensori multimodali.

L’aggiunta di suoni, hanno scritto i ricercatori, può produrre un addestramento più veloce e una navigazione più accurata all’inferenza. Ciò consentirà inoltre all’agente di scoprire l’obiettivo da solo da lontano. Con l’aiuto di Facebook Reality Labs, hanno rilasciato SoundSpaces , rendering audio per gli ambienti 3D.

Naviga nella tua sala
Il team di FAIR ha sviluppato Semantic MapNet , un framework apprendibile end-to-end per la creazione di mappe semantiche top-down. Questo quadro può essere utilizzato per mostrare dove si trovano gli oggetti da osservazioni egocentriche. Le MapNets semantiche possono consentire agli agenti di apprendere e ragionare su come navigare. Ad esempio, in un futuro in cui gli agenti immobiliari virtuali sono una cosa, gli acquirenti potrebbero aver bisogno di un tour che imiti la realtà. Un assistente domestico intelligente dovrebbe essere in grado di rispondere a domande come quante stanze o quante sedie possono entrare in una sala e altre curiosità.


Habitat-Lab , è un prodotto dell’ambiente di simulazione AI Habitat per la ricerca sull’IA incorporata. Habitat lab è una libreria modulare di alto livello per lo sviluppo end-to-end nell’intelligenza artificiale incorporata, che definisce attività di intelligenza artificiale incorporata come navigazione, domande e risposte ecc. Questa libreria aiuta a configurare agenti incorporati (forma fisica, sensori, capacità), addestrando il agenti (tramite imitazione o apprendimento di rinforzo) e benchmarking delle loro prestazioni sui compiti definiti utilizzando metriche standard.

Direzione futura


Da molto tempo, l’IA di Facebook ha investito molto nella costruzione di sistemi di intelligenza artificiale intelligenti in grado di pensare, pianificare e ragionare sul mondo reale. Combinando i sistemi di intelligenza artificiale incorporati con i loro strumenti interni di apprendimento profondo 3D all’avanguardia , il team mira a migliorare ulteriormente la comprensione di oggetti e luoghi. I contributi del team per introdurre sistemi di intelligenza artificiale incorporati di nuova generazione possono essere riassunti come segue:

Sviluppato un nuovo algoritmo per l’attività di navigazione nella stanza in Habitat.
I nuovi sistemi possono costruire mappe in uno stile dall’alto verso il basso, come gli umani; pensa agli agenti che devono prima raggiungere una stanza per recuperare qualcosa.
Miglioramento del modo in cui i robot virtuali seguono le istruzioni nella simulazione, utilizzando set di dati di sottotitoli di immagini su larga scala disincarnati.
Creato un nuovo punto di riferimento per una mappatura più rapida in ambienti sconosciuti.
Introdotto un metodo di apprendimento per rinforzo in modo che un agente incarnato scopra autonomamente il panorama della convenienza di un nuovo ambiente 3D non mappato.

Di ihal