Localizzazione dell’utente in interni mediante il riconoscimento visivo del luogo
Il riconoscimento visivo del luogo è uno dei capisaldi di sviluppo di computer vision e robotica. Il compito degli algoritmi VPR è identificare le posizioni esaminate in base alle immagini. La tecnologia può supportare sia i robot autonomi che la forza lavoro umana, identificando l’ambiente circostante e facilitando l’esecuzione delle azioni desiderate.
I ricercatori di NeuroSYS sfruttano gli algoritmi di visione artificiale come parte della piattaforma AR sviluppata, Nsflow , che consente istruzioni di lavoro interattive e formazione pratica per identificare le posizioni degli utenti durante la formazione in loco. In questo caso, l’uso del VPR porta a una significativa accelerazione dei processi di onboarding e apprendimento a causa di una ridotta necessità di formazione e supervisione preventiva.
Localizzare una persona o trovare il luogo desiderato utilizzando il GPS è già una notizia vecchia. Ma cosa fare quando il sistema di navigazione satellitare non è operativo? I sistemi di posizionamento indoor (IPS) stanno venendo in soccorso.
Quando si cerca un ago in un pagliaio, è possibile utilizzare varie tecniche, tra cui beacon, posizionamento magnetico, unità di misura inerziale (IMU) con accelerometri e giroscopi, misurazione del movimento dall’ultimo punto noto, posizionamento basato su Wi-Fi o semplicemente: utilizza marcatori visivi.
Tutti i metodi di cui sopra hanno i loro difetti (es. la necessità di installare marker o beacon, l’IMU che aumenta l’errore di misura nel tempo e richiede il riposizionamento), superando i loro vantaggi. La soluzione che risponde al problema cruciale – dove si trova l’utente generico con una precisione dell’ordine di pochi metri – risulta essere di competenza degli algoritmi.
Il processo di riconoscimento dei luoghi si basa su una procedura in due fasi, creando due database. Inizialmente, il luogo target viene fotografato e alcuni elementi, i punti chiave, sono contrassegnati da un rilevatore di caratteristiche per identificare gli elementi caratteristici dell’area. Successivamente, i punti etichettati vengono confrontati con un’immagine di riferimento. Una volta che i punti chiave valutati sono considerati sufficientemente simili da un comparatore di caratteristiche, l’immagine si qualifica come mostra lo stesso luogo.
Il database di immagini combina immagini di posizioni di destinazione, in questo caso, aree di lavoro e un insieme delle loro proprietà inclusi identificatori univoci, seguiti da descrittori locali e globali. L’altro set, il database delle stanze , abbina i punti chiave singolari con determinate aree nello spazio considerato.
Utilizzando le reti neurali SuperPoint, SuperGlue e netVLAD dal campo del riconoscimento visivo del luogo, i ricercatori hanno utilizzato il processo di cui sopra nella localizzazione degli utenti. Le reti neurali profonde, SuperPoint e SuperGlue, cooperano nel rilevamento e nell’abbinamento delle caratteristiche, estraendo informazioni dai database.
Entrano in scena i descrittori globali
Il processo richiede descrittori globali, che fungono da vettori che distinguono il luogo, identificando le aree in modo che non presentino ambiguità. Per svolgere il loro ruolo, i vettori dovrebbero essere indipendenti dall’illuminazione e dal punto di vista: indipendentemente dalla prospettiva e dalle condizioni di illuminazione, i descrittori globali non dovrebbero lasciare dubbi nel distinguere i luoghi nelle varie immagini.
Inoltre, gli oggetti variabili presenti nell’area di interesse non dovrebbero essere vincolati da descrittori globali come caratteristiche che distinguono i luoghi. Oggetti come mobili e attrezzature sono soggetti a modifiche (ristrutturazione, smantellamento), nel senso che non possono definire aree attraverso la loro presenza.
Il riconoscimento del luogo basato su computer vision si basa su elementi permanenti dei luoghi esaminati, come porte, finestre, scale e altri elementi distintivi di natura duratura. Durante la ricerca in oggetto, per i calcoli è stata utilizzata la rete neurale profonda NetVLAD, presentando, di conseguenza, vettori che soddisfano i requisiti impostati. Nel processo di abbinamento dei descrittori globali, vengono elaborate le immagini dei vettori più simili, a seguito di calcoli di distanza tra ciascun punto di ancoraggio caratteristico.
Durante l’elaborazione di due database, il database della stanza e l’altro, contenente i punti chiave e i descrittori globali, il sistema si occupa degli attributi delle immagini. Dopo aver eseguito le somiglianze e la stima delle distanze più brevi, la seconda rete neurale, SuperGlue, identifica le immagini della posizione. Il sistema che utilizza VPR consente la localizzazione dell’utente basata, in breve, sul numero di punti chiave corrispondenti.
Gli algoritmi hanno trovato applicazione nella piattaforma AI & AR , aiutando gli utenti a svolgere allenamenti muniti di occhiali intelligenti. VPR consente la localizzazione dei tirocinanti sul posto di lavoro, lanciando tutorial e guide appropriati assegnati a punti particolari, migliorando la sicurezza e riducendo la necessità di supervisione diretta.
Progetto cofinanziato da fondi dell’Unione Europea nell’ambito dei Fondi Europei di Sviluppo Regionale nell’ambito del Programma Operativo Crescita Intelligente. Progetto realizzato nell’ambito del Centro Nazionale Ricerca e Sviluppo: Fast Track.