In quest’ultimo discorso del giorno 01 di Computer Vision DevCon 2020 , Brandon Gilles , CEO di Luxonis, ha spiegato la prima piattaforma di intelligenza artificiale spaziale integrata al mondo: OpenCV AI Kit (OAK). La piattaforma di intelligenza artificiale spaziale integrata offre un’immensa capacità di imitare la percezione a livello umano nelle applicazioni. Ciò è essenziale per la percezione specifica e le attività di interazione che convenzionalmente potrebbero essere risolte solo da una persona possono ora essere eseguite da sistemi incorporati.

Questo discorso inizia con la spiegazione di OAK-1 e OAK-D e spiega ulteriormente come il kit OpenCV AI abbia due occhi per far emergere la percezione della profondità, in particolare la distanza. Caso in questione: il sistema ora è in grado di identificare rapidamente una cipolla buona da una cattiva su un nastro trasportatore e rigettarla nel campo.


Secondo il relatore, OAK-D ha una fotocamera 4K integrata con 12 megapixel, che è considerata una risoluzione molto alta con capacità elevate e ottiche fantastiche. Inoltre, ha un otturatore globale avanzato sincronizzato con una risoluzione di 1280 x 800 e una profondità stereo di un megapixel, insieme a un processore AI. Tali capacità sono utili nella creazione di applicazioni robotiche in cui il sistema cerca di imitare la percezione degli esseri umani ma in piccoli dispositivi.

Oltre ad esso viene fornito con 20 processori dedicati per il rilevamento della profondità stereo, DeWarp, rilevamento dei bordi, rilevamento della linea e tutte le altre comuni stime di movimento per la sottrazione dello sfondo; e 16 processori progettati esplicitamente per l’elaborazione visiva. Ciò consentirà agli utenti di eseguire il proprio codice vettorizzato.


“La struttura del prodotto di questo OAK-D è progettata per essere modulare, il che sconvolgerà il mercato, rivoluzionerà la tecnologia e verrà utilizzato in tutti i modi diversi che non possiamo immaginare”, ha affermato Gilles .

OAK-D viene fornito con tre telecamere standard, con cavo piatto flessibile (da 6 pollici tirato a 12 pollici) che si può personalizzare con una linea di bassi stereo, dove alcune persone li usano per mettere le telecamere vicine. Al contrario, altre persone li useranno per metterli lontani.

Inoltre, il sistema è dotato di tracciamento degli oggetti in 3D con ID univoci, funzione di zoom lossless basata sul movimento automatico, stima del movimento e codifica JPEG e MPEG.

Differenza tra OAK-1 e OAK-D
OAK-1 viene fornito con una fotocamera intelligente con inferenza neurale in tempo reale, mentre OAK-D viene fornito con una fotocamera intelligente con inferenza neurale in tempo reale e percezione della profondità.
OAK-1 viene fornito con una fotocamera integrata USB3C; D’altra parte, OAK-D è dotato di alimentazione tramite una telecamera modulare ethernet.


In termini di specifiche della fotocamera, OAK-1 ha una fotocamera a colori con 4056 x 3040 pixel, mentre OAK-D ha 1280 x 800 pixel.
Mentre il campo visivo di OAK-1 è 81 DFOV – 68,8 HFOV, OAK-D ha 71,8 HFOV.
Casi d’uso
Sebbene possa essere utilizzato per una varietà di applicazioni, il miglior uso di questo sistema, finora, è stato quello di costruire una pipeline di visione artificiale per le persone con problemi di vista. Il sistema consente agli ipovedenti e ai completamente ciechi di percepire il mondo in tempo reale attraverso un audio sagomato, noto anche come ecolocalizzazione think aided.


“Quindi una persona completamente cieca può iniziare ad allenarsi utilizzando la neuroplasticità e può allenare il lobo occipitale per estrarre informazioni dalle orecchie”, ha detto Gilles. “Ora possono visualizzare il mondo sfruttando la visione artificiale, che può produrre i suoni che poi danno al cieco la visualizzazione, proprio come una persona vedente.”


Il secondo caso d’uso è l’agricoltura di precisione, in cui la robotica è stata impiegata per percepire, raccogliere, quantizzare e selezionare la maturità durante il processo e altre metriche in frutta e verdura. Qui avere informazioni spaziali agisce come un aspetto critico.

Spiegando questo Gilles ha affermato: essere in grado di eseguire la raccolta automatizzata delle fragole, l’ordinamento a costo zero con un braccio robotico, l’utilizzo del modello neurale per stimare la maturità e il rilevamento delle erbe infestanti nella fattoria possono avere un enorme valore aziendale, oltre ad aumentare le entrate. Inoltre, ciò consentirà agli agricoltori di fare agricoltura biologica con l’aiuto di un’intelligenza artificiale spaziale incorporata a basso costo non solo per uccidere i parassiti con i laser, ma anche per controllare l’uso dei pesticidi nella fattoria.

In terzo luogo, c’è il fattore salute e sicurezza, che è estremamente critico nell’attuale era COVID. Il sistema dimostra la consapevolezza spaziale in tempo reale basata sull’IA per le soluzioni di sicurezza, inclusa l’identificazione in tempo reale della posizione delle persone nel mantenere le distanze sociali.


“Quindi, sia che si tratti di pulire con robot UV o di monitorare le distanze sociali, con l’intelligenza artificiale spaziale, gli utenti possono vedere dall’alto le singole persone che mantengono gli standard sociali”, ha concluso Gill.

Di ihal