Sensore Kinect: lo strumento di intelligenza artificiale AI che non sapevi di avere

Molte volte non conosciamo la tecnologia che abbiamo a portata di mano. Smartphone, tablet, televisori e altri dispositivi elettrici di uso quotidiano nelle nostre vite quotidiane sono strumenti straordinariamente potenti. Cosa c’è dietro la tecnologia o il dispositivo? Oggi parlerò del sensore Microsoft Kinect.

Cos’è il sensore Kinect?
Il sensore Kinect è stato progettato per cambiare il modo di giocare con le console di gioco nelle case. È stato il primo dispositivo che ci ha permesso di utilizzare una console, senza il contatto diretto con un controller. Solo attraverso i suoi sistemi visivi siamo in grado di controllare le funzionalità del dispositivo.

È stato lanciato nel 2009, all’Electronic Entertainment Expo 2009. Il suo nome originale era “Project Natal”. Può essere definito un controller di gioco e intrattenimento gratuito e il suo creatore è stato Alex Kipman. Microsoft ha deciso di svilupparlo per la console di gioco Xbox 360 .

Nel 2011 è uscita la seconda versione per PC con Windows 7 e Windows 8. La caratteristica che lo rende diverso è la capacità di riconoscere gesti, comandi vocali e oggetti nelle immagini.

È una tecnologia innovativa, dietro la quale c’è una combinazione di telecamere, microfoni e software. Tutto questo è contenuto in Kinect.

Videocamera a colori RGB . Funziona come una webcam, catturando immagini su video. Il sensore Kinect utilizza queste informazioni per ottenere dettagli su oggetti e persone nella stanza.

-IR emettitore. L’emettitore a infrarossi è in grado di proiettare la luce a infrarossi in una stanza. Quando la luce infrarossa colpisce una superficie, il motivo risulta distorto. Questa distorsione viene letta grazie al suo altro componente, una videocamera di profondità.

-Camera di profondità . Analizza i modelli a infrarossi emessi dall’emettitore ed è in grado di costruire una mappa 3D della stanza e di tutti gli oggetti e le persone al suo interno.

-Microfono impostato . Il sensore Kinect ha quattro microfoni di precisione integrati in grado di determinare da dove provengono i suoni e le voci. È anche in grado di filtrare il rumore di fondo.

-Inclinazione del motore . Questo motore ha la capacità di regolare sulla base, il sensore Kinect. È in grado di rilevare le dimensioni della persona davanti, di regolare su e giù come appropriato.

Tutto viene perfettamente assemblato su una barra orizzontale di circa 28 cm, su una base quadrata arrotondata dove riposa.
Un primo piano di una descrizione del dispositivo generata automaticamente

Ma ciò che equipaggia davvero questo dispositivo di intelligence è il software. Kinect è in grado di acquisire un’incredibile quantità di dati. Stabilisci sempre il tuo obiettivo sulle cose che si muovono nel tuo ambiente. Grazie al trattamento di questi dati attraverso un algoritmo di intelligenza artificiale e metodi di apprendimento automatico, Kinect può mappare i dati visivi che ottiene attraverso i suoi sensori.

L’obiettivo è essere in grado di rilevare gli esseri umani e capire in quale posizione si trova ciascuna persona rilevata.

Software del sensore Kinect
Una volta che i sensori acquisiscono le informazioni, vengono immediatamente elaborati dal software di intelligenza artificiale. È in grado di classificare i diversi oggetti che si trovano all’interno di una scena. Riconosce gli umani per la testa e gli arti.

Kinect comprende come si muove un essere umano e presuppone, ad esempio, che non siamo in grado di girare la testa a 360 ° e altre azioni impossibili che possiamo compiere. Questo è molto semplice per noi, ma per una macchina comporta un lungo periodo di apprendimento.

Questo tipo di apprendimento è noto come machine learning. Consiste nell’analizzare un’enorme quantità di dati della vita reale, per trovare modelli. È così che impariamo gli esseri umani, basati sull’osservazione e l’apprendimento.

Kinect cattura il movimento delle persone attraverso oltre 48 punti di articolazione. Questo viene fatto attraverso un algoritmo abbastanza complesso, che tiene conto di più fattori. Quindi, come funziona?

Costruisci un’immagine di profondità attraverso l’emettitore IR e la videocamera di profondità. Questo viene fatto mediante triangolazione, proprio come quando si calcolano le stelle di distanza sono al di fuori del sistema solare.
Rileva le parti del corpo di una persona. Questo viene fatto usando un albero decisionale. I modelli per prendere quelle decisioni sono stati ottenuti nella fase di apprendimento con oltre un milione di esempi.
Questa è una scorciatoia per come funziona l’algoritmo. Dietro tutto ciò c’è una base matematica molto ampia. Vengono utilizzate probabilità e statistiche, calcoli multivariati, algebra lineare, analisi complesse, algoritmi grafici, geometria, equazioni differenziali, topologia, ecc.

Crea il tuo progetto con Kinect
Esistono diverse alternative quando si utilizza Kinect nei nostri progetti. Il migliore e il migliore sarebbe lavorare con l’SDK che Microsoft offre agli sviluppatori.

Esistono due SDK a seconda della versione di Kinect in uso. Versione 1.8 per Kinect v1 e versione 2.0 per Kinect v2.

È possibile sviluppare applicazioni con Kinect in Visual Studio con le lingue native di Microsoft C # e Visual Basic.

Sensore Kinect: lo strumento di intelligenza artificiale AI che non sapevi di avere

Diihal

Di ihal

Articoli correlati

KAIST, MIT e Microsoft sviluppano Upsample Anything per migliorare la visione artificiale riducendo il consumo di memoria GPU

KAIST sviluppa un sistema di raffreddamento a liquido per chip AI con efficienza oltre dieci volte superiore al precedente record

Alibaba presenta Qwen-Robot-Suite con modelli dedicati a manipolazione, simulazione del mondo e navigazione autonoma

Ultimi Post

NVIDIA presenta ENPIRE, un sistema in cui i robot apprendono autonomamente nuovi compiti attraverso esperimenti nel mondo reale

Anthropic analizza 400.000 sessioni di Claude Code e scopre che la competenza nella professione conta più della capacità di programmare

HappyScribe trasforma audio e video in trascrizioni, sottotitoli e contenuti multilingua con AI e revisione umana

OpenAI introduce Deployment Simulation per prevedere i rischi dei modelli AI prima del rilascio