Determinazione dell’intossicazione con l’analisi dell’apprendimento automatico degli occhi
Ricercatori provenienti da Germania e Cile hanno sviluppato un nuovo framework di apprendimento automatico in grado di valutare se una persona è ubriaca, sulla base di immagini a infrarossi dei suoi occhi.
La ricerca è finalizzata allo sviluppo di sistemi in tempo reale “fitness for duty” in grado di valutare la prontezza di un individuo a svolgere compiti critici come guidare o utilizzare macchinari, e utilizza un nuovo rilevatore di oggetti addestrato ai graffi in grado di individuare componenti dell’occhio di un soggetto da una singola immagine e valutarli rispetto a un database che include immagini di occhi intossicati e non intossicati.
Inizialmente il sistema acquisisce e individua un’immagine di ciascun occhio con il framework di rilevamento degli oggetti You-Only-Look-Once ( YOLO ). Successivamente, vengono utilizzate due reti ottimizzate per scomporre le immagini oculari in regioni semantiche: la rete di attenzione Criss Cross (CCNet) rilasciata nel 2020 dalla Huazhong University of Science and Technology e l’ algoritmo di segmentazione DenseNet10 , anch’esso sviluppato da molti dei ricercatori del nuovo articolo in Cile.
I due algoritmi utilizzano rispettivamente solo 122.514 e 210.732 parametri: un esborso frugale, rispetto ad alcuni dei set di funzionalità più grandi in modelli simili, e in controtendenza rispetto alla tendenza generale verso volumi di dati più elevati nei framework ML.
Banca dati degli ubriachi
Per informare il quadro di apprendimento automatico, i ricercatori hanno sviluppato un database originale con 266 soggetti intossicati e 765 soggetti sobri.
Campioni dal database ottenuto di soggetti intossicati e non intossicati.
I soggetti dovevano stare di fronte a due telecamere Iritech originarie , la gamma Gemini/Venus, per affrontare il dispositivo e per essere ripresi sobri. Successivamente hanno consumato 200 ml di alcol e sono stati nuovamente catturati a intervalli di 15 minuti mentre i loro livelli di alcol nel sangue aumentavano, fino alla sessione finale a 60 minuti dal consumo dell’alcol.
Questo ha prodotto 21.309 immagini, che sono state poi annotate usando la libreria Python imgaug .
Preparare i dati per il mondo reale
Non si trattava di un flusso di lavoro altamente automatizzato, nonostante gli strumenti avanzati utilizzati: l’etichettatura manuale delle immagini oculari è stata descritta dai ricercatori come “un processo molto impegnativo e dispendioso in termini di tempo” e ha richiesto più di un anno .
I dati sono stati aumentati in modo aggressivo con una serie di metodi progettati per degradare e sfidare il sistema, replicando possibili condizioni del mondo reale, inclusi fiocchi di neve, rumore di Poisson (per simulare il degrado del sensore in condizioni di scarsa illuminazione), sfocatura, schizzi ed effetti della pioggia. Inoltre, l’uso della cattura a infrarossi elimina la necessità di condizioni di illuminazione ideali, che non possono essere garantite in implementazioni economiche e pratiche.
Questo lavoro estenuante alla fine ha dato i suoi frutti con un livello di precisione del 98,60% per la cattura e la segmentazione degli occhi.
Segmentazione dell’iride con il metodo dei minimi mezzi quadrati.
test
Il framework di segmentazione è stato testato con cinque piattaforme: Osiris , DeepVOG , DenseNet10 (vedi sopra), CCNet (vedi sopra) e Grand-Mean . In tutti i casi, l’analisi ha dimostrato risultati positivi nel correlare la dilatazione della pupilla al livello di ubriachezza, sebbene un approccio ibrido che utilizza DenseNet e CCNet si sia dimostrato il più efficace.
I ricercatori anticipano che il loro lavoro può eventualmente essere incorporato in un sensore dell’iride NIR standard e notano che lo sforzo erculeo di produrre il database degli occhi intossicati che contribuisce è un probabile vantaggio per questo settore della ricerca biometrica.
Test di intossicazione industriale e dei consumatori attraverso la valutazione degli occhi
La nuova ricerca si basa su una notevole letteratura precedente, incluso un documento seminale del 2015 di ricercatori in Brasile e negli Stati Uniti, che proponeva un metodo sistematico e razionalizzato per valutare l’intossicazione dalla risposta pupillare. I ricercatori di quel documento hanno osservato che l’alcol riduce l’efficienza cerebrale e altera la visione notturna di un fattore del 25% e il tempo di reazione del 30%, con livelli di gravità variabili in base ai livelli di tolleranza dell’individuo.
Il problema principale per la diffusione di tali tecnologie è la portabilità. Già nel 2003, la società di ricerca britannica Hampton Knight ha offerto un sistema per la valutazione dell’intossicazione attraverso l’analisi degli occhi, anche se all’epoca costava £ 10.000.
Uno studio preliminare del 2012 condotto a New Delhi e negli Stati Uniti ha anche esplorato la possibilità di utilizzare tecniche sistematiche di intelligenza artificiale per ricavare un punteggio di intossicazione dalle immagini oculari, sebbene con meno successo rispetto alla ricerca attuale. Questo studio ha anche contribuito con un prezioso set di dati (IITD Iris Under Alcohol Influence) al corpus di lavori in questo campo.
Tuttavia, le recenti innovazioni nell’edge computing e le risorse hardware ottimizzate per l’apprendimento automatico mobile aprono il campo a molte più applicazioni mobili di controlli pre-attività per l’intossicazione, inclusi sensori in auto che potrebbero potenzialmente aggiungere controlli dell’iride ai metodi attuali che sono di interesse al framework Driver Alcohol Detection System for Safety ( DADSS ) in fase di sviluppo negli Stati Uniti, che fino ad oggi si è basato su sensori di alcol cutaneo e sulla valutazione dell’aria di bordo per i vapori di alcol.
Un rapporto del 2020 ha stimato che l’adozione di tecnologie di questo tipo potrebbe salvare 11.000 vite all’anno solo negli Stati Uniti.