Ri-identificazione delle persone attraverso dati sanitari indossabili e apprendimento automatico
 

Un nuovo tipo di attacco alla privacy basato su dati sanitari indossabili è stato identificato dai ricercatori dell’Università del Massachusetts Lowell. L’attacco di reidentificazione della persona (PRI-Attack) utilizza dati conformi allo standard HIPAA e pubblicamente disponibili da dispositivi indossabili per la salute per stabilire l’identità degli individui dai dati sulla frequenza cardiaca, sulla respirazione e sui gesti delle mani, tra gli altri.

La vulnerabilità è resa possibile negli Stati Uniti dal fatto che l’Health Insurance Portability and Accountability Act (HIPAA), pur richiedendo che i dati medici rimangano anonimi, non considera i dati grezzi dei sensori (come la temperatura della pelle e i dati dell’accelerometro (ACC)) come essendo sensibile alla privacy, e quindi non richiede che i dati condivisi pubblicamente di questo tipo siano crittografati o soggetti alle stesse protezioni generali che offre alle forme tradizionali di dati dei pazienti, come le cartelle cliniche.

Dal vettore al visual
Un attacco PRI utilizza dati di immagine interpretati per discernere modelli comuni correlati ad altri tipi di dati sanitari. La risposta della pelle di una persona, ad esempio, può essere valutata da video (fotopletismografia) e correlata a quelle che dovrebbero essere informazioni vettoriali completamente anonime provenienti da dispositivi di monitoraggio della salute come orologi indossabili e altri tipi di apparecchi di monitoraggio. La fotopletismografia fornisce dati sulla frequenza cardiaca, che possono essere associati a dati cardiaci indossabili non identificati.

Il riconoscimento dei gesti è un’altra “chiave” che può essere banalmente tradotta dai dati vettoriali in una matrice visiva che, ancora una volta, consente di correlare i dati di immagine/video interpretati alle informazioni dell’accelerometro apparentemente anonime nei dati sanitari.

Informazioni sui gesti delle mani dai dati indossabili. Fonte: https://arxiv.org/pdf/2106.11900.pdf
Dati del sensore come PII
La ricerca, dell’assistente professore di UML Mohammad Arif Ul Alam, sostiene che i dati di rilevamento fisiologici possono effettivamente costituire PII, ed è in effetti un analogo biologico delle tecniche di fingerprinting del browser che attualmente si ritiene possano minare nuove iniziative per proteggere la privacy degli utenti sul web.

Per testare l’ipotesi, il ricercatore ha sviluppato un quadro di riconoscimento e localizzazione dei gesti della mano che interpreta i dati dei gesti (movimento basato su vettori registrati) da un accelerometro indossabile e traduce i movimenti in una registrazione visiva che può essere correlata ai movimenti registrati dalla salute indossabile dispositivi.

È stata costruita una rete neurale siamese multimodale (mm-SNN) per interpretare le informazioni sui gesti classificate tramite Support Vector Machine (SVM). Una rete si occupa delle informazioni vettoriali (interpretate come informazioni di immagine in uno spazio 3D) e la seconda rete tratta dei dati fisiologici registrati dai dati dei sensori.

 

test
Il sistema è stato testato su vari set di dati, tra cui un ‘Gamer’s Fatigue Dataset’ ottenuto raccogliendo dati su cinque studenti volontari, di età compresa tra 19 e 25 anni, che hanno giocato ai videogiochi per sette giorni indossando il braccialetto Empatica E4 . L’orologio è dotato di sensori ACC, contesto elettrodermico (EDA), temperatura cutanea e fotopletismografia (PPG).

L’E4 è stato utilizzato anche in un nuovo set di dati “dati ristorante”, in cui otto volontari hanno preparato e mangiato panini per venti minuti, e in un set di dati “anziani”, in cui 22 soggetti più anziani, di età compresa tra 75 e 95 anni, hanno eseguito 13 attività script mentre indossavano l’orologio.

Infine, i ricercatori hanno utilizzato il “Set di dati sulla fatica degli adulti sani” disponibile al pubblico , che ha monitorato 28 uomini e donne sani con un’età media di 42 anni per 1-219 giorni consecutivi mentre indossavano un dispositivo indossabile multisensore ampiamente simile alle capacità di raccolta dati del E4, incluso un ACC a 3 assi, un elettrodo di risposta galvanica della pelle, sensori di temperatura e foto e un barometro.

I risultati indicano che la frequenza cardiaca e la frequenza respiratoria sono i mezzi più sicuri per la reidentificazione, con un tasso di precisione medio superiore al 66%.

Risultati del test della metodologia PRI-Attack. Culla: PPG: fotopletismografia; FC: frequenza cardiaca; BR: frequenza respiratoria; PVP: Blood Volume Pulse (ottenuto da PPG); IBI: Inter Beat Interval (ottenuto da PPG); TC : Componente tonica del segnale EDA; Componente fasica dei dati EDA (Ibid); Temperatura: temperatura.
La ricerca conclude:

“Mentre la moderna tecnologia di visione artificiale può essere facilmente utilizzata per apprendere i gesti delle mani e il corrispondente segnale fisiologico (frequenza cardiaca, frequenza respiratoria) dalla telecamera di sorveglianza pubblica, questa enorme quantità di video registrati può essere facilmente utilizzata dagli aggressori per apprendere la biometria specifica dell’utente da rivelare identità da HIPPA conforme servire i dati di rilevamento indossabili memorizzati.’

HIPAA considera i dati PHR “anonimizzati per impostazione predefinita”
Il governo degli Stati Uniti ha riconosciuto la crescita delle cartelle cliniche personali (PHR) e classifica tale record (compresi i dati dei dispositivi indossabili sanitari) come “un record elettronico delle informazioni sanitarie di un individuo mediante il quale l’individuo controlla l’accesso alle informazioni e può avere il capacità di gestire, monitorare e partecipare alla propria assistenza sanitaria”.

Tuttavia, trattandosi di un fenomeno del settore privato, il governo non concede alcun controllo ufficiale su tali dati, avendo stabilito che non contengono informazioni di identificazione personale (PII). Un rapporto del giugno 2016 sulle entità HIPAA non coperte dal Dipartimento della salute e dei servizi umani degli Stati Uniti afferma:

‘[Grandi] lacune nelle politiche in materia di accesso, sicurezza e privacy continuano e persiste la confusione sia tra i consumatori che tra gli innovatori. I fitness tracker indossabili, i social media sanitari e le app mobili per la salute si basano sull’idea del coinvolgimento dei consumatori. Tuttavia, le nostre leggi e normative non hanno tenuto il passo con queste nuove tecnologie.’

Di ihal