Antoine Tardif
Il governo del Regno Unito ha arruolato Palantir , una società statunitense di big data fondata da Peter Thiel e Faculty , una startup specializzata nella strategia di scienza dei dati professionale, software e formazione delle competenze per combattere la diffusione di COVID-19. Sebbene ciò possa mobilitare la preoccupazione per le questioni relative alla privacy, va notato che la raccolta di dati di grandi dimensioni, compresi i dati sulla salute privata della popolazione generale, è necessaria per consentire ai governi di prendere decisioni informate su come arrestare la diffusione di COVID-19, discernere quali membri della società sono più vulnerabili e scopri quali opzioni di trattamento sono le più efficaci.
Palantir comprende che esiste un motivo di preoccupazione per la privacy degli utenti, motivo per cui hanno rilasciato uno schema delle loro migliori pratiche per l’utilizzo dei dati durante una crisi. Palantir ha dichiarato: “Saper applicare con competenza la scienza dei dati alla giusta serie di problemi servirà come risorsa fondamentale per aumentare e migliorare le strategie globali per combattere questa crisi della salute pubblica” , questo è innegabilmente vero.
Hanno anche affermato quanto segue, che è un riconoscimento della società a rischio precario che intraprende l’accesso a questo tipo di condivisione dei big data: “Le fonti di dati ricchi spesso ispirano analisi impreviste – persino canaglia -. Stabilire e applicare regole di base collettive su come i dati dovrebbero essere utilizzati e chi dovrebbe avere quali livelli di accesso e utilizzo dei dati. L’uso improprio dei dati può provocare sfiducia pubblica nelle istituzioni. Anche il più ben intenzionato dei risolutori di problemi a volte è accecato dai rischi delle soluzioni che creano. “
Che tipo di dati sta raccogliendo il governo del Regno Unito? Attualmente, i dati appropriati necessari per affrontare la sfida COVID-19. Secondo quanto riportato da Guardian , gli attuali dati anonimi comprendono genere, informazioni sanitarie protette, risultati dei test Covid-19, contenuti delle chiamate delle persone al Servizio sanitario nazionale (NHS), linea di consulenza sanitaria 111 e informazioni cliniche su coloro che si trovano in terapia intensiva.
Mentre la privacy dei dati dovrebbe essere anonima in modo che non possa mai essere rintracciata a un individuo specifico, abbiamo bisogno di questi dati per l’ analisi dei sistemi di apprendimento automatico . I sistemi di apprendimento profondo utilizzano questo tipo di big data per identificare schemi e punti di dati trascurati dagli umani. Qualcosa di banale come il genere, può rivelare importanti intuizioni, un esempio potrebbe essere che gli uomini diabetici sono un segmento più vulnerabile della popolazione rispetto alle donne diabetiche. Alcune opzioni di trattamento possono funzionare meglio per diverse fasce di età, generi, background genetico, ecc.
Invece di essere diffamati, dovremmo dare al governo del Regno Unito il beneficio del dubbio. Questo tipo di raccolta dei dati e gli sforzi di condivisione dei dati da parte di tutti gli aspetti del sistema sanitario, dovrebbero essere mantenuti a lungo termine. Questo potrebbe servire in futuro sia per combattere future pandemie, sia per problemi di salute regolari, cancro e altri disturbi fisiologici.
Attualmente, il progetto utilizza uno “pseudo numero NHS” per abbinare set di dati di grandi dimensioni, tra cui un indice paziente principale, una risorsa NHS esistente che utilizza “dati di marketing sociale” per segmentare la popolazione britannica in diversi “tipi” a livello familiare. Anche se resta da vedere se questo è il metodo di distribuzione dei dati più efficace, ci preoccupiamo di alcuni aspetti del processo di raccolta dei dati.
Attualmente vengono raccolti i dati sulla posizione del telefono. Sebbene possa essere appropriato restringere i dati a un codice postale, non è necessario individuare direttamente la fonte esatta della telefonata, poiché queste informazioni non possono essere rese anonime o randomizzate. Ciò potrebbe far temere alle persone malate di usare la linea telefonica e ciò potrebbe comportare morti non necessarie da parte di coloro che hanno più bisogno di aiuto.
I cittadini britannici dovrebbero essere allarmati riguardo al punto dati di localizzazione del telefono che non è necessario per addestrare efficacemente un algoritmo di apprendimento profondo ma che può essere utilizzato direttamente per tracciare un individuo.
Se il governo del Regno Unito dovesse continuare nel suo percorso per raccogliere questo tipo di big data e risolvere i problemi sopra descritti, nonché altri problemi di privacy / diritti degli utenti di cui non siamo a conoscenza, potrebbe essere opportuno che il Regno Unito richieda l’assistenza dell’Unione europea per raccogliere punti dati simili dalle rispettive popolazioni. Dopotutto, quanto funziona il deep learning è tanto più dati vengono raccolti, tanto più efficace è l’algoritmo. Ciò farebbe molto per colmare le nazioni dopo la chiusura dei confini internazionali.
Chiediamo un’attenta analisi e l’assistenza di un’entità senza scopo di lucro per garantire che il governo del Regno Unito non abusi delle informazioni che raccoglie. Tuttavia, si dovrebbe riconoscere che questo è un passo importante verso la lotta contro COVID-19.