Il nuovo modello di intelligenza artificiale può aiutare a prevenire violazioni dei dati dannose e costose
Questa è la prima volta che l’IA viene utilizzata per scoprire automaticamente le vulnerabilità in questo tipo di sistema, esempi dei quali sono utilizzati da Google Maps e Facebook.
Gli esperti, del Computational Privacy Group dell’Imperial , hanno esaminato gli attacchi ai sistemi basati su query (QBS) – interfacce controllate attraverso le quali gli analisti possono interrogare i dati per estrarre utili informazioni aggregate sul mondo. Hanno quindi sviluppato un nuovo metodo abilitato all’intelligenza artificiale chiamato QuerySnout per rilevare gli attacchi a QBS.
QBS offre agli analisti l’accesso a raccolte di statistiche raccolte da dati a livello individuale come posizione e dati demografici. Attualmente sono utilizzati in Google Maps per mostrare informazioni in tempo reale su quanto è occupata un’area, o nella funzione di misurazione dell’audience di Facebook per stimare le dimensioni del pubblico in una determinata località o demografica per aiutare con le promozioni pubblicitarie.
Nel loro nuovo studio, pubblicato nell’ambito della 29a conferenza ACM sulla sicurezza informatica e delle comunicazioni , il team, tra cui Ana Maria Cretu del Data Science Institute , il dottor Florimond Houssiau , il dottor Antoine Cully e il dottor Yves-Alexandre de Montjoye , hanno scoperto che attacchi potenti e accurati contro QBS possono essere facilmente rilevati automaticamente premendo un pulsante.
Secondo l’autore senior, il dottor Yves-Alexandre de Montjoye: “Finora gli attacchi sono stati sviluppati manualmente utilizzando competenze altamente qualificate. Ciò significa che ci è voluto molto tempo per scoprire le vulnerabilità, il che lascia i sistemi a rischio.
“OuerySnout sta già superando gli umani nello scoprire le vulnerabilità nei sistemi del mondo reale”.
La necessità di sistemi basati su query
La nostra capacità di raccogliere e archiviare dati è esplosa nell’ultimo decennio. Sebbene questi dati possano aiutare a guidare i progressi scientifici, la maggior parte di essi sono personali e quindi il loro utilizzo solleva seri problemi di privacy, protetti da leggi come il Regolamento generale sulla protezione dei dati dell’UE.
Pertanto, consentire ai dati di essere utilizzati per sempre preservando il nostro diritto fondamentale alla privacy è una domanda tempestiva e cruciale per i data scientist e gli esperti di privacy.
QBS ha il potenziale per consentire l’analisi dei dati anonimi a tutela della privacy su larga scala. In QBS, i curatori mantengono il controllo sui dati e quindi possono controllare ed esaminare le domande inviate dagli analisti per assicurarsi che le risposte restituite non rivelino informazioni private sugli individui.
Tuttavia, gli aggressori illegali possono aggirare tali sistemi progettando query per dedurre informazioni personali su persone specifiche sfruttando vulnerabilità o bug di implementazione del sistema.
Testare il sistema
I rischi di forti attacchi “zero-day” sconosciuti in cui gli aggressori sfruttano le vulnerabilità nei sistemi hanno bloccato lo sviluppo e l’implementazione di QBS.
Per testare la robustezza di questi sistemi, in modo simile ai test di penetrazione nella sicurezza informatica, è possibile simulare attacchi di violazione dei dati per rilevare perdite di informazioni e identificare potenziali vulnerabilità.
Tuttavia, la progettazione e l’implementazione manuale di questi attacchi contro QBS complessi è un processo difficile e lungo.
Pertanto, affermano i ricercatori, limitare il potenziale di forti attacchi non mitigati è essenziale per consentire a QBS di essere implementato in modo utile e sicuro preservando i diritti individuali alla privacy.
QuerySnout
Il team Imperial ha sviluppato un nuovo metodo abilitato all’intelligenza artificiale chiamato QuerySnout che funziona imparando quali domande porre al sistema per ottenere risposte. Impara quindi a combinare automaticamente le risposte per rilevare potenziali vulnerabilità della privacy.
Utilizzando l’apprendimento automatico, il modello può creare un attacco costituito da una raccolta di query che combina le risposte per rivelare una particolare informazione privata. Questo processo è completamente automatizzato e utilizza una tecnica chiamata “ricerca evolutiva” che consente al modello QuerySnout di scoprire i giusti set di domande da porre.
Ciò avviene in una “scatola nera”, il che significa che l’IA ha solo bisogno di accedere al sistema ma non ha bisogno di sapere come funziona il sistema per rilevare le vulnerabilità.
La co-prima autrice Ana-Maria Cretu ha dichiarato: “Dimostriamo che QuerySnout trova attacchi più potenti di quelli attualmente conosciuti sui sistemi del mondo reale. Ciò significa che il nostro modello di intelligenza artificiale è migliore degli umani nel trovare questi attacchi”.
Prossimi passi
Attualmente, QuerySnout verifica solo un numero limitato di funzionalità. Secondo il dottor de Montjoye: “La sfida principale per il futuro sarà scalare la ricerca su un numero molto più ampio di funzionalità per assicurarsi che scopra anche gli attacchi più avanzati”.
Nonostante ciò, il modello può consentire agli analisti di testare la robustezza di QBS contro diversi tipi di attaccanti. Lo sviluppo di QuerySnout rappresenta un passo avanti fondamentale nella protezione della privacy individuale in relazione ai sistemi basati su query.
QuerySnout: Automating the Discovery of Attribute Interference Attacks against Query-Based Systems di AM Cretu, F. Houssiau, A. Cully e YA de Montjoye, pubblicato il 7 novembre 2022 negli atti della conferenza ACM SIGSAC del 2022 sulla sicurezza dei computer e delle comunicazioni.