Con una certa regolarità, le informazioni sensibili trovano la loro strada negli smartphone e in altri dispositivi mobili. Gran parte proviene dalle stime di 3,2 miliardi di immagini caricate ogni giorno: le persone fanno screenshot di documenti come biglietti, moduli fiscali e prescrizioni mediche senza pensarci due volte. Ciò li rende suscettibili a rischi come il furto di identità e il ransomware, tra gli altri problemi. Solo nel 2019, 14,4 milioni di consumatori sono diventati vittime di frodi sull’identità, ovvero circa 1 persona su 15.
Nel tentativo di affrontare questo problema, i data scientist di NortonLifeLock Labs , la divisione di ricerca e sviluppo del fornitore di antivirus NortonLifeLock, ha rilasciato un’app iOS basata su AI progettata per proteggere le foto sensibili di passaporti, tessere di previdenza sociale, password, carte di credito e altro. Chiamato Xposure, identifica le immagini sensibili, le copia in un deposito protetto ed elimina gli originali o li sostituisce con segnaposto sfocati.
“A seconda del dispositivo e del tipo di foto, possiamo scansionare circa 1.000 immagini al minuto con un numero minimo di falsi positivi”, ha dichiarato a VentureBeat Dan Marino, direttore tecnico di NortonLifeLock, tramite e-mail. “Il problema principale da risolvere di Xposure è la privacy, che include anche la privacy di Norton. Questo è il motivo principale per cui i modelli di machine learning che abbiamo addestrato vengono eseguiti sul dispositivo dell’utente e le immagini e i dati dell’utente non vengono mai condivisi con noi “.
Secondo Marino, il team di ricerca di NortonLifeLock ha dovuto affrontare quattro sfide principali durante lo sviluppo di Xposure. I modelli di intelligenza artificiale che alimentano l’app dovevano essere addestrati su immagini stock che non contenevano informazioni di identificazione personale, un compito difficile dato che non c’era un numero sufficiente di immagini per addestrare i modelli da zero. Per motivi di privacy, tutta l’inferenza dell’IA doveva essere eseguita sui dispositivi degli utenti anziché nel cloud. E, cosa più importante, i modelli dovevano raggiungere velocità di elaborazione e precisione elevate. Poiché la maggior parte dei classificatori di immagini basati su AI lavora su immagini a bassa risoluzione, tendono a contrassegnare qualsiasi immagine con le stesse caratteristiche generali, portando a falsi positivi.
Il cuore di Xposure è il suo motore di rilevamento sul dispositivo, che determina se un’immagine è sensibile o meno utilizzando una combinazione di classificatori basati su reti neurali convoluzionali e riconoscimento ottico dei caratteri (OCR). Nell’apprendimento automatico, le reti neurali convoluzionali sono una classe di algoritmi più comunemente applicata all’analisi delle immagini visive.
“La rete neurale convoluzionale separa le immagini in categorie sensibili e non sensibili in base a caratteristiche visive generali”, ha spiegato Marino. “L’abbiamo costruito utilizzando il transfer learning, una tecnica che richiede una rete neurale costruita per risolvere un compito e la riqualifica leggermente, spesso con molti meno dati, per svolgere un’attività diversa. L’aumento dei dati sintetici ha aiutato a creare più dati di addestramento grazie alla variazione degli angoli, della luminosità e dello zoom delle immagini stock [che abbiamo utilizzato per addestrare il modello]. “
Nel frattempo, il componente OCR del motore di Xposure identifica il testo nelle immagini e le parole chiave che corrispondono a documenti come “Passaporto”, “Data di emissione” e “Data di nascita”. A differenza di un classificatore visivo, l’OCR richiede immagini ad alta definizione, il che causa un rallentamento non solo a causa dell’aumento dell’elaborazione, ma perché i telefoni spesso memorizzano solo copie a bassa risoluzione delle immagini per risparmiare spazio. Per applicare l’OCR, Xposure deve scaricare l’originale ad alta risoluzione dal cloud, motivo per cui il motore utilizza l’OCR solo se la rete neurale convoluzionale rileva che è probabile che un’immagine sia sensibile.
“L’OCR non funziona in modo accurato se l’immagine è inclinata o capovolta e Xposure utilizza intelligenza per identificare quando l’OCR deve essere eseguito da orientamenti diversi”, ha detto Marino.
In un controllo finale, Xposure presenta le immagini contrassegnate come sensibili dal classificatore ma non OCR agli utenti per la revisione come potenzialmente sensibili, in modo che possano aggiungerle manualmente al vault. È possibile accedere alle immagini originali solo tramite il vault, protetto da password e crittografato, oppure selezionando il segnaposto e rimuovendolo tramite un’apposita estensione dell’app.
Marino afferma che l’approccio ibrido di Xposure raggiunge un basso tasso di falsi positivi – circa lo 0,75% – mitigando la sensibilità del componente OCR alle lingue che non riconosce.
Separato dal vault, Xposure offre una funzione chiamata PhotoBlur, che crea una versione sfocata di una foto quando un utente la trova nella propria libreria di foto. Toccando e tenendo premuto sullo schermo si rivela la foto originale, non sfocata, offrendo un equilibrio tra protezione e facilità d’uso.
“Abbiamo urgentemente bisogno di una soluzione che rilevi le immagini sensibili e private sui nostri telefoni e le nasconda da spettatori curiosi, hacker e app con bug. La situazione è solo peggiorata durante la pandemia, perché la maggior parte degli affari è condotta online e le persone sono costrette a fare clic e condividere documenti sensibili attraverso i loro telefoni “, ha detto Marino. “Riteniamo che Xposure rispetti la visione di NortonLifeLock per proteggere e consentire alle persone di vivere la loro vita digitale in sicurezza e fornisce ai clienti una soluzione innovativa per mantenere private le loro foto private”.