Le aziende stanno raccogliendo quantità crescenti di dati, una tendenza che sta guidando lo sviluppo di strumenti analitici migliori e una sicurezza più rigorosa. Analisi e sicurezza stanno ora convergendo mentre il computing riservato si prepara a fornire un impulso critico all’intelligenza artificiale.
Intel ha investito molto nell’elaborazione confidenziale come un modo per espandere la quantità e i tipi di dati che le aziende gestiranno attraverso i servizi cloud. Secondo Intel Fellow Ron Perez, che lavora sull’architettura di sicurezza con Intel Data Center Group, la società ritiene che lo standard di sicurezza emergente consentirà alle aziende e alle grandi organizzazioni di esplorare nuovi modi per condividere i dati necessari per alimentare l’intelligenza artificiale e l’apprendimento automatico.
“Lo vediamo come uno sforzo a lungo termine”, ha detto Perez. “Ma il motivo per cui stiamo investendo è che ha il potenziale per essere un enorme cambiamento per il cloud e l’utility computing”.
L’elaborazione confidenziale è uno standard che sposta la privacy e la sicurezza basate su policy per implementare le protezioni a un livello tecnico più profondo. Utilizzando la crittografia che può essere sbloccata solo tramite le chiavi detenute dal client, l’elaborazione riservata garantisce che le aziende che ospitano dati e applicazioni nel cloud non abbiano modo di accedere ai dati sottostanti, sia che siano archiviati in un database o che passino attraverso un’applicazione.
Il concetto sta guadagnando slancio perché consente ai dati di rimanere crittografati anche mentre vengono elaborati e utilizzati nelle applicazioni. Poiché la società che ospita i dati non può accedervi, questo standard di sicurezza dovrebbe impedire agli hacker di acquisire dati non crittografati quando passano al livello dell’applicazione. In teoria, consentirebbe inoltre alle aziende di condividere dati, anche tra concorrenti, per eseguire controlli di sicurezza sui clienti ed eliminare le frodi.
Nell’agosto 2019, Intel è diventata uno dei membri fondatori del Confidential Computing Consortium , uno sforzo open source gestito dalla Linux Foundation che mira a sviluppare gli standard hardware e software necessari per un’ulteriore adozione. Aziende come IBM, Google e Microsoft hanno iniziato a mettere in evidenza il loro lavoro in questo settore come un modo per incoraggiare le grandi imprese, in particolare in aree come la finanza e l’assistenza sanitaria, a mettere più dati sensibili nel cloud.
Il futuro della sicurezza dei dati
Perez guida un gruppo di tecnologi senior presso Intel incentrati sull’architettura di sicurezza attraverso un programma denominato Pathfinding. Perez lo descrive come “la ricerca di sfide interessanti che i nostri clienti devono affrontare”. Nel caso di Perez, l’obiettivo è sviluppare una pipeline di tecnologie di sicurezza per i clienti dei data center di Intel.
Intel ha iniziato il suo lavoro in quest’area prima che il termine “elaborazione riservata” diventasse di moda, con Perez che indicava il lancio dell’azienda di estensioni di protezione del software nel 2015. Gli SGX sono codici di sicurezza integrati direttamente nei processori Intel che creano enclave di memoria separate dove i dati potevano essere posizionato per limitare l’accesso. Questa idea di utilizzare hardware e software per proteggere i dati consentendo al tempo stesso di essere elaborati è al centro dell’informatica riservata.
Microsoft ha utilizzato questi processori Intel per il suo cloud Azure per abilitare il proprio servizio di elaborazione riservata . Il mese scorso, Intel ha annunciato che stava espandendo queste capacità in una nuova generazione della sua piattaforma scalabile Xeon .
“Il nostro approccio è stato quello di promuovere l’innovazione continua e una profonda collaborazione con i nostri partner tecnologici per migliorare la riservatezza e l’integrità di tutti i dati, ovunque si trovino”, ha affermato Perez.
Informatica riservata e intelligenza artificiale
I fautori dell’informatica riservata sostengono che porterà a una nuova ondata di innovazione nel cloud poiché le aziende si sentiranno più a proprio agio nel mettere online i loro dati più sensibili. Perez ha detto che aiuta a guidare l’intelligenza artificiale e l’apprendimento automatico in un paio di modi.
Il primo è indiretto. AI e ML sono progrediti negli ultimi anni, grazie ai crescenti set di dati disponibili per perfezionare gli algoritmi. L’informatica riservata, portando online ancora più dati e più ricchi, trarrà vantaggio da tale sviluppo.
“La connessione principale all’apprendimento automatico e all’intelligenza artificiale è il fatto che stiamo generando sempre più dati”, ha detto Perez. “Stiamo analizzando questi dati con varie tecnologie di machine learning. E quell’esplosione di dati è ciò che realmente guida l’interesse per il computing riservato, sia che venga utilizzato per l’apprendimento automatico o meno. L’apprendimento automatico è solo uno dei suoi usi principali “.
Indipendentemente dal tipo di dati sottostanti, se deve essere decrittografato per essere utilizzato, la sicurezza degli algoritmi attraverso i quali passa è fondamentale.
“Come proteggi questi algoritmi in questo spettro molto ampio di casi d’uso?” Perez ha detto. “Consideriamo il computing riservato come un cambio di paradigma per il cloud computing. I fornitori di infrastrutture stanno fornendo le funzionalità che consentono alle società cloud di fornire questi servizi come utilità e non devono assumersi la responsabilità della protezione dei dati stessi “.
Oltre a ciò, il computing riservato consente diversi tipi di collaborazione sui dati per guidare l’apprendimento automatico. Perez ha indicato l’esempio di un progetto sul tumore al cervello presso l’Università della Pennsylvania .
La Penn’s Perelman School of Medicine ha collaborato con altri 29 istituti di assistenza sanitaria e di ricerca in tutto il mondo, inclusi Regno Unito, Germania e India. Il gruppo sta utilizzando il computing riservato di Intel per sviluppare un approccio distribuito all’apprendimento automatico che consenta loro di condividere i dati dei pazienti, inclusa la diagnostica per immagini. Poiché tali dati possono rimanere crittografati mentre vengono utilizzati per l’apprendimento automatico, il gruppo può condividere in sicurezza tali dati e collaborare in un modo che altrimenti non sarebbe possibile.
Questo è fondamentale perché i dati sono urgentemente necessari per addestrare l’apprendimento automatico, ma nessuna singola istituzione ha abbastanza per raggiungere questo obiettivo da sola. In precedenza, Penn Medicine e Intel Labs hanno pubblicato uno studio che mostrava che l’apprendimento federato (un approccio collaborativo) poteva addestrare un modello di apprendimento automatico in modo molto più efficace rispetto al lavoro da soli. In questo caso, il gruppo ritiene che la combinazione di informatica riservata e apprendimento federato consentirà loro di compiere rapidi progressi nei modelli di intelligenza artificiale che identificano i tumori cerebrali.
I commercianti stanno anche sfruttando la capacità di consentire nuovi tipi di collaborazione per i dati dei clienti e dei partner , così come le imprese . Mentre analisti come Gartner ritengono che il reale impatto dell’informatica riservata potrebbe essere ancora lontano diversi anni, Perez ha affermato che sta già aiutando alcuni settori ad accelerare le loro capacità di intelligenza artificiale e apprendimento automatico a breve termine.
“Ci sono molti aspetti dello stack di elaborazione che devono essere protetti”, ha affermato Perez. “L’elaborazione riservata risolve problemi che non potevano essere risolti prima. Il concetto che posso utilizzare qualsiasi capacità di elaborazione che possa risiedere in qualsiasi paese del mondo e mantenere comunque la privacy e la riservatezza dei miei dati è piuttosto potente. “