OpenAI introduce la Modalità Blocco per limitare il rischio di esfiltrazione dei dati negli agenti AI

OpenAI ha annunciato la disponibilità di una nuova funzionalità di sicurezza denominata Modalità Blocco, progettata per ridurre il rischio di esfiltrazione di informazioni sensibili attraverso attacchi di prompt injection. La funzione è destinata sia agli utenti individuali sia alle organizzazioni che utilizzano ChatGPT per attività che coinvolgono dati riservati, documentazione interna, informazioni aziendali o contenuti soggetti a requisiti di conformità e sicurezza elevati.

La Modalità Blocco nasce per affrontare uno dei principali problemi emersi con la diffusione degli agenti AI connessi a Internet e a servizi esterni. Negli attacchi di prompt injection, istruzioni malevole vengono inserite all’interno di pagine web, documenti, file o altri contenuti elaborati dal modello. Questi comandi possono influenzare il comportamento dell’intelligenza artificiale inducendola a ignorare le istruzioni originali, modificare il proprio processo decisionale o tentare di trasferire informazioni verso destinazioni controllate da terzi.

L’obiettivo della nuova modalità non è impedire completamente la presenza di contenuti dannosi, ma ridurre in modo significativo la possibilità che tali contenuti riescano a provocare la fuoriuscita di dati sensibili. OpenAI evidenzia infatti che messaggi nascosti in documenti o contenuti web possono comunque influenzare la qualità delle risposte o il comportamento del modello, ma la Modalità Blocco introduce limitazioni operative che rendono più difficile l’esecuzione delle azioni necessarie per trasferire informazioni all’esterno.

Tra le modifiche più rilevanti figura la disattivazione della navigazione web in tempo reale. Quando la modalità è attiva, ChatGPT utilizza esclusivamente contenuti precedentemente memorizzati nella cache e non accede direttamente alle pagine web aggiornate. Questo approccio riduce la superficie di attacco associata a siti potenzialmente compromessi o contenenti istruzioni nascoste progettate per manipolare il modello durante la navigazione.

Anche le funzionalità legate all’elaborazione delle immagini vengono limitate. Il sistema non recupera automaticamente immagini dal web e non utilizza contenuti grafici provenienti da Internet nelle normali risposte. Rimangono invece disponibili il caricamento diretto di immagini da parte dell’utente e gli strumenti di generazione delle immagini, che continuano a funzionare normalmente all’interno dell’ambiente controllato della piattaforma.

La Modalità Blocco interviene inoltre sulle funzionalità più avanzate introdotte negli ultimi mesi. La Ricerca approfondita viene disabilitata, così come la Modalità agente che consente al sistema di eseguire attività in maniera autonoma. Anche l’ambiente Canvas viene sottoposto a restrizioni: il codice eseguito non può accedere alla rete e le funzioni di download dei file utilizzate nelle attività di analisi dei dati vengono bloccate. Rimane comunque possibile analizzare documenti e file caricati direttamente dagli utenti.

La nuova funzionalità introduce anche controlli più granulari attraverso sistemi di gestione delle autorizzazioni basati sui ruoli. Gli amministratori possono assegnare specifici utenti al profilo Modalità Blocco, definendo in maniera dettagliata le capacità operative disponibili e limitando l’accesso a funzioni considerate più esposte a rischi di sicurezza. Questo approccio permette di applicare criteri differenti a seconda delle mansioni e del livello di sensibilità dei dati trattati.

OpenAI sottolinea inoltre la necessità di prestare particolare attenzione all’utilizzo di applicazioni esterne e connettori integrati. Le operazioni di lettura e soprattutto di scrittura verso servizi terzi rappresentano uno dei principali vettori di rischio per l’esfiltrazione dei dati. Per questo motivo la società raccomanda un utilizzo prudente delle integrazioni esterne, evidenziando come i connettori in sola lettura e i sistemi basati sulla sincronizzazione controllata presentino generalmente un livello di rischio inferiore rispetto alle applicazioni che consentono modifiche o pubblicazione di contenuti all’esterno.

Con questa iniziativa OpenAI introduce un ulteriore livello di protezione pensato specificamente per l’era degli agenti AI autonomi, nella quale il problema della sicurezza non riguarda soltanto l’accesso ai dati, ma anche la capacità dei modelli di interagire con sistemi esterni senza esporre informazioni riservate o eseguire operazioni indesiderate in seguito a tentativi di manipolazione.

OpenAI introduce la Modalità Blocco per limitare il rischio di esfiltrazione dei dati negli agenti AI

DiFantasy

Di Fantasy

Articoli correlati

Anthropic lancia Claude Opus 5 per ridurre il costo dei carichi di lavoro AI complessi

Un’interruzione globale colpisce ChatGPT, le API OpenAI e Codex

Google estende Gemini Spark agli abbonati AI Pro negli Stati Uniti

Ultimi Post

Anthropic lancia Claude Opus 5 per ridurre il costo dei carichi di lavoro AI complessi

Un’interruzione globale colpisce ChatGPT, le API OpenAI e Codex

Google estende Gemini Spark agli abbonati AI Pro negli Stati Uniti

Kimi K3 resta indietro nei test di attacco informatico autonomo