Immagine AI

La sospensione dell’accesso estero ai modelli Claude Fable 5 e Claude Mythos 5 di Anthropic nasce da una valutazione di sicurezza legata alle capacità dei modelli frontier in ambito cybersecurity. Il provvedimento del governo statunitense ha imposto il blocco dell’utilizzo da parte di utenti stranieri, con effetti non solo sui clienti internazionali, ma anche sui ricercatori non statunitensi della stessa Anthropic coinvolti nello sviluppo e nel test dei sistemi più avanzati dell’azienda.

Il punto tecnico centrale riguarda Claude Fable 5, il modello lanciato da Anthropic come versione ad alte prestazioni derivata dalla classe Mythos, ma destinata a un uso più ampio grazie a livelli di sicurezza e classificazione aggiuntivi. Secondo la ricostruzione emersa, ricercatori di Amazon avrebbero individuato una sequenza di prompt capace di portare Fable 5 a produrre informazioni utilizzabili in scenari di attacco informatico. Il problema non riguarderebbe soltanto la capacità di individuare vulnerabilità software, attività che anche strumenti tradizionali e altri modelli AI possono svolgere, ma la possibile trasformazione di tali informazioni in codice exploit, cioè in istruzioni operative potenzialmente impiegabili per compromettere sistemi reali.

La segnalazione ha avuto un peso particolare perché Amazon non è un osservatore esterno rispetto all’ecosistema Anthropic. AWS è uno dei canali infrastrutturali e commerciali principali per l’accesso ai modelli Claude, anche tramite Amazon Bedrock, e Amazon è anche un investitore strategico di Anthropic. Il caso evidenzia quindi una dinamica complessa: un partner cloud e finanziario può allo stesso tempo contribuire alla distribuzione di un modello frontier e segnalare alle autorità rischi tecnici ritenuti rilevanti per la sicurezza nazionale.

Dopo la comunicazione di Amazon, le autorità statunitensi hanno valutato il rischio come una questione di controllo sull’accesso ai modelli più avanzati. La misura scelta non è stata una semplice limitazione funzionale o un aggiornamento dei filtri di sicurezza, ma un blocco dell’accesso da parte di soggetti stranieri. Per Anthropic, questo ha comportato la necessità di disabilitare l’accesso a Fable 5 e Mythos 5 in modo ampio, perché distinguere in tempo reale gli utenti in base alla cittadinanza, soprattutto in ambienti enterprise e di ricerca distribuiti, è tecnicamente e operativamente complesso.

Anthropic ha contestato l’interpretazione più allarmistica del problema. L’azienda sostiene che le vulnerabilità indicate non rappresentino necessariamente un jailbreak del modello e che bug di livello analogo possano essere identificati anche con altri sistemi disponibili pubblicamente. La distinzione è importante: un modello che, sotto condizioni specifiche, contribuisce all’analisi di vulnerabilità non equivale automaticamente a un modello privo di barriere di sicurezza. Il nodo è capire se le salvaguardie siano state aggirate in modo sistematico oppure se il modello abbia prodotto contenuti di cybersecurity entro una zona grigia già presente in molti strumenti avanzati di analisi del codice.

La vicenda mette in evidenza un problema più ampio nella governance dei modelli frontier: le capacità di coding, reverse engineering, vulnerability discovery e generazione di exploit stanno diventando criteri centrali nelle valutazioni di sicurezza. I modelli di ultima generazione non vengono più misurati soltanto su benchmark linguistici, ragionamento o produttività software, ma anche sulla loro capacità di automatizzare fasi tecniche che, in mani ostili, possono accelerare operazioni offensive. Per questo l’accesso ai modelli più potenti inizia a essere trattato in modo simile all’accesso a tecnologie strategiche soggette a controllo.

Il blocco di Claude Fable 5 e Claude Mythos 5 apre anche una questione industriale. Le aziende che integrano modelli AI avanzati in pipeline di sviluppo, sicurezza, analisi dati o automazione documentale dipendono dalla stabilità dell’accesso API e dalla continuità dei servizi cloud. Una sospensione improvvisa può interrompere workflow aziendali, test di prodotto, attività di ricerca e integrazioni già avviate. Per i clienti enterprise, il rischio non è solo la perdita temporanea di un modello, ma l’incertezza regolatoria attorno a piattaforme considerate infrastrutture operative.

Il caso mostra che la sicurezza dei modelli non può essere valutata solo a livello di output finale. Servono procedure di red teaming, controlli sui prompt, classificatori di contenuto, tracciamento degli usi ad alto rischio, ambienti sandbox per l’esecuzione di codice e policy di accesso coerenti con i diversi profili di rischio. Ma serve anche una definizione più precisa di ciò che costituisce un comportamento pericoloso: la scoperta di una vulnerabilità, la spiegazione teorica di un bug, la generazione di proof-of-concept e la produzione di exploit immediatamente utilizzabili non hanno lo stesso livello di rischio.

Il caso Fable 5 e Mythos 5 diventa così un precedente per l’intero settore dell’intelligenza artificiale. I modelli frontier non sono più soltanto prodotti software ad alte prestazioni, ma tecnologie sottoposte a valutazioni geopolitiche, industriali e di sicurezza nazionale. La loro distribuzione internazionale dipenderà sempre più dalla capacità dei fornitori di dimostrare controlli tecnici verificabili, limiti di utilizzo affidabili e procedure trasparenti per la gestione dei rischi cyber.

Di Fantasy