Anthropic cita i rischi dell’AI otto volte più spesso di OpenAI nelle comunicazioni del 2026

Un’analisi delle comunicazioni pubbliche diffuse nel 2026 da Anthropic e dal suo amministratore delegato Dario Amodei rileva una presenza molto più alta di termini legati a rischio, regolazione e restrizioni rispetto ai materiali equivalenti di OpenAI e Sam Altman. Secondo l’elaborazione pubblicata dal Financial Times, nelle comunicazioni di Anthropic compaiono in media cinque riferimenti a questi temi ogni mille parole, contro 0,6 riferimenti ogni mille parole per OpenAI: una frequenza superiore di oltre otto volte.

Il confronto non riguarda soltanto la parola “risk”. Nei materiali analizzati, Anthropic ha utilizzato nel 2026 il termine “risk” 336 volte, “safeguard” 121 volte e “vulnerability” 128 volte. Nelle comunicazioni di OpenAI, gli stessi termini compaiono rispettivamente 30, 33 e 10 volte. Il dato descrive una differenza strutturale nel linguaggio pubblico delle due aziende: Anthropic presenta la sicurezza come elemento ricorrente nella comunicazione di prodotto, nella ricerca e nel rapporto con le istituzioni, mentre OpenAI utilizza con minore frequenza lessico associato a pericoli, vulnerabilità e limitazioni.

La posizione di Anthropic non nasce dalle discussioni più recenti sui modelli di frontiera. L’azienda ha costruito fin dalla fondazione una parte rilevante della propria attività su ricerca di alignment, interpretabilità e valutazione dei rischi connessi a modelli sempre più capaci. I suoi team lavorano su sistemi destinati a individuare comportamenti indesiderati, testare la resistenza ai jailbreak, valutare la capacità dei modelli di assistere attività cyber offensive e definire soglie operative oltre le quali introdurre controlli aggiuntivi.

Questo approccio è formalizzato nell’Anthropic Responsible Scaling Policy, il quadro interno che collega il livello di capacità dei modelli a requisiti progressivi di sicurezza. Il sistema prevede valutazioni prima e dopo il rilascio, misure tecniche contro uso improprio e furto dei pesi del modello, controlli sulle capacità potenzialmente pericolose e condizioni che possono limitare sviluppo o distribuzione di versioni più avanzate. L’obiettivo dichiarato non è trattare ogni modello come un rischio indistinto, ma associare salvaguardie specifiche a capacità verificabili, in particolare nei domini cyber, biologico e dell’autonomia operativa.

Nel 2026 Dario Amodei ha ulteriormente sviluppato questa impostazione nel saggio “The Adolescence of Technology”, dedicato agli effetti sociali e geopolitici dell’AI avanzata. Il testo identifica aree di rischio che includono uso della tecnologia per attività biologiche dannose, cyber attacchi, concentrazione del potere, sistemi di sorveglianza autoritaria, trasformazioni rapide del lavoro e perdita di controllo su modelli altamente autonomi. La tesi di Anthropic è che la crescita delle capacità dei modelli richieda meccanismi istituzionali e tecnici preparati prima che le applicazioni più critiche diventino di uso comune.

Il linguaggio della sicurezza è diventato anche un elemento competitivo. Anthropic commercializza Claude come sistema progettato con una forte enfasi su affidabilità, protezione dei dati aziendali, controllo dell’uso e riduzione dei comportamenti dannosi. Questo posizionamento è rilevante per clienti enterprise e pubbliche amministrazioni che devono valutare non soltanto qualità delle risposte e costo dei modelli, ma anche logging, autorizzazioni, protezione delle informazioni, gestione dei tool, auditabilità e possibilità di configurare policy interne.

L’intensità della comunicazione sui rischi ha però alimentato anche critiche. Yann LeCun ha contestato pubblicamente il linguaggio adottato da Anthropic, sostenendo che una narrazione troppo orientata ai pericoli possa contribuire a giustificare interventi normativi o restrizioni eccessive. La discussione è diventata più visibile dopo le misure statunitensi che hanno limitato l’accesso internazionale ai modelli Anthropic Mythos e Fable, adottate sulla base di preoccupazioni relative a possibili utilizzi da parte di soggetti stranieri e a vulnerabilità aggirabili tramite jailbreak.

Il dato quantitativo non stabilisce se Anthropic descriva rischi più concreti rispetto ai concorrenti o se scelga semplicemente una strategia comunicativa diversa. Mostra però che l’azienda utilizza con continuità un lessico tecnico-politico incentrato su rischio, safeguard, vulnerabilità e regolazione, integrandolo nella propria identità pubblica e nel modo in cui presenta Claude, la ricerca sull’allineamento e le regole per la distribuzione dei modelli avanzati.

Anthropic cita i rischi dell’AI otto volte più spesso di OpenAI nelle comunicazioni del 2026

DiFantasy

Di Fantasy

Articoli correlati

Anthropic sospende le nuove regole di fatturazione per Claude Agent SDK

Claude Opus 4.7 controlla un robot quadrupede fino a 37 volte più velocemente dei team umani

NVIDIA presenta SpatialClaw, un framework che usa il codice per migliorare il ragionamento spaziale dei modelli AI

Ultimi Post

Anthropic sospende le nuove regole di fatturazione per Claude Agent SDK

Claude Opus 4.7 controlla un robot quadrupede fino a 37 volte più velocemente dei team umani

NVIDIA presenta SpatialClaw, un framework che usa il codice per migliorare il ragionamento spaziale dei modelli AI

Apple valuta aumenti di prezzo per iPhone mentre crescono i costi delle memorie per AI