Quando pensiamo all’intelligenza artificiale, spesso la immaginiamo come uno strumento che risponde a comandi brevi — “scrivi un’e-mail”, “riassumi questo documento”, “traduce questo testo”. Ma ecco una novità che sposta l’asticella: Anthropic ha appena presentato Claude Sonnet 4.5, un modello AI capace di mantenere la concentrazione su compiti di codifica complessi per oltre 30 ore.
Il punto che davvero colpisce è questo: Claude Sonnet 4.5 non è solo più “intelligente” nei singoli blocchi di codice, ma sembra poter lavorare in modo continuativo, affrontando compiti articolati, senza perdere il filo nemmeno dopo decine di ore. È come se potessimo integrarlo come “membro del team”, capace di fasi lunghe di lavoro autogestito.
Anthropic afferma che il modello ha ottenuto un punteggio del 77,2% nel benchmark SWE-bench Verified (e fino all’82% con calcolo in parallelo) — un risultato “state of the art” nel mondo della generazione automatica di software. In benchmark più pratici, come OSWorld (che misura interazioni reali con software), Claude Sonnet 4.5 ottiene un risultato del 61,4%, un salto enorme rispetto alla versione precedente Sonnet 4 (42,2%).
In pratica, il modello non si limita a generare uno snippet isolato: può occuparsi dell’“orchestrazione” del codice — raccordare moduli, mantenere coerenza di stile, gestire dipendenze — e farlo con continuità.
Naturalmente, l’arrivo di Claude Sonnet 4.5 non avviene in un vuoto competitivo. OpenAI ha recentemente lanciato GPT-5, e le due aziende stanno affrontandosi per conquistare il mercato enterprise della generazione di software.
Anthropic afferma di detenere il 42% del mercato della generazione di codice automatico, più del doppio rispetto a OpenAI (che si fermerebbe al 21%). È un dato che colpisce, soprattutto considerando che gran parte delle entrate di Anthropic proviene da due partner — Cursor e GitHub Copilot. Quello che sembra un vantaggio competitivo è anche un rischio: la dipendenza da pochi clienti può diventare un tallone d’Achille.
In termini di costi, però, Claude Sonnet 4.5 rischia di perdere punti. Il modello ha lo stesso prezzo di Sonnet 4 (3 $ per milione di token in input e 15 $ per milione in output), ma GPT-5 sta adottando una strategia molto aggressiva sui prezzi, offrendo prestazioni comparabili a un costo molto inferiore in certi scenari.
Se le aziende cominceranno a dare più peso al costo che all’ultimo decimale di performance, il vantaggio di Anthropic potrebbe attenuarsi.
Un aspetto che Anthropic tiene in grande evidenza è l’allineamento del modello — cioè il modo in cui Claude Sonnet 4.5 evita comportamenti indesiderati (ad esempio risposte fuorvianti, tentativi di manipolazione, risposte “leccapiedi”) e le contromisure contro attacchi come le “prompt injection.”
Il modello viene rilasciato sotto quella che Anthropic chiama “AI Safety Level 3” (ASL-3), che prevede classifier e filtri per rilevare input e output potenzialmente pericolosi (in ambiti quali armi nucleari, chimiche o biologiche). Secondo la società, i falsi positivi — cioè le volte in cui contenuti innocui vengono scartati — sono stati ridotti di un fattore di 10 rispetto alle versioni precedenti.
Un’altra mossa strategica: il rilascio del Claude Agent SDK, lo stesso “motore” che alimenta Claude Code. In questo modo, gli sviluppatori aziendali possono costruire sopra infrastrutture personalizzate sfruttando le potenzialità del modello.
L’arrivo di Sonnet 4.5 coincide con l’accelerazione dell’espansione internazionale di Anthropic. L’azienda punta a triplicare il proprio organico internazionale e a moltiplicare per cinque il team di applied AI nel 2025, spinta anche dal fatto che circa l’80% dell’utilizzo di Claude proviene da utenti fuori dagli Stati Uniti.
Ma non tutto è “rosa e fiori”: in parallelo, Anthropic ha dovuto affrontare una causa per copyright con autori e editori, accettando un accordo da 1,5 miliardi di dollari per aver presumibilmente usato i loro libri per addestrare i suoi modelli. Il pagamento prevede, fra le altre cose, una compensazione fissa di 3.000 $ per pubblicazione inclusa nella causa.
Sul piano dell’industria, quello che sta emergendo è una competizione sempre più feroce: non più fra “AI conversazionali” e “AI specializzate”, ma fra sistemi che devono dimostrare di poter lavorare con continuità, affidabilità e sotto vincoli reali di produzione.
Ciò che Claude Sonnet 4.5 mette sul tavolo non è solo una sfida tecnica, ma una provocazione: possiamo considerare le AI non più come semplici assistenti puntuali, ma come co-lavoratori intelligenti, in grado di partecipare a progetti che si articolano su giorni o addirittura settimane? Se la risposta è sì, il mestiere del programmatore — e più in generale quello di chi progetta sistemi complessi — potrebbe trasformarsi profondamente: più supervisione, più orchestrazione, meno “digitazione da zero”.
In ogni caso, Sonnet 4.5 spalanca prospettive ambiziose: se davvero un modello può “pensare” per 30 ore su un codice con pochi interventi, il confine fra umano e macchina, almeno in certi ambiti tecnici, si fa sempre più sottile.