Immagine AI

Nel corso di un recente intervento nel podcast di Y Combinator, Boris Cherny, responsabile engineering di Anthropic, ha raccontato in modo dettagliato la genesi di “Claude Code”, una funzionalità inizialmente sperimentale nata per uso interno e divenuta rapidamente uno degli strumenti più centrali nella produttività dell’azienda. Il racconto non si limita a descrivere un semplice tool di supporto allo sviluppo, ma offre uno spaccato tecnico e culturale su come l’evoluzione dei modelli linguistici stia modificando radicalmente il lavoro degli ingegneri del software, fino a mettere in discussione la stessa definizione del ruolo.

Claude Code nasce in modo quasi accidentale. Cherny ha spiegato di aver inizialmente costruito una semplice applicazione di chat in stile terminale per comprendere meglio il funzionamento dell’API di Claude. L’obiettivo non era creare un nuovo ambiente di sviluppo, ma apprendere sperimentalmente le possibilità offerte dal modello. Con l’introduzione della funzione “Use Tools”, che consente al modello di invocare strumenti esterni, il progetto ha iniziato ad assumere una dimensione più ambiziosa. Senza un piano prestabilito, Cherny ha iniziato ad aggiungere capacità operative, esplorando in modo incrementale il potenziale dell’interazione tra modello e strumenti.

Il momento che, secondo il suo racconto, ha rappresentato una svolta emotiva e concettuale è avvenuto durante un test apparentemente banale. Alla domanda “Che musica stai ascoltando in questo momento?”, il modello non si è limitato a generare una risposta testuale ipotetica, ma ha prodotto uno script Apple in grado di interrogare il lettore musicale del Mac. In quel momento, Cherny ha percepito per la prima volta ciò che ha descritto come una sensazione di “AGI emergente”: non tanto perché il sistema avesse sviluppato una coscienza, ma perché aveva mostrato un comportamento orientato all’azione, scegliendo autonomamente di utilizzare uno strumento per ottenere un’informazione reale. Dal punto di vista tecnico, questo episodio rappresenta un passaggio fondamentale: il modello non è più solo un generatore di testo, ma un agente in grado di orchestrare strumenti software esterni.

La scelta di mantenere un’interfaccia in stile terminale, invece di sviluppare un IDE completo, è stata dettata da vincoli pragmatici. In fase iniziale, gli unici utenti erano sviluppatori interni e non vi era l’esigenza di costruire un’interfaccia grafica complessa. Tuttavia, questa decisione si è rivelata strategica. Il terminale ha ridotto l’attrito, eliminato la necessità di progettare una UI tradizionale e permesso un’iterazione rapidissima. Nonostante l’apparente semplicità, l’applicazione è stata realizzata con tecnologie web moderne, inclusa un’architettura basata su React, dimostrando come il confine tra applicazioni web e ambienti terminali sia ormai sfumato. Anche dettagli apparentemente marginali, come lo spinner di caricamento, sono stati sottoposti a decine di revisioni, segno di una cultura progettuale orientata all’esperienza utente anche in contesti tecnici.

L’adozione interna è stata immediata e sorprendente. Il giorno successivo al rilascio del prototipo, Cherny ha osservato colleghi già intenti a utilizzarlo attivamente. L’utilizzo è cresciuto a tal punto che il CEO Dario Amodei gli ha chiesto se avesse imposto l’uso dello strumento. In realtà, Claude Code era stato semplicemente condiviso in un thread Slack interno. Questo tipo di diffusione organica è indicativo di un reale valore percepito dagli sviluppatori, non di un’imposizione top-down.

I dati interni riportati indicano un aumento della produttività per sviluppatore nell’ordine del 150%. Si tratta di una cifra straordinaria se confrontata con la produttività incrementale tipica delle grandi organizzazioni tecnologiche tradizionali, dove miglioramenti del 2% annuo possono richiedere centinaia di persone dedicate all’ottimizzazione dei processi. Dal punto di vista metodologico, questo suggerisce che l’integrazione nativa di modelli LLM avanzati all’interno del ciclo di sviluppo non produce semplici ottimizzazioni marginali, ma ridefinisce l’intero flusso di lavoro.

Cherny ha inoltre dichiarato di non utilizzare più un IDE tradizionale, programmando esclusivamente attraverso Claude Code e il modello Opus 4.5, arrivando a gestire circa venti pull request al giorno. Questo dato non indica soltanto una maggiore velocità di scrittura del codice, ma una trasformazione nel ruolo dell’ingegnere, che diventa orchestratore e revisore di output generati dal modello. In questo scenario, la scrittura manuale del codice perde centralità rispetto alla capacità di definire obiettivi, verificare risultati e interagire con utenti e stakeholder.

Secondo questa visione, il titolo stesso di “ingegnere del software” potrebbe diventare obsoleto, sostituito da figure ibride come “builder” o product manager tecnico. Gli ingegneri tenderebbero a diventare generalisti ad alta capacità di coordinamento, con competenze trasversali che spaziano dalla progettazione alla comunicazione con gli utenti. All’interno di Anthropic, Cherny afferma che già oggi non solo sviluppatori, ma anche PM, designer, engineering manager e perfino responsabili finanziari scrivono codice grazie al supporto del modello. Questo prefigura un’era in cui la programmazione diventa una competenza diffusa, mediata dall’intelligenza artificiale.

Uno degli aspetti più rilevanti della sua analisi riguarda la strategia di sviluppo dei prodotti basati su LLM. Cherny invita a non progettare per il modello attuale, ma per quello che sarà disponibile tra sei mesi. La velocità di miglioramento delle prestazioni segue una traiettoria esponenziale e, in questo contesto, costruire complesse “impalcature” per compensare le carenze temporanee di un modello può rivelarsi inefficiente. Strutture di orchestrazione, pipeline di controllo o sistemi di regole aggiuntive potrebbero diventare obsolete nel giro di pochi mesi, quando la generazione successiva del modello raggiungerà autonomamente il livello di performance desiderato.

Questa filosofia richiama direttamente il celebre saggio “The Bitter Lesson” di Richard Sutton, figura chiave nello sviluppo del reinforcement learning. Sutton sosteneva che, storicamente, i maggiori progressi dell’intelligenza artificiale non derivano dall’iniezione di conoscenze specifiche o regole progettate manualmente, ma dall’applicazione massiva di calcolo e algoritmi generali. Gli approcci che tentano di incorporare troppa ingegneria umana tendono a essere superati, nel lungo periodo, da sistemi che scalano con dati e potenza computazionale. Cherny afferma che questa lezione è profondamente radicata nella cultura di Anthropic: non scommettere mai contro il modello.

In termini tecnici e industriali, ciò implica una strategia fortemente orientata alla scalabilità del core model, piuttosto che alla costruzione di sistemi complessi di compensazione. Se la traiettoria esponenziale continuerà, anche funzionalità attualmente considerate indispensabili, come modalità di pianificazione esplicita prima della generazione del codice, potrebbero diventare superflue man mano che i modelli acquisiscono capacità di ragionamento e strutturazione interna sempre più sofisticata.

Di Fantasy