Immagine AI

Negli ultimi mesi, il mondo dello sviluppo software sta vivendo una trasformazione silenziosa ma profonda, guidata dall’evoluzione degli agenti di intelligenza artificiale. L’annuncio di OpenAI sull’introduzione delle “Agent Skills” all’interno di Codex si inserisce perfettamente in questo contesto e segna un passaggio chiave: l’AI per la programmazione non viene più pensata come un assistente generico che risponde a prompt, ma come un insieme di competenze modulari, richiamabili e combinabili, progettate per eseguire flussi di lavoro complessi in modo affidabile.

OpenAI ha presentato questa nuova funzionalità come un miglioramento apparentemente piccolo, ma dal potenziale enorme. Tibault Sotio, responsabile di Codex, ha spiegato che le abilità possono essere richiamate direttamente nel codice digitando il simbolo “$” e sfruttando il completamento automatico. Dietro questa semplicità si nasconde un cambio di paradigma: invece di costringere il modello a ricostruire ogni volta tutti i passaggi necessari per svolgere un compito, una “abilità” consente di riconoscere e attivare un’intera sequenza di azioni come un’unica unità logica.

Una Codex Skill può includere istruzioni, materiali di riferimento e persino script opzionali, tutti racchiusi in un unico pacchetto. Questo permette all’agente di eseguire attività articolate, come la creazione e la gestione di repository o l’automazione di procedure ripetitive, con maggiore velocità e soprattutto con maggiore coerenza. Il modello non deve più “indovinare” ogni singolo passaggio, ma applica una competenza già definita, riducendo errori e ambiguità. Più competenze possono poi essere combinate tra loro, dando vita a flussi di lavoro sempre più sofisticati.

La funzionalità è stata testata internamente da inizio dicembre ed è diventata pubblica poco dopo il rilascio di GPT-5.2-Codex, confermando come Codex stia evolvendo verso una piattaforma sempre più agentica. Gli sviluppatori possono utilizzare competenze predefinite oppure crearne di personalizzate tramite prompt in linguaggio naturale o script, per poi condividerle all’interno dei team o con la community. In questo modo, la conoscenza operativa non resta più dispersa in documentazione o prompt ripetuti, ma diventa un asset riutilizzabile.

Dal punto di vista tecnico, le competenze di Codex sono disponibili sia nell’ambiente CLI sia come estensione per IDE. Ogni abilità è strutturata attorno a un file SKILL.md in formato Markdown e può includere risorse aggiuntive in base alle esigenze. Un aspetto particolarmente interessante è il meccanismo di “caricamento progressivo”: inizialmente viene caricata solo la descrizione dell’abilità, mentre il contenuto completo viene attivato solo quando necessario, in modo esplicito o implicito. Questo approccio migliora l’efficienza dell’uso del contesto e rende l’agente più leggero e reattivo.

La direzione intrapresa da OpenAI non è isolata. Già nell’ottobre scorso, Anthropic aveva introdotto un concetto analogo per il suo agente Claude, rilasciandolo poi come standard aperto e indipendente. Questo standard è stato rapidamente adottato da strumenti centrali per lo sviluppo come VS Code e GitHub di Microsoft, oltre che da agenti di programmazione emergenti come Cursor, Amp e OpenCode. Anche Amazon Web Services si è mossa nella stessa direzione, introducendo il concetto di “Powers” nel suo agente di codifica Kiro.

Questa convergenza indica chiaramente una tendenza di fondo: la modularizzazione delle capacità degli agenti sta diventando uno standard de facto. Invece di agenti monolitici, si va verso sistemi composti da blocchi funzionali specializzati, caricabili solo quando servono e combinabili dinamicamente. Il risultato è un’AI più prevedibile, più controllabile e più adatta a essere integrata nei processi di sviluppo professionali.

In questo scenario si inseriscono anche le indiscrezioni su un possibile passo successivo: l’estensione del concetto di abilità a ChatGPT. Secondo quanto emerso, OpenAI starebbe lavorando a un progetto interno con nome in codice “Hazelnut”, che punta ad abbandonare l’attuale architettura fortemente centrata sui GPT personalizzati in favore di un sistema modulare basato su competenze e flussi di lavoro indipendenti. Le abilità verrebbero caricate solo quando necessarie, potrebbero essere combinate automaticamente e includere codice eseguibile, migliorando l’affidabilità delle attività che richiedono logica e sequenze operative precise.

Se questo approccio verrà confermato, le competenze di ChatGPT potrebbero includere comandi slash, un editor dedicato e la possibilità di convertire con un clic i GPT personalizzati esistenti in vere e proprie skill. Sarebbe un cambiamento significativo, perché sposterebbe l’attenzione dalla personalizzazione del modello alla costruzione di capacità operative riutilizzabili, avvicinando ChatGPT a una piattaforma di orchestrazione intelligente più che a un semplice chatbot avanzato.

Le dichiarazioni di Sotio, secondo cui a gennaio verranno presentate diverse nuove funzionalità, alimentano ulteriormente le aspettative. Se le Agent Skills diventeranno davvero uno standard trasversale, potremmo assistere a una nuova fase dell’AI per lo sviluppo software, in cui l’efficienza non dipende solo dalla potenza del modello, ma dalla qualità e dalla composizione delle competenze che è in grado di attivare. In questo contesto, l’intelligenza artificiale smette di essere solo un supporto alla scrittura di codice e diventa un vero partner operativo, capace di eseguire flussi di lavoro complessi con affidabilità crescente.

Di Fantasy