Immagine AI

OpenAI ha introdotto un aggiornamento significativo di Codex, il proprio agente AI dedicato alla programmazione, ampliando le capacità di comprensione contestuale, automazione autonoma e controllo operativo all’interno dell’ambiente desktop. L’obiettivo è trasformare Codex da semplice assistente di coding a sistema capace di gestire flussi di lavoro software completi e persistenti nel tempo.

La novità principale è “AppShots”, funzione disponibile nell’app Codex per macOS che permette di allegare istantaneamente la finestra dell’applicazione attiva a una conversazione AI tramite una scorciatoia da tastiera. A differenza di un normale screenshot, il sistema acquisisce anche testo, elementi contestuali e informazioni operative presenti nell’interfaccia, consentendo al modello di comprendere lo stato reale del lavoro senza necessità di spiegazioni manuali o copia-incolla.

Dal punto di vista tecnico, AppShots introduce un livello di context sharing molto più profondo rispetto ai tradizionali sistemi multimodali. Codex non interpreta soltanto immagini statiche, ma costruisce una rappresentazione operativa dell’ambiente software corrente, permettendo continuità nelle attività di sviluppo e debugging direttamente a partire dal contesto applicativo reale.

L’aggiornamento rafforza inoltre la funzione “/goal”, ora integrata stabilmente nell’ecosistema Codex dopo la fase sperimentale. La funzione consente agli utenti di assegnare obiettivi ad alto livello all’agente AI, che può poi continuare autonomamente il lavoro per periodi prolungati, anche per ore o giorni. Codex è in grado di eseguire task iterativi complessi come implementazione di funzionalità, correzione bug, esecuzione di test e verifiche intermedie, mantenendo uno stato persistente dell’attività e richiedendo interventi umani solo quando necessario.

Il sistema introduce quindi un paradigma sempre più vicino agli agenti software autonomi. L’utente non definisce più singole istruzioni operative, ma obiettivi finali, lasciando all’AI la gestione dell’esecuzione progressiva, delle revisioni e dei controlli intermedi.

OpenAI ha inoltre potenziato la modalità browser-based con una nuova “Advanced Annotation Mode”. Gli utenti possono modificare direttamente elementi dell’interfaccia web, come font, colori, spaziature o layout, visualizzando immediatamente le variazioni. Questo approccio consente a Codex di interpretare con maggiore precisione le intenzioni progettuali dell’utente durante le attività di design e frontend development.

Anche le funzionalità di estrazione dati web sono state migliorate. Codex può scaricare e analizzare immagini presenti nelle pagine più rapidamente e utilizzare sandbox JavaScript in sola lettura per estrarre dati strutturati in modo più efficiente, riducendo i rischi legati all’esecuzione diretta di codice esterno.

Per le aziende, OpenAI ha introdotto nuove capacità collaborative e amministrative. I team possono condividere plugin personalizzati, server MCP e integrazioni interne, creando ambienti di sviluppo AI condivisi a livello organizzativo. Parallelamente sono stati aggiunti strumenti di analytics che permettono agli amministratori di monitorare utenti attivi, consumo token, crediti utilizzati, volume di codice generato e utilizzo dei plugin, con possibilità di integrazione tramite API esterne.

Una delle funzioni più discusse dell’aggiornamento è “Locked Usage”. Quando abilitata, Codex può continuare a utilizzare applicazioni e svolgere attività anche con il MacBook chiuso. Il sistema sfrutta autorizzazioni avanzate di screen recording e accessibilità per eseguire operazioni come clic, inserimento dati, navigazione menu e gestione clipboard all’interno delle applicazioni autorizzate dall’utente.

Questa modalità riflette una tendenza crescente nella Silicon Valley verso agenti AI persistenti che continuano a operare in background come veri collaboratori software autonomi. OpenAI ha precisato che la funzione opera esclusivamente all’interno dell’ambiente controllato di Codex e include misure di sicurezza come timeout di autenticazione, rilevamento di input locali e necessità di sblocco manuale.

L’aggiornamento mostra chiaramente l’evoluzione del mercato AI coding verso sistemi sempre più agentici, persistenti e integrati direttamente nei workflow operativi degli sviluppatori, con livelli di autonomia che iniziano a superare il modello tradizionale dell’assistente conversazionale.

Di Fantasy